neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。


近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三大领域。

16 0 2025-09-03