
陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀
陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀
数学历来是一门孤独的科学。
1986 年,安德鲁·怀尔斯(Andrew Wiles)为了证明费马大定理,遁入书斋长达七年之久。
16
0
2025-09-05

陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀
数学历来是一门孤独的科学。
1986 年,安德鲁·怀尔斯(Andrew Wiles)为了证明费马大定理,遁入书斋长达七年之久。

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
数学为评估复杂推理提供了一个独特而合适的测试平台。它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明,这些证明必须缜密地筹划和执行。同时,数学还允许对结果进行客观验证。
在铺天盖地的宣传中,LLM看起来已经攻破了数学大关。但果真如此吗?