neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

当AI与数学同时走下神坛

当AI与数学同时走下神坛

当AI与数学同时走下神坛

2024年4月13日,一场特别的考试开考。


数万名分散在全球各地的数学高手,在这一天早上8点打开了阿里巴巴全球数学竞赛预赛的试卷,他们有48小时,来攻克20分的选择题和100分的解答题。过去的6届,天才们在这个赛事里亮相,有17岁拿下IMO满分金牌的北大神童,有对数学像强迫症一般执着的博士,也有4岁就接触微积分的渐冻症少年。

15 0 2025-09-04
AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

大型语言模型(LLM)最近在各种数学benchmark上疯狂刷分,动辄90%以上的正确率,搞得好像要统治数学界一样。然而,Epoch AI看不下去了,联手60多位顶尖数学家,憋了个大招——FrontierMath,一个专治LLM各种不服的全新数学推理测试!结果惨不忍睹,LLM集体“翻车”,正确率竟然不到2%!

17 0 2025-09-02