
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
还有12款大模型全军覆没……
一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了!
而且无论是GPT-4还是Claude 3,面对它都如同被夺了魂,无法给出正确答案。
18
0
2025-09-02