
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
多模态大模型几何解题哪家强?
首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了!
GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。
其背后团队来自淘天集团算法技术-未来生活实验室团队。
13
0
2025-09-03
