
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
多模态大语言模型(MLLM)在具身智能和自动驾驶“端到端”方案中的应用日益增多,但它们真的准备好理解复杂的物理世界了吗?
上海交通大学联合中国地质大学、南洋理工大学、智源研究院以及斯坦福大学的研究团队推出首个多模态大模型(MLLM)时空智能评测基准STI-Bench
(Spatial-Temporal Intelligence Benchmark),向当前最先进的多模态大语言模型发起了关于精确空间时间理解的严峻挑战。
23
0
2025-09-02