
突破分辨率极限,字节联合中科大提出多模态文档大模型
突破分辨率极限,字节联合中科大提出多模态文档大模型
现在连文档都有大模型了,还是高分辨率、多模态的那种!
不仅能准确识别出图像里的信息,还能结合用户需求调用自己的知识库来回答问题。
比如,看到图中马里奥的界面,直接就回答出了这是任天堂公司的作品。

20
0
2025-09-03

突破分辨率极限,字节联合中科大提出多模态文档大模型
现在连文档都有大模型了,还是高分辨率、多模态的那种!
不仅能准确识别出图像里的信息,还能结合用户需求调用自己的知识库来回答问题。
比如,看到图中马里奥的界面,直接就回答出了这是任天堂公司的作品。
