
Docmatix – 为文档视觉问答设计的超大开源数据集
Docmatix 是一个用于文档视觉问答(Document Visual Question Answering,简称 DocVQA)任务设计的大规模数据集。它包含了240万张图像和950万个问题答案对,数据源自130万个PDF文档。
25
0
2025-08-28