neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Zerox – 开源的OCR工具,零样本识别多种格式文件

Zerox – 开源的OCR工具,零样本识别多种格式文件

Zerox是开源的本地化高精度OCR工具,基于GPT-4o-mini模型,无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件,擅长处理扫描版文档及复杂布局文件,如含表格、图表等。Zerox工作流程是将文件转换为图像后进行OCR识别,最终输出Markdown格式文档,方便用户编辑和使用。
17 0 2025-08-31
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别

Surya – 开源的OCR工具包,支持90+语言、布局分析等识别

Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。
19 0 2025-08-31