neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

GOT-baidu09OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出

GOT-baidu09OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出

GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到端的模型由高压缩编码器和长上下文解码器组成,能处理包括文本、数学公式、分子式、图表、乐谱和几何图形在内的多种光学字符。GOT-OCR 2.0支持多种语言,尤其是中文和英文,能输出多种格式化结果,如Markdown和LaTeX。
24 0 2025-08-29