neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

RAG-baidu09Anything – 港大开源的多模态RAG系统

RAG-baidu09Anything – 港大开源的多模态RAG系统

RAG-Anything是香港大学数据智能实验室推出的开源多模态RAG系统。系统支持处理包含文本、图像、表格和公式的复杂文档,提供从文档摄取到智能查询的端到端解决方案。系统基于多模态知识图谱、灵活的解析架构和混合检索机制,显著提升复杂文档处理能力,支持多种文档格式,如PDF、Office文档、图像和文本文件等。
22 0 2025-08-30
Aria-baidu09UI – 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

Aria-baidu09UI – 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型

Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面(GUI)定位任务设计的大型多模态模型。基于纯视觉方法,不依赖于HTML或AXTree等辅助输入,用大规模、多样化的数据合成流程,从Common Crawl和公开数据中生成高质量的元素描述和指令样本,适应不同环境下的多样化指令。
24 0 2025-08-28