neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

TEN Agent – 开源的实时多模态 AI 代理框架

TEN Agent – 开源的实时多模态 AI 代理框架

TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agent能实现语音、文本、图像的多模态交互,支持高性能的实时通信,具备低延迟的音视频交互能力。TEN Agent支持多语言和跨平台操作,支持开发者基于模块化设计轻松扩展功能,如集成视觉识别和RAG能力。
19 0 2025-08-31
Onit – 开源的 Mac 桌面 AI 聊天助手

Onit – 开源的 Mac 桌面 AI 聊天助手

Onit是为Mac设计的AI聊天助手,支持停靠在任何应用程序中。Onit支持高亮文本自动加载,用户只需选择文本,Onit能自动作为上下文打开,无需复制粘贴。
19 0 2025-08-30
GOT-baidu09OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出

GOT-baidu09OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出

GOT-OCR 2.0是一种先进的光学字符识别(OCR)模型,推动OCR技术进入2.0时代。GOT-OCR 2.0端到端的模型由高压缩编码器和长上下文解码器组成,能处理包括文本、数学公式、分子式、图表、乐谱和几何图形在内的多种光学字符。GOT-OCR 2.0支持多种语言,尤其是中文和英文,能输出多种格式化结果,如Markdown和LaTeX。
24 0 2025-08-29