neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

LLaMA-baidu09Omni – 中科院推出的低延迟高质量的语音交互模型

LLaMA-baidu09Omni – 中科院推出的低延迟高质量的语音交互模型

LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构,用于实现与大型语言模型(LLM)的低延迟、高质量语音交互。通过集成预训练的语音编码器、语音适配器、大型语言模型(LLM)和一个实时语音解码器,直接从语音指令中快速生成文本和语音响应,省略传统的必须先将语音转录为文本的步骤,提高了响应速度。
23 0 2025-08-29
FlexRAG – 中科院推出的高性能多模态 RAG 框架

FlexRAG – 中科院推出的高性能多模态 RAG 框架

FlexRAG 是创新的检索增强生成(RAG)框架,解决传统 RAG 系统在处理长上下文时面临的计算成本高和生成质量不足的问题。通过将检索到的上下文信息压缩成紧凑的嵌入表示,显著降低计算负担。
19 0 2025-08-29