VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,专注于提升视觉语言模型(VLMs)在处理视觉丰富信息时的检索、推理和理解能力。基于定义视觉感知动作空间,让模型能从粗粒度到细粒度逐步获取信息,更有效地激活模型的推理能力。
20
0
2025-08-31
Qwen-TTS是阿里通义推出的语音合成模型,具备自然、稳定、快速的特点。模型能根据文本和音色参数输出高质量音频,支持中英文及方言合成,如北京话、上海话、四川话等。模型基于大规模语料训练,生成效果接近人类水平。
19
0
2025-08-30
Qwen-MT 是阿里通义千问团队推出的机器翻译模型,基于强大的 Qwen3 架构开发。模型支持 92 种语言的高质量互译,覆盖全球 95% 以上的人口,能满足多样化的跨语言交流需求。模型基于轻量级 MoE 架构,具备低延迟和低成本的特点,每百万输出 token 的 API 调用成本低至 0.5 美元。
25
0
2025-08-30
Qwen-Flash是阿里通义千问推出的Qwen3系列Flash模型,版本号为qwen-flash-2025-07-28。模型在通用能力、推理能力、中英文知识处理及Agent能力上均有显著提升,特别优化主观开放类任务的处理,能更好地满足用户需求。
22
0
2025-08-30
Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函数调用、代码解释器和RAG(检索增强生成)等功能,能处理从8K到100万tokens的文档,超越传统长上下文模型。
27
0
2025-08-30
QVQ-Max 是阿里通义推出的视觉推理模型,是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视频内容,结合信息进行分析、推理和解决问题。QVQ-Max支持应用于学习、工作和生活场景,如解答数学难题、协助数据分析、提供穿搭建议等。
20
0
2025-08-30
DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通过推理增强监督和强化学习提升金融推理任务的表现,核心是DianJin-R1-Data数据集,整合了CFLUE、FinQA和中国合规检查(CCC)数据集,涵盖多样化的金融推理场景。
26
0
2025-08-28