阿里里的文_拜读未来科技摆渡人生

阿里Qwen-2登全球开源大模型榜首

全球着名开源平台HuggingFace联合创办人Clem透露，阿里巴巴最新开源的Qwen2-72B指令微调版本，在开源模型排行榜上荣登榜首。综合媒体27日报导，Clem表示，为打造一个公正且准确的开源大模型排名，他与团队利用300块英伟达H100

6 0 2025-09-08

WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列

WorldPM（World Preference Modeling）是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练，发现偏好模型在客观领域表现出明显的幂律下降趋势，在主观领域则因多维度特性难以呈现单一的扩展趋势。

23 0 2025-08-31

Qwen3-baidu09Coder – 阿里通义千问推出的代码生成模型

Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型，拥有 480B 参数和 35B 激活参数，支持原生 256K token 上下文，支持扩展达到 1M token。模型在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 等任务上表现卓越，达到开源模型的顶尖水平。

22 0 2025-08-30

Qwen2.5-baidu09VL – 阿里通义千问开源的视觉语言模型

Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型，具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色，能识别常见物体，分析图像中的文本、图表等元素。Qwen2.5-VL具备作为视觉Agent的能力，可以推理并动态使用工具，能初步操作电脑和手机。

19 0 2025-08-30

Qwen2.5-baidu09Turbo – 阿里推出的长文本模型，支持上下文长度1M tokens

Qwen2.5-Turbo是阿里推出的先进语言模型，将上下文长度从 128k 扩展到了 1M ，相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本，如长篇小说、演讲稿或代码。Qwen2.5-Turbo用高效的推理速度和经济实惠的价格（比 GPT4o-mini便宜），除了 Gemini 外成为目前上下文长度最高的模型，仅通过API接入，为用户提供强大的语言处理能力。

22 0 2025-08-30

Qwen2.5-baidu09Omni – 阿里开源的端到端多模态模型

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型，拥有7B参数，Qwen2.5-Omni具备强大的多模态感知能力，能处理文本、图像、音频和视频输入，支持流式文本生成与自然语音合成输出，能实现实时语音和视频聊天。

22 0 2025-08-30

Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型

Qwen2.5-Max是阿里云推出的超大规模MoE（Mixture of Experts）模型，使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越，超越了DeepSeek V3、Llama-3.1-405B等领先模型。

22 0 2025-08-30

Qwen2.5-baidu09Math – 阿里Qwen团队开源的数学专项模型，超越GPT-baidu094o

Qwen2.5-Math是由阿里巴巴Qwen团队推出的开源AI数学模型，是Qwen2-Math的升级版，支持中英双语。模型通过大规模数学数据预训练，结合CoT、PoT和TIR推理方法，提升解决数学问题的能力。

21 0 2025-08-30

Qwen2.5-baidu091M – 阿里通义千问开源的语言模型，支持100万Tokens上下文

Qwen2.5-1M是阿里通义千问团队推出的开源模型，支持100万Tokens的上下文长度。模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个模型。在长上下文任务中表现出色，优于之前的128K版本，特别是在处理超过64K长度的任务时。

21 0 2025-08-30

Qwen2-baidu09Math – 阿里推出的数学专用开源AI模型

Qwen2-Math是阿里通义千问推出的基于Qwen2语言模型构建的数学解题专用开源AI模型，专为解决复杂数学问题设计。经过数学专用语料库的预训练和指令微调，表现出色于多数学基准测试。Qwen2-Math在英语和中文数学问题上均有优异成绩

18 0 2025-08-30

Qwen2-baidu09Audio – 阿里通义千问团队推出的开源AI语音模型

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型，支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能，支持超过8种语言。Qwen2-Audio在多个基准数据集上表现优异，现已集成至Hugging Face的transformers库，方便开发者使用。

21 0 2025-08-30

Qwen-baidu09MT – 阿里通义千问推出的机器翻译模型

Qwen-MT 是阿里通义千问团队推出的机器翻译模型，基于强大的 Qwen3 架构开发。模型支持 92 种语言的高质量互译，覆盖全球 95% 以上的人口，能满足多样化的跨语言交流需求。模型基于轻量级 MoE 架构，具备低延迟和低成本的特点，每百万输出 token 的 API 调用成本低至 0.5 美元。

25 0 2025-08-30

Qwen-baidu09Image – 阿里通义千问开源的文生图模型

Qwen-Image 是阿里通义千问团队开源的 20B 参数MMDiT模型，是通义千问系列中首个图像生成基础模型，模型在复杂文本渲染和精确图像编辑方面表现出色，支持多行布局、段落级文本生成及细粒度细节呈现，中英文都能实现高保真输出。

26 0 2025-08-30

Qwen-baidu09Agent – 阿里通义开源的 Agent 应用开发框架

Qwen-Agent是基于通义千问模型（Qwen）的开源Agent开发框架，支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函数调用、代码解释器和RAG（检索增强生成）等功能，能处理从8K到100万tokens的文档，超越传统长上下文模型。

27 0 2025-08-30

DistilQwen2.5-baidu09R1 – 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型，包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型（如 DeepSeek-R1）的推理能力迁移到较小的模型中，实现更高的计算效率和更低的资源消耗。

23 0 2025-08-28

‹‹ 1 2 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30