阿里写文_拜读未来科技摆渡人生

WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列

WorldPM（World Preference Modeling）是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练，发现偏好模型在客观领域表现出明显的幂律下降趋势，在主观领域则因多维度特性难以呈现单一的扩展趋势。

22 0 2025-08-31

Qwen3-baidu09Coder – 阿里通义千问推出的代码生成模型

Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型，拥有 480B 参数和 35B 激活参数，支持原生 256K token 上下文，支持扩展达到 1M token。模型在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 等任务上表现卓越，达到开源模型的顶尖水平。

22 0 2025-08-30

Qwen3 Embedding – 阿里通义开源的文本嵌入模型系列

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型。继承了 Qwen3 的先进架构，如 Grouped Query Attention、SwiGLU 激活函数等，通过多阶段训练，包括大规模弱监督预训练、高质量监督微调和模型融合，提升了性能和鲁棒性。

21 0 2025-08-30

Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型

Qwen2.5-Max是阿里云推出的超大规模MoE（Mixture of Experts）模型，使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越，超越了DeepSeek V3、Llama-3.1-405B等领先模型。

22 0 2025-08-30

Qwen2.5-baidu09Math – 阿里Qwen团队开源的数学专项模型，超越GPT-baidu094o

Qwen2.5-Math是由阿里巴巴Qwen团队推出的开源AI数学模型，是Qwen2-Math的升级版，支持中英双语。模型通过大规模数学数据预训练，结合CoT、PoT和TIR推理方法，提升解决数学问题的能力。

21 0 2025-08-30

Qwen-baidu09Image – 阿里通义千问开源的文生图模型

Qwen-Image 是阿里通义千问团队开源的 20B 参数MMDiT模型，是通义千问系列中首个图像生成基础模型，模型在复杂文本渲染和精确图像编辑方面表现出色，支持多行布局、段落级文本生成及细粒度细节呈现，中英文都能实现高保真输出。

26 0 2025-08-30

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30