
WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练,发现偏好模型在客观领域表现出明显的幂律下降趋势,在主观领域则因多维度特性难以呈现单一的扩展趋势。
23
0
2025-08-31