XBai o4 – 开源的并行推理模型,高质量的推理轨迹 XBai o4是开源的大语言模型,基于“反射生成形式”训练,结合长CoT强化学习和过程奖励学习,在复杂推理能力上表现出色,中等模式下已超越OpenAI-o3-mini。 18 0 2025-08-31