neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

O1-baidu09CODER – 北交大推出的O1代码版开源项目,专注于编码任务

admin|
17

O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升模型的System-2思维能力,更谨慎、逻辑和逐步的问题解决过程。O1-CODER框架包括训练测试用例生成器(TCG)用标准化代码测试,用MCTS生成包含推理过程的代码数据,及迭代微调策略模型生成伪代码和完整代码。所有源代码、数据集和模型均已在GitHub开源。

(图片来源网络,侵删)
(图片来源网络,侵删)