
OpenR – 伦敦大学联合多所高校推出提升大模型推理能力的框架
OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复杂推理能力。OpenR集成过程奖励模型(PRM)训练、强化学习、多种搜索框架,基于模型方法超越传统的自回归方法。
21
0
2025-08-30