AReaL-baidu09boba – 蚂蚁联合清华开源的强化学习训练框架 AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模型。 24 0 2025-08-27