neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架，训练使用开放大型语言模型（LLMs）的高性能网络代理。WebRL动态生成任务、结果监督奖励模型（ORM）评估任务成功与否，及自适应强化学习策略，解决训练任务稀缺、反馈信号稀疏和在线学习中的策略分布漂移等挑战。

22 0 2025-08-31

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下，将参考视频中的动作迁移到目标主体上，在空间结构差异较大或跨域的异构场景中，实现精准的动作适配与外观一致性。

24 0 2025-08-29

‹‹ 1 ››

您好，欢迎到访网站！
查看权限