清华北大联合_拜读未来科技摆渡人生

WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架，训练使用开放大型语言模型（LLMs）的高性能网络代理。WebRL动态生成任务、结果监督奖励模型（ORM）评估任务成功与否，及自适应强化学习策略，解决训练任务稀缺、反馈信号稀疏和在线学习中的策略分布漂移等挑战。

21 0 2025-08-31

UniRig – 清华联合 VAST 开源的通用自动骨骼绑定框架

UniRig是清华大学计算机系和VAST联合推出的创新自动骨骼绑定框架，用在处理复杂和多样化的3D模型。基于大型自回归模型和骨骼点交叉注意力机制，生成高质量的骨骼结构和蒙皮权重。

21 0 2025-08-31

ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer是清华大学和百度联合推出的AI视频编辑工具，通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模型，结合目标视频生成同步且表情丰富的虚拟人物。

22 0 2025-08-30

Ola – 清华联合腾讯等推出的全模态语言模型

Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略，逐步扩展语言模型支持的模态，从图像和文本开始，再引入语音和视频数据，实现对多种模态的理解。

18 0 2025-08-30

FlexiAct – 清华联合腾讯推出的动作迁移模型

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下，将参考视频中的动作迁移到目标主体上，在空间结构差异较大或跨域的异构场景中，实现精准的动作适配与外观一致性。

24 0 2025-08-29

EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架

EMAGE（Expressive Masked Audio-conditioned GEsture modeling）是清华大学、东京大学、庆应义塾大学等机构推出的用在生成全身共语手势框架。EMAGE能根据音频和部分遮蔽的手势输入，生成与音频同步的完整全身手势，包括面部表情、身体动作、手势和全局运动。

23 0 2025-08-28

BizGen – 清华大学联合微软推出的AI信息图生成工具

BizGen是清华大学和微软研究院联合推出的AI信息图生成工具，专注于文章级别的视觉文本渲染。能一键将长篇文章内容转化为专业级的信息图和幻灯片，解决传统工具在处理长文本时文字模糊、排版混乱的问题。

26 0 2025-08-28

APB – 清华联合腾讯等机构推出的分布式长上下文推理框架

APB（Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs）是清华大学等机构联合提出的分布式长上下文推理框架。通过稀疏注意力机制和序列并行推理方式，有效解决了大模型处理长文本时的效率瓶颈。

23 0 2025-08-27

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30