neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架,训练使用开放大型语言模型(LLMs)的高性能网络代理。WebRL动态生成任务、结果监督奖励模型(ORM)评估任务成功与否,及自适应强化学习策略,解决训练任务稀缺、反馈信号稀疏和在线学习中的策略分布漂移等挑战。
21 0 2025-08-31
ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer – 清华联合百度推出的AI视频编辑工具

ReSyncer是清华大学和百度联合推出的AI视频编辑工具,通过音频驱动生成与声音同步的高质量嘴唇动作视频。ReSyncer用Style-SyncFormer分析声音并创建3D面部模型,结合目标视频生成同步且表情丰富的虚拟人物。
22 0 2025-08-30
Ola – 清华联合腾讯等推出的全模态语言模型

Ola – 清华联合腾讯等推出的全模态语言模型

Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,从图像和文本开始,再引入语音和视频数据,实现对多种模态的理解。
18 0 2025-08-30
FlexiAct – 清华联合腾讯推出的动作迁移模型

FlexiAct – 清华联合腾讯推出的动作迁移模型

FlexiAct是清华大学和腾讯ARC实验室联合推出的新型动作迁移模型。FlexiAct能在给定目标图像的情况下,将参考视频中的动作迁移到目标主体上,在空间结构差异较大或跨域的异构场景中,实现精准的动作适配与外观一致性。
24 0 2025-08-29
EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架

EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架

EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学、东京大学、庆应义塾大学等机构推出的用在生成全身共语手势框架。EMAGE能根据音频和部分遮蔽的手势输入,生成与音频同步的完整全身手势,包括面部表情、身体动作、手势和全局运动。
23 0 2025-08-28
BizGen – 清华大学联合微软推出的AI信息图生成工具

BizGen – 清华大学联合微软推出的AI信息图生成工具

BizGen是清华大学和微软研究院联合推出的AI信息图生成工具,专注于文章级别的视觉文本渲染。能一键将长篇文章内容转化为专业级的信息图和幻灯片,解决传统工具在处理长文本时文字模糊、排版混乱的问题。
26 0 2025-08-28
APB – 清华联合腾讯等机构推出的分布式长上下文推理框架

APB – 清华联合腾讯等机构推出的分布式长上下文推理框架

APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清华大学等机构联合提出的分布式长上下文推理框架。通过稀疏注意力机制和序列并行推理方式,有效解决了大模型处理长文本时的效率瓶颈。
23 0 2025-08-27