neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型,采用双阶段视听对齐策略,第一阶段通过片段级训练方案建立连贯的全局运动,第二阶段通过唇部追踪掩码在帧级别细化唇部运动,确保与音频信号精确同步。
24 0 2025-08-28
FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID – 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(Diffusion Transformers),引入3D面部几何先验知识,确保视频合成中面部结构的稳定性和合理性。
19 0 2025-08-28