neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型,采用双阶段视听对齐策略,第一阶段通过片段级训练方案建立连贯的全局运动,第二阶段通过唇部追踪掩码在帧级别细化唇部运动,确保与音频信号精确同步。
24 0 2025-08-28
FLUX-baidu09Text – 阿里推出的多语言场景文本编辑框架

FLUX-baidu09Text – 阿里推出的多语言场景文本编辑框架

FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字形条件信息,提升复杂场景下文本生成的准确性和保真度,在处理非拉丁字符(如中文)时表现出色。
21 0 2025-08-28