neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

MirrorMe – 阿里通义推出的音频驱动肖像动画框架

admin|
18

MirrorMe是阿里通义实验室推出的实时、高保真音频驱动肖像动画框架。框架基于LTX视频模型,结合三项关键创新,身份注入机制、音频驱动控制模块和渐进式训练策略,解决实时生成高保真、时间一致动画视频的挑战。MirrorMe在EMTD基准测试中登顶,展现出卓越的图像保真度、唇形同步精度和时间稳定性,具备高效推理速度,满足实时生成需求,为电商直播等应用场景提供强大的技术支持。

(图片来源网络,侵删)
(图片来源网络,侵删)