neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别控制面部区域,基于门控机制和掩码丢弃策略,实现灵活且自然的视频生成。
24 0 2025-08-27