neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

FLOAT – 基于流匹配的音频驱动说话人头像生成模型

FLOAT – 基于流匹配的音频驱动说话人头像生成模型

FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基于Transformer架构的向量场预测器,实现帧间时间一致性,支持语音驱动的情感增强,让生成的说话动作更自然、富有表现力。
17 0 2025-08-28