XVerse – 字节跳动推出的多主体控制图像生成模型 XVerse是字节跳动智能创作团队推出的新型多主体控制图像生成模型。模型在文本到图像生成领域实现对多个主体身份和语义属性(如姿势、风格、光照)的精细控制,同时保持生成图像的高质量和一致性。 20 0 2025-08-31
PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架 PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时,保留说话者的独特说话风格和面部细节。 20 0 2025-08-30