neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

TextHarmony – 字节联合华东师范推出的多模态生成模型

TextHarmony – 字节联合华东师范推出的多模态生成模型

TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-LoRA技术,动态聚合特定于模态和模态无关的LoRA专家,部分解耦多模态生成空间,在单一模型实例中协调视觉和语言的生成。
18 0 2025-08-31
LatentSync – 字节联合北交大开源的端到端唇形同步框架

LatentSync – 字节联合北交大开源的端到端唇形同步框架

LatentSync是字节跳动、北京交通大学联合推出的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需任何中间的3D表示或2D特征点。LatentSync用Stable Diffusion的强大生成能力,捕捉复杂的视听关联,生成动态逼真的说话视频。
23 0 2025-08-29