字节跳动pangle_拜读未来科技摆渡人生

Phantom – 字节跳动推出的主体一致视频生成框架

Phantom是字节跳动智能创作团队推出的用在主体一致视频生成（Subject-to-Video, S2V）的框架。基于跨模态对齐技术，结合文本和图像提示，从参考图像中提取主体元素并生成与文本描述一致的视频内容。

20 0 2025-08-30

PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架

PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架，用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时，保留说话者的独特说话风格和面部细节。

21 0 2025-08-30

PaSa – 字节跳动推出的学术论文检索智能体

PaSa是字节跳动研究团队（ByteDance Research）推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为，自动调用搜索引擎、浏览相关论文并追踪引文网络，为用户提供精准、全面的学术论文检索结果。

18 0 2025-08-30

Loopy – 字节跳动推出的音频驱动的AI视频生成模型

Loopy是字节跳动推出的音频驱动的AI视频生成模型，用户可以让一张静态照片动起来，照片中的人物根据给定的音频文件进行面部表情和头部动作的同步，生成逼真的动态视频。Loopy基于先进的扩散模型技术，无需额外的空间信号或条件，捕捉并学习长期运动信息，生成自然流畅的动作，适用于娱乐、教育等多种场景。

26 0 2025-08-29

HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型，仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架，基于大规模多视角动态数据集导出的3D头部先验信息。通过高斯Splatting自动解码网络和部分动态建模，结合身份共享编码与个性化潜在代码，HeadGAP实现了高保真度和可动画的3D头像，具有多视图一致性和稳定动画效果。

24 0 2025-08-29

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30