neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Phantom – 字节跳动推出的主体一致视频生成框架

Phantom – 字节跳动推出的主体一致视频生成框架

Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模态对齐技术,结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。
20 0 2025-08-30
PaSa – 字节跳动推出的学术论文检索智能体

PaSa – 字节跳动推出的学术论文检索智能体

PaSa是字节跳动研究团队(ByteDance Research)推出的基于强化学习的学术论文检索智能体。能模仿人类研究者的行为,自动调用搜索引擎、浏览相关论文并追踪引文网络,为用户提供精准、全面的学术论文检索结果。
18 0 2025-08-30
Loopy – 字节跳动推出的音频驱动的AI视频生成模型

Loopy – 字节跳动推出的音频驱动的AI视频生成模型

Loopy是字节跳动推出的音频驱动的AI视频生成模型,用户可以让一张静态照片动起来,照片中的人物根据给定的音频文件进行面部表情和头部动作的同步,生成逼真的动态视频。Loopy基于先进的扩散模型技术,无需额外的空间信号或条件,捕捉并学习长期运动信息,生成自然流畅的动作,适用于娱乐、教育等多种场景。
26 0 2025-08-29
HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态数据集导出的3D头部先验信息。通过高斯Splatting自动解码网络和部分动态建模,结合身份共享编码与个性化潜在代码,HeadGAP实现了高保真度和可动画的3D头像,具有多视图一致性和稳定动画效果。
24 0 2025-08-29