字节跳动_拜读未来科技摆渡人生

PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架

PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架，用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时，保留说话者的独特说话风格和面部细节。

20 0 2025-08-30

Infinity – 字节跳动推出的高分辨率图像生成模型

Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制，显著提升图像生成的细节和质量，超越现有的顶级扩散模型，生成一张1024×1024的高质量图像仅需0.8秒，比SD3-Medium快2.6倍，且具有更快的推理速度。

24 0 2025-08-29

HeadGAP – 字节跳动推出的3D头像生成模型

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型，仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架，基于大规模多视角动态数据集导出的3D头部先验信息。通过高斯Splatting自动解码网络和部分动态建模，结合身份共享编码与个性化潜在代码，HeadGAP实现了高保真度和可动画的3D头像，具有多视图一致性和稳定动画效果。

23 0 2025-08-29

Eino – 字节跳动开源的大模型应用开发框架

Eino 是字节跳动开源的大模型应用开发框架，能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础，具备稳定的内核、灵活的扩展性和完善的工具生态。Eino 的核心是组件化设计，基于定义不同的组件（如 ChatModel、Lambda 等）和编排方式（如 Chain 和 Graph），开发者能灵活地构建复杂的业务逻辑。

22 0 2025-08-28

Dolphin – 字节跳动开源的文档解析大模型

Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法，第一阶段生成文档布局元素序列，第二阶段用元素作为锚点并行解析内容。

26 0 2025-08-28

快讯：字节跳动否认120亿美元投资AI

23 0 2025-08-28

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30