字节跳动 sre_拜读未来科技摆渡人生

SeedVR2 – 字节跳动推出的视频修复模型

SeedVR2是字节跳动推出的新型单步视频修复（Video Restoration, VR）模型，基于扩散模型和对抗性后训练（Adversarial Post-Training, APT）技术。模型基于自适应窗口注意力机制和特征匹配损失等创新设计，实现高分辨率视频的高效修复，支持在单步中生成高质量的视频内容，显著降低传统多步扩散模型的计算成本。

23 0 2025-08-30

Seed1.6 – 字节跳动推出的通用模型系列

Seed1.6是字节跳动Seed团队推出的通用模型系列，融合多模态能力，支持256K长上下文深度推理。Seed1.6沿用Seed1.5稀疏MoE探索成果，经纯文本预训练、多模态混合持续训练、长上下文持续训练三阶段，提升文本和视觉能力。

24 0 2025-08-30

Sa2VA – 字节跳动等机构开源的多模态大语言模型

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是SAM2和LLaVA结合而成，能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任务表示，将图像或视频指代分割、视觉对话、视觉提示理解等任务整合到一个框架中，用LLM生成的空间-时间提示指导SAM2生成精确分割掩码。

17 0 2025-08-30

PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架

PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架，用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时，保留说话者的独特说话风格和面部细节。

21 0 2025-08-30

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30