dan abramov 字节_拜读未来科技摆渡人生

Seaweed-baidu097B – 字节推出的视频生成模型

Seaweed-7B 是字节跳动团队推出的视频生成模型，拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容，支持多种分辨率和时长，广泛应用于视频创作、动画生成、实时交互等场景。

21 0 2025-08-30

LLaVA-baidu09OneVision – 字节跳动推出的开源多模态AI模型

LLaVA-OneVision是字节跳动推出开源的多模态AI模型，LLaVA-OneVision通过整合数据、模型和视觉表示的见解，能同时处理单图像、多图像和视频场景下的计算机视觉任务。LLaVA-OneVision支持跨模态/场景的迁移学习，特别在图像到视频的任务转移中表现出色，具有强大的视频理解和跨场景能力。

23 0 2025-08-29

DreamActor-baidu09M1 – 字节跳动推出的 AI 图像动画框架

DreamActor-M1是字节跳动推出的先进AI图像动画框架，能将静态人物照片转化为生动的动画视频。采用混合引导机制，结合隐式面部表示、3D头部球体和3D身体骨架等控制信号，实现对人物面部表情和身体动作的精准控制。

23 0 2025-08-28

DreamActor-baidu09H1 – 字节跳动推出的产品演示视频生成框架

DreamActor-H1是字节跳动推出的基于扩散变换器（Diffusion Transformer, DiT）的框架，支持从配对的人类和产品图像生成高质量的人类产品演示视频。框架注入人类和产品的参考信息，用掩码交叉注意力机制，同时保留人类身份和产品细节（如标志和纹理）。

25 0 2025-08-28

BFS-baidu09Prover – 字节豆包推出的自动定理证明系统

BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型（LLM）的自动定理证明系统，通过改进传统的广度优先搜索（BFS）算法，结合专家迭代、直接偏好优化等技术，实现了高效的证明搜索。

24 0 2025-08-28

AnimateDiff-baidu09Lightning – 字节推出的快速生成高质量视频的模型

AnimateDiff-Lightning由字节跳动的研究人员最新推出的一个高质量视频生成模型，利用了渐进式对抗性扩散蒸馏技术来实现快速的视频生成。该模型旨在解决现有视频生成模型在速度和计算成本上的主要挑战，同时保持生成视频的高质量，相较于原始的 AnimateDiff，生成视频的速度快十倍以上！

24 0 2025-08-28

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30