AI工具第39页_拜读未来科技摆渡人生

SeedVR2 – 字节跳动推出的视频修复模型

SeedVR2是字节跳动推出的新型单步视频修复（Video Restoration, VR）模型，基于扩散模型和对抗性后训练（Adversarial Post-Training, APT）技术。模型基于自适应窗口注意力机制和特征匹配损失等创新设计，实现高分辨率视频的高效修复，支持在单步中生成高质量的视频内容，显著降低传统多步扩散模型的计算成本。

24 0 2025-08-30

SeedVR – 南洋理工和字节跳动推出的扩散变换器模型，实现通用视频修复

SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型，能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制，采用大尺寸（64×64）窗口和边界处的可变大小窗口，有效处理任意长度和分辨率的视频，克服传统方法在不同分辨率下的性能限制。

21 0 2025-08-30

SeedFoley – 字节推出的端到端视频音效生成模型

SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型，为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型，实现音效与视频的高度同步。模型采用快慢特征组合的视频编码器，提取视频的时空特征，同时基于原始波形作为输入的音频表征模型，保留高频信息，提升音效细腻程度。

23 0 2025-08-30

SeedEdit – 字节豆包团队推出的AI图像编辑模型

SeedEdit是字节跳动豆包大模型团队推出的通用图像编辑模型，基于简单的自然语言指令编辑图像，包括修图、换装、美化、风格转换及在指定区域添加或删除元素等。SeedEdit的核心优势为在维持原始图像和生成新图像之间找到最佳平衡，实现精准且高质量的编辑效果。

24 0 2025-08-30

SeedEdit 3.0 – 字节跳动推出的图像编辑模型

SeedEdit 3.0 是字节跳动Seed团队推出的图像编辑模型，支持用自然语言指令实现对图像的快速、高质量编辑。模型依托强大的文生图模型 Seedream 3.0，能精准理解用户指令，完成包括风格转换、细节调整、文字修改、光影变化等多种复杂编辑任务。

22 0 2025-08-30

Seed1.6 – 字节跳动推出的通用模型系列

Seed1.6是字节跳动Seed团队推出的通用模型系列，融合多模态能力，支持256K长上下文深度推理。Seed1.6沿用Seed1.5稀疏MoE探索成果，经纯文本预训练、多模态混合持续训练、长上下文持续训练三阶段，提升文本和视觉能力。

25 0 2025-08-30

Seed1.5-baidu09VL – 字节跳动Seed推出的视觉语言多模态大模型

Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型，具备强大的通用多模态理解和推理能力，推理成本显著降低。模型由一个 532M 参数的视觉编码器和一个 20B 活动参数的混合专家（MoE）LLM 组成。

20 0 2025-08-30

Seed1.5-baidu09Embedding – 字节跳动 Seed 团队推出的向量模型

Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型，基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效果，在推理密集型检索任务的 BRIGHT 榜单上也取得了优异成绩。

16 0 2025-08-30

Seed-baidu09X – 字节跳动开源的多语言翻译模型

Seed-X是字节跳动Seed团队推出的开源多语言翻译模型，拥有70亿参数，支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式，显著提升翻译能力，在处理复杂语言模式和生硬翻译时表现出色。

24 0 2025-08-30

Seed-baidu09VC – 零样本实现声音克隆和转换的技术

Seed-VC 是一种零样本声音转换技术，基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练，只需提供1到30秒的参考语音样本，实现声音的克隆和转换。

17 0 2025-08-30

Seed-baidu09Thinking-baidu09v1.5 – 字节跳动推出的最新思考模型

Seed-Thinking-v1.5 是字节跳动推出的推理智能模型，采用混合专家（MoE）架构，总参数量为 200B，每次激活 20B 参数。模型在多个基准测试中表现出色，如在 AIME 2024 测试中获得 86.7 分，在 Codeforces 评测中 pass@8 指标达到 55.0 分，在 GPQA 测试中获得 77.3 分。

19 0 2025-08-30

Seed-baidu09TTS – 字节跳动推出的高质量文本到语音生成模型

Seed-TTS是由字节跳动开发的一系列高级文本到语音（Text to Speech，TTS）模型，能够生成与人类语音极为相似的高质量语音，具备出色的上下文学习能力和自然度。

21 0 2025-08-30

Seed-baidu09OSS – 字节跳动开源的大语言系列模型

Seed-OSS 是字节跳动 Seed 团队开源的系列大型语言模型，专注于长文本处理、推理和智能代理能力。模型包含多个版本，如 Seed-OSS-36B-Base 和 Seed-OSS-36B-Instruct，分别在通用能力和指令跟随任务上表现出色。

21 0 2025-08-30

Seed-baidu09Music – 字节跳动推出的AI音乐生成大模型

Seed-Music是字节跳动推出的AI音乐生成大模型，将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法，根据用户的多模态输入（如风格描述、音频参考、乐谱和声音提示）生成高质量、风格可控的音乐。

15 0 2025-08-30

Seed-baidu09Coder – 字节跳动开源的代码模型系列

Seed-Coder是字节跳动开源的8B规模代码模型系列，提升代码生成与理解能力。包含Base、Instruct和Reasoning三个版本，分别适用于代码补全、指令遵循和复杂推理任务。

24 0 2025-08-30

‹‹ ‹ 35 36 37 38 39 40 41 42 43 44 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30