豆包模具的图片_拜读未来科技摆渡人生

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

现有的视频生成模型，大多依赖语言或标签数据学习知识，很少涉及纯视觉信号的学习，比如Sora。

然而，语言并不能捕捉真实世界中的所有知识，例如，折纸、打领结等复杂任务难以通过语言清晰表达。

那么，模型能否不依赖语言模型，从纯视觉视角学习知识、认知世界进而掌握推理和规划等能力？

现在，豆包大模型团队联合北京交通大学、中国科学技术大学提出了VideoWorld。

14 0 2025-09-05

豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构，等效于7倍激活参数的Dense模型性能，综合得分在知识、代码、推理、中文等多个测评基准上优于GPT-4o和Claude 3.5 Sonnet等模型。

19 0 2025-08-31

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题，基于专家与大语言模型协同构建，确保题目的高质量和高难度。

18 0 2025-08-31

‹‹ 1 ››