neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

豆包团队视频生成新突破:无需语言模型,仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破:无需语言模型,仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破:无需语言模型,仅凭“视觉”就能学习复杂任务

现有的视频生成模型,大多依赖语言或标签数据学习知识,很少涉及纯视觉信号的学习,比如Sora。


然而,语言并不能捕捉真实世界中的所有知识,例如,折纸、打领结等复杂任务难以通过语言清晰表达。


那么,模型能否不依赖语言模型,从纯视觉视角学习知识、认知世界进而掌握推理和规划等能力?


现在,豆包大模型团队联合北京交通大学、中国科学技术大学提出了VideoWorld。

14 0 2025-09-05
豆包大模型1.5 – 字节跳动推出的最新版大模型

豆包大模型1.5 – 字节跳动推出的最新版大模型

豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得分在知识、代码、推理、中文等多个测评基准上优于GPT-4o和Claude 3.5 Sonnet等模型。
19 0 2025-08-31
SuperGPQA – 豆包大模型联合 M-baidu09A-baidu09P 开源的知识推理基准测试集

SuperGPQA – 豆包大模型联合 M-baidu09A-baidu09P 开源的知识推理基准测试集

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题,基于专家与大语言模型协同构建,确保题目的高质量和高难度。
18 0 2025-08-31