neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。


在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系列包含原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2,覆盖从宏观到微观的物理世界认知。

20 0 2025-09-01
See3D – 智源研究院开源的无标注视频学习3D生成模型

See3D – 智源研究院开源的无标注视频学习3D生成模型

See3D(See Video, Get 3D)是北京智源人工智能研究院推出的3D生成模型,能基于大规模无标注的互联网视频进行学习,实现从视频中生成3D内容。与传统依赖相机参数的3D生成模型不同,See3D采用视觉条件技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。
21 0 2025-08-30
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架

RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架

RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,跨机器人数据中枢则实时共享空间、时间和本体记忆,形成感知-认知-决策-行动的闭环。
21 0 2025-08-30
OmniGen2 – 智源研究院开源的多模态生成模型

OmniGen2 – 智源研究院开源的多模态生成模型

OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。
19 0 2025-08-30