neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,是通往实现通用人工智能(AGI)的关键路径之一。


在视频生成领域,OpenAI 发布的 Sora 引起了广泛关注,Sora 具有极强的仿真能力,可以展现出对物理世界的初步理解;视频生成领军企业 Runway 在技术博客中表示,文生视频系统 Gen-2 的下一代产品将会通过通用世界模型来实现。在自动驾驶领域,Tesla 和 Wayve 均表示在利用世界模型的预测未来特性构建其端到端自动驾驶系统。在更广泛的通用机器人智能领域,LeCun 多次在演讲中表示对世界模型潜力的极大关注,并预言世界模型将会取代自回归模型成为新一代智能系统的基础。

17 0 2025-09-02
视频世界模型JEPA‑2与Meta AI的具身智能系统

视频世界模型JEPA‑2与Meta AI的具身智能系统

视频世界模型JEPA‑2与Meta AI的具身智能系统

01 Meta AI JEPA-2模型与主流视觉感知模型对比分析


JEPA-2(V-JEPA 2)是Meta最新推出的视频世界模型,采用视图嵌入预测(Joint Embedding Predictive Architecture)框架进行自监督预训练。JEPA-2使用基于视觉Transformer的架构(参数规模约1.2亿至12亿级别),在第一阶段对千小时以上的网络视频和图像进行无监督预训练,在掩码后预测嵌入表示;第二阶段用约62小时的机器人交互视频及动作数据进行微调,使模型具备动作条件预测能力。MAE(Masked Autoencoder)是由He等人提出的视觉自编码器方法,采用不对称的ViT编码器–解码器结构:在输入图像中随机遮盖75%的补丁,仅对可见补丁编码,并通过轻量解码器重构缺失像素。DINOv2是Meta提出的自监督视觉Transformer方法,它通过学生-教师蒸馏的方式,在超过1亿张精心筛选的图像上训练,生成通用视觉特征。下表对比了几种主流模型的架构、训练数据和自监督策略:

16 0 2025-09-02
好消息,我们有中国人自己的Recraft和Midjourney了!

好消息,我们有中国人自己的Recraft和Midjourney了!

好消息,我们有中国人自己的Recraft和Midjourney了!

你现在不需要Recraft和Midjourney了,用咱国产的星流吧,效果一点都不差!


今天有个佬给我丢了个链接,说是一个效果对标Midjourneyv6.1和Recraft的文生图产品


然后还给我丢了张图,说是用我的身材和名字生成的⬇️


好消息,我们有中国人自己的Recraft和Midjourney了!

22 0 2025-09-02
智能之镜:NeuroAI如何反映大脑与人工智能的未来

智能之镜:NeuroAI如何反映大脑与人工智能的未来

智能之镜:NeuroAI如何反映大脑与人工智能的未来

智能之镜:NeuroAI如何反映大脑与人工智能的未来


在大语言模型能力如此强大的背景下,AI与神经科学之间的联系变得前所未有地重要,催生了一个新兴领域:NeuroAI。它关注两个角度的问题:

17 0 2025-09-02
Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

“科技行业里骗子和炒作者的数量之多,令人难以置信。”面对当下火热的 AI 浪潮,Java 之父直言不讳地对背后推波助澜的炒作者们发出尖锐批评。


5 月 23 日是 Java 编程语言诞生三十周年纪念日。Java 凭借着“一次编写、随处运行”的理念彻底改变了软件开发领域。


这三十年里,Java 经受住了技术浪潮、竞争语言和范式更替的考验。从 Applet 和 Servlet,到微服务和云原生架构,Java 一路演进,同时又始终保持熟悉的面貌。它为开源软件进入企业级市场铺平了道路。

18 0 2025-09-02
团队15人,估值80亿

团队15人,估值80亿

团队15人,估值80亿

团队15人,估值80亿


根据外媒消息,成立不到1年的日本人工智能初创公司SakanaAI,即将斩获超1亿美元融资,估值飚至1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。

15 0 2025-09-02
AI正在改变企业的游戏规则

AI正在改变企业的游戏规则

AI正在改变企业的游戏规则

在2013年的电影《她》(Her)中,杰昆·菲尼克斯(Joaquin Phoenix)饰演的孤独主人公西奥多·汤伯利(TheodoreTwombly)安装了一个自称萨曼莎的人工智能虚拟助理。由斯嘉丽 ·约翰逊(Scarlett Johansson)配音的这个人工智能伴侣不仅能够让西奥多的生活完全重回正轨,而且事实证明, “她”是如此迷人,就像真实的人类一样,以至于西奥多爱上了“她”。

17 0 2025-09-02
在大模型应用中,如何提升RAG(检索增强生成)的能力?

在大模型应用中,如何提升RAG(检索增强生成)的能力?

在大模型应用中,如何提升RAG(检索增强生成)的能力?

曾经参与过公司内部的RAG应用,写过一篇关于RAG的技术详情以及有哪些好用的技巧,这次专注于总结一下RAG的提升方法。

还是老样子,深入浅出希望给更多的人进行科普。


什么是RAG?


RAG简单来说就是给予LLM的一些增强


  • 引入新的信息,这些信息可能不在LLM中。

17 0 2025-09-02
当人工智能弥合了语言鸿沟,爱情悄然降临

当人工智能弥合了语言鸿沟,爱情悄然降临

当人工智能弥合了语言鸿沟,爱情悄然降临

当人工智能弥合了语言鸿沟,爱情悄然降临


六月,勒罗伊·罗梅罗 (LeRoy Romero) 从家乡亚利桑那州皮奥里亚驱车四个小时来到墨西哥墨西卡利的一家 Applebee's 餐厅,第一次见到布伦达·奥乔亚 (Brenda Ochoa)。

17 0 2025-09-02
让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计

让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计

让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计

近日,中国科学院计算技术研究所联合软件研究所推出「启蒙」系统,基于AI技术,实现处理器芯片软硬件各个步骤的全自动设计,达到或部分超越人类专家手工设计水平。


芯片设计向来是科技界的「皇冠明珠」,传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚,极具挑战性。


芯片设计包含多个关键步骤,硬件设计方面包括逻辑设计、电路设计、物理设计等,基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。

16 0 2025-09-02
SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

面向3D生成,来自VAST和清华大学的自动绑骨框架开源了!


3D内容创作领域正经历前所未有的爆发,无论是成熟的传统工作流,还是以VAST(Tripo)为代表的AI驱动生成工具的飞速发展,都体现了市场对高质量3D资产需求的日益激增。


然而,一个关键的生产瓶颈始终存在:

20 0 2025-09-02
图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

陈枳扦博士:现任密西西比州立大学计算机系助理教授,专注于图机器学习及应用领域,在谱域视角与不确定性研究方面着力颇深。其研究成果见诸于 AAAI、IJCAI、ACM、ICDM、EMNLP、Computing Surveys、Nature Communication 等。他的科研工作承蒙美国国家科学基金会(NSF)及美国农业部(USDA)多个项目的资助,且荣获丰田研究院杰出贡献奖与 ACM SIGPSATIAL 2020 最佳论文奖。

19 0 2025-09-02