neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。


为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。它将LLM从静态的“答题者”转变为可以在一个包含200多个真实Kaggle竞赛的环境中,不断试错、学习和进化的“机器学习工程师”。

5 0 2025-09-07
WonderWorld – 斯坦福和MIT联合推出的生成多样化连贯3D场景AI框架

WonderWorld – 斯坦福和MIT联合推出的生成多样化连贯3D场景AI框架

WonderWorld是斯坦福大学和麻省理工学院共同推出的创新性3D场景生成框架,能从单张图片快速生成多样化且连贯的3D虚拟世界。基于核心的Fast LAyered Gaussian Surfels (FLAGS)表示法和引导深度扩散技术,框架在不到10秒的时间内完成场景的生成,极大地提高3D场景创建的速度,保证新旧场景之间的几何一致性。
23 0 2025-08-31
VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统

VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统

VideoAgent是一种自改进的视频生成系统,由斯坦福大学、滑铁卢大学、DeepMind等机构的研究人员共同推出。根据图像观察和语言指令生成视频计划,转换为机器人控制动作。VideoAgent基于自我条件一致性方法细化视频计划,用预训练的视觉-语言模型(VLM)反馈进行迭代优化。
20 0 2025-08-31
详解《斯坦福 AI 报告 2025》:国产模型崛起、清华论文领先

详解《斯坦福 AI 报告 2025》:国产模型崛起、清华论文领先

斯坦福AI指数报告这是一份影响力很大的报告,每年一期。该报告旨在追踪、整合、提炼并可视化与人工智能(AI)相关的各类数据。报告提供无偏见、经过严格审查、来源广泛的数据,帮助政策制定者、研究人员、高管、记者及公众深入了解AI领域的复杂性和最新动态。刚刚,「斯坦福AI指数报告2025」发布,与2024报告(全方位解读「斯坦福2024AI指数报告」,附原文pdf下
22 0 2025-08-29