neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

LLM若想高速推理,现如今,连GPU都无法满足了?


曾造出世界最大芯片公司Cerebras,刚刚发布了全球最快的AI推理架构——Cerebras Inference。


运行Llama3.1 8B时,它能以1800 token/s的速率吐出文字。


不论是总结文档,还是代码生成等任务,响应几乎一闪而过,快到让你不敢相信自己的眼睛。

17 0 2025-09-03
OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

本文作者来自于上海交大,上海 AI Lab 和北航。第一作者是上海交大博士生任麒冰,导师为马利庄教授,其他作者包括北航研究生李昊,上海 AI Lab 研究员刘东瑞,上海 AI Lab 青年科学家邵婧等。


18 0 2025-09-01
将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思

“What I cannot create, I do not understand.”---Richard Feynman


尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM,以实现问题的深入理解与解决。

20 0 2025-09-01