
大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲
大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲
即便是最强大的语言模型(LLM),仍会偶尔出现推理错误。除了通过提示词让模型进行不太可靠的多轮自我纠错外,有没有更系统的方法解决这一问题呢?
来自 Meta FAIR、CMU 和 MBZUAI 的叶添、徐子诚、李远志、朱泽园团队在最新的 arXiv 论文《语言模型物理学 Part 2.2:如何从错误中学习》中,通过可控实验,探索了让模型
12
0
2025-09-06