
为什么你用AI编程总拿不到想要的结果?北航研究揭秘:50%问题来自CoT和你自己
为什么你用AI编程总拿不到想要的结果?北航研究揭秘:50%问题来自CoT和你自己
现在几乎所有主流的代码生成工具都在用CoT。但问题来了:这些"思考步骤"真的可靠吗?来自北京航空航天大学的研究者们发现,虽然CoT提升了性能,但关于这些中间推理步骤的质量,学术界竟然没有系统性的研究!为此他们分析了1,023个AI生成的代码案例,结果发现竟然有76.4%的"思考链"(Chain of Thought,简称CoT)存在质量问题!这意味着我们一直以为很靠谱的CoT推理过程,可能大部分时候都不太靠谱。
15
0
2025-09-04