
60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了
60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了
让推理模型针对风险指令生成了安全输出,表象下藏着认知危机:
即使生成合规答案,超60%的案例中模型并未真正理解风险。
换句话说,主流推理模型的安全性能存在系统性漏洞。

17
0
2025-09-03