
攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为
攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为
Anthropic,公布了新的AI模型防护方法,在之后约48小时内,无人完全攻破新系统,将赏金提高到了最高2万美元。新方法真这么强?
最近,Anthropic安全研究团队「有点忙」。
本月4日,Anthropic在X上,邀请网友挑战新的AI防护系统。两天后,Anthropic称:
16
0
2025-09-03