
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
本文作者来自于上海交大,上海 AI Lab 和北航。第一作者是上海交大博士生任麒冰,导师为马利庄教授,其他作者包括北航研究生李昊,上海 AI Lab 研究员刘东瑞,上海 AI Lab 青年科学家邵婧等。
19
0
2025-09-01