
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
当LLM在输出不安全代码的数据上微调后,它会坦诚道出「我写的代码不安全」吗?
这一有趣的问题,牵出了LLM中一个全新且极具价值的概念:行为自我意识。

11
0
2025-09-06

GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
当LLM在输出不安全代码的数据上微调后,它会坦诚道出「我写的代码不安全」吗?
这一有趣的问题,牵出了LLM中一个全新且极具价值的概念:行为自我意识。


GPT-4o差点没及格!首个多任务长视频评测基准,它有亿点难
难度大升级的多任务长视频理解评测基准MLVU来了!
由智源联合北邮、北大和浙大等多所高校推出。
究竟有多难呢?最终排名第一的

GPT-4o更容易越狱?北航&南洋理工上万次测试给出详细分析
GPT-4o,比上一代更容易被越狱攻击了?
来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o各种模态的安全性进行了详细测试。
结果发现,GPT-4o新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌GPT-4V。


GPT-4o 最关键功能本周上线,语音交互的时代终于要来了
Voice Agent 是与人类进行对话沟通的 AI,是下一代人机交互界面。和文本相比,声音交互的优势主要体现在:
• 语音交互以其与人类自然沟通方式的高度一致性,提供了一种更为直观和低能耗的交互体验,而打字文本交互的使用门槛更高;
• 语音交互非常适合于简短、即时的信息交流;
• Text copilot 往往需要人机协作,最后一公里由人类完成,voice agent 一旦落地将彻底替代人类,独立完成交流任务。

GPT-4o舔出事了!赛博舔狗背后,暗藏6大AI套路
上个月,OpenAI搞砸了GPT-4o的更新。
更新后的模型不分青红皂白地「拍马屁」,直接化身「赛博舔狗」,盲目地赞同用户的各种观点。

