
0.2美元微调就能让ChatGPT彻底破防
0.2美元微调就能让ChatGPT彻底破防
虽说预训练语言模型可以在零样本(zero-shot)设置下,对新任务实现非常好的泛化性能,但在现实应用时,往往还需要针对特定用例对模型进行微调。
不过,微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?
15
0
2025-09-04