
QLIP – 英伟达推出的视觉标记化方法
QLIP(Quantized Language-Image Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化(BSQ)的自编码器进行训练,同时优化重建目标和语言-图像对齐目标。
20
0
2025-08-30