
WebLI-baidu09100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网络中收集大量图像及其对应的标题或页面标题作为文本配对信息构建而成。
20
0
2025-08-31