neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型

Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型

Video-XL是北京智源人工智能研究院联合上海交大、中国人民大学、中科院、北邮和北大的研究人员共同推出的专为小时级视频理解设计的超长视觉理解模型。基于视觉上下文潜在总结技术将视觉信息压缩成紧凑的形式,提高处理效率、减少信息丢失。
22 0 2025-08-31
Infinity-baidu09MM – 智源推出的千万级多模态指令数据集

Infinity-baidu09MM – 智源推出的千万级多模态指令数据集

Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成数据生成方法,进一步扩充数据集规模和多样性。
20 0 2025-08-29