
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
训完130亿参数通用视觉语言大模型,只需3天!
北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。
利用这种框架,可以
13
0
2025-09-04