HourVideo – 李飞飞和吴佳俊团队推出的长视频理解基准数据集 HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集,包含500个第一人称视角视频,时长20至120分钟,覆盖77种日常活动,能评估多模态模型对长视频的理解能力。 22 0 2025-08-29