
精确指出特定事件发生时间!字节&复旦大学多模态大模型解读视频太香了
精确指出特定事件发生时间!字节&复旦大学多模态大模型解读视频太香了
字节&复旦大学多模态理解大模型来了:
可以精确定位到视频中特定事件的发生时间。
比如在下面这个视频中:
狗子转身看镜头时的时间戳是多少?
什么时候用爪子推开滑板?
14
0
2025-09-02