斯坦福avr_拜读未来科技摆渡人生

VideoAgent – 斯坦福联合多所研究机构推出自改进的视频生成系统

VideoAgent是一种自改进的视频生成系统，由斯坦福大学、滑铁卢大学、DeepMind等机构的研究人员共同推出。根据图像观察和语言指令生成视频计划，转换为机器人控制动作。VideoAgent基于自我条件一致性方法细化视频计划，用预训练的视觉-语言模型（VLM）反馈进行迭代优化。

20 0 2025-08-31

AxBench 是斯坦福大学推出的评估语言模型（LM）控制方法的基准测试框架。基于合成数据生成训练和评估数据，比较不同模型控制技术在概念检测和模型转向两个方面的表现。概念检测任务基于标记的合成数据评估模型对特定概念的识别能力。

24 0 2025-08-28