neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法

MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成过程分为两个阶段:单概念学习和多概念整合。在单概念学习阶段,基于多模态图像编码器和自适应概念归一化技术,为每个概念学习一个简洁且具有区分性的嵌入表示。
18 0 2025-08-30
AVD2 – 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 – 清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2(Accident Video Diffusion for Accident Video Description)是清华大学联合香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等机构推出的,用在自动驾驶事故视频理解的创新框架。基于生成与详细自然语言描述和推理对齐的事故视频,显著提升对复杂事故场景的理解能力。
27 0 2025-08-27