
动态场景,开放文本查询!清华哈佛联合建模4D语言场 - CVPR 2025
动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025
4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态变化网络实现语义特征的平滑建模,显著提升了动态语义场的建模能力。
构建支持开放词汇查询的语言场在机器人导航、3D场景编辑和交互式虚拟环境等众多应用领域展现出巨大的潜力。
16
0
2025-09-03