neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

CVPR满分论文 - 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 - 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。


通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,


并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。


这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。

15 0 2025-09-04