
CVPR满分论文 - 英伟达开源双目深度估计大模型FoundationStereo
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,
并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。
这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。
15
0
2025-09-04