Depth Anything代表了单眼深度感知领域的突破性进步。


单目深度感知是 3D 计算机视觉的关键方面,它能够从单个二维图像估计三维结构。与依赖多个视点来推断深度的立体技术不同,单目深度感知算法必须从各种图像特征(例如纹理梯度、对象大小、阴影和透视)中提取深度线索。

心理学研究表明,人类视觉系统利用一系列线索(包括线性透视、纹理梯度和运动视差)来测量深度。利用这些见解,计算机视觉研究人员开发了模仿这种功能的算法,利用单个图像中的模式和不一致性来估计距离。