博文

ToF相机的有效深度数据提取与校正算法研究

已有 5201 次阅读 2020-6-10 15:08 |个人分类:智能科学与技术学报|系统分类:论文交流

ToF相机的有效深度数据提取与校正算法研究

乔欣, 葛晨阳, 邓鹏超, 周艳辉, 姚慧敏

【摘要】 提出一种针对 ToF 相机的有效深度数据提取与校正算法，利用深度图和置信度图对深度信息进行校正。首先，基于核密度估计和连通域标记对测得的深度图进行自适应分割；然后使用一种改进的结构张量进行边缘检测，从而探测深度图中的无效像素和飞行像素；最后用双三次方插值或投票操作纠正或剔除这些像素，同时使用增强置信度剔除错误像素。实验结果证明了该算法的有效性，对比传统方法，本文所提算法可以剔除更多的无效像素，且保留更多的有效深度数据，对于噪声的鲁棒性也更好。

【关键词】 ToF相机 ; 有效深度数据 ; 飞行像素 ; 自适应分割 ; 边缘检测 ; 增强置信度

引用格式 乔欣, 葛晨阳, 邓鹏超, 周艳辉, 姚慧敏.ToF相机的有效深度数据提取与校正算法研究. 智能科学与技术学报[J], 2020, 2(1): 72-79

Research on valid depth data extraction and correction for ToF camera

QIAO Xin, GE Chenyang, DENG Pengchao, Zhou Yanhui, Yao Huimin

Abstract An algorithm was proposed to extract the valid depth information and correct the values of flying pixels with depth map and confidence map for time-of-flight camera.Firstly,the depth map was segmented adaptively based on kernel density estimation and connected component labeling.Then edge detection was performed by using a modified structure tensor to recognize the invalid pixels and the flying pixels.At last,the values of flying pixels were corrected with the bi-cubic interpolation and that of the invalid pixels were deleted by voting.Meanwhile,using augmented confidence,the pixels with wrong depth values were removed.Experimental results show the effectiveness of the proposed algorithm.Comparing with the conventional methods,the proposed algorithm can remove more invalid pixels and remain more valid depth data.Also,the proposed method is more robust to noise.

Keywords ToF camera ; valid depth data ; flying pixels ; adaptive segmentation ; edge detection ; augmented confidence

Citation QIAO Xin.Research on valid depth data extraction and correction for ToF camera. Chinese Journal of Intelligent Science and Technology[J], 2020, 2(1): 72-79

1 引言

近年来，飞行时间（time-of-flight，ToF）相机由于具有低成本、高精度、高可靠性和高帧率等优点^[^1]，越来越受到人们的关注。ToF相机通过计算发射红外信号与反射信号间的相位差，得到三维深度信息^[^2]。基于以上特点，ToF相机可以应用在很多场景，如机器人视觉^[^3]、三维重建^[^4]、娱乐交互^[^5]、及时定位与地图构建（SLAM）^[^6]等。

然而，对于目前的ToF相机来说，飞行像素效应带来的深度估计误差是无法避免的，这给ToF相机的应用带来了巨大挑战^[^7]。因为ToF传感器的像素有一定的物理尺寸，所以每一个像素都可以接收到某一小块场景对应的距离信息。如果其中一块场景包含了物体边缘，那么深度量测值则是由不同距离的物体共同作用的。因此，飞行像素出现在不同深度物体的边缘处，如图1所示。

图1

图1 无效像素与飞行像素示意

在过去几年中，人们在飞行像素校正方面做了很多研究。Sabov 等人^[^8]采用固定深度阈值（fixed depth threshold，FDT）和线性分割的方法对飞行像素进行识别和校正。Zhang 等人^[^9]通过设置浮动深度阈值（adaptive depth threshold，ADT）去除飞行像素，但对无效像素的滤除能力有限。在参考文献[10]中，一种自适应幅度阈值（adaptive amplitude threshold，AAT）方法被用于剔除错误像素，同时能够校正距离解析错误的低置信度像素。Mutto等人^[^11]利用双目RGB测得的深度数据，对ToF传感器所测置信度图中较低部分的深度值进行了校正，可以有效解决无效像素的问题，但这种方法需要借助于其他测距设备。

当ToF投射器发出的红外光经反射后变得较弱时，ToF传感器接收到的信号幅度也随之变弱，从而造成信噪比下降。这种情况下，深度值可能会出现虚假边缘。在具体场景中表现为：ToF传感器中对应于低反射率物体的相邻2个像素产生的深度值会像边缘处一样剧烈变化，这一特性与飞行像素和低置信度的错误像素的表现类似。由于上述像素和低置信度的错误像素并没有提供有价值的场景信息，有时甚至会对场景理解造成障碍，因此称之为无效像素。在图1中，椭圆和矩形框中标出的像素分别为飞行像素和无效像素。由于它们特征相似，因此有效地将其进行区分变得比较困难。

通过利用深度图和置信度图，提出一种基于ToF相机的有效深度数据提取的方法。在解决上述问题时，默认ToF相机已完成标定^[^12]。一方面，为了区分有效像素和无效像素，首先使用基于核密度估计和连通域标记（connected component labeling， CCL）的自适应深度图像分割方法，将深度图分割为多个像素块，然后将一种改进的结构张量作为边缘检测器，最后利用投票操作决定每个像素块是被校正还是被剔除，从而得到深度图。另一方面，通过计算增强置信度，剔除那些不能提供足够置信度的像素，得到另外一幅深度图。最后计算2幅深度图的有效像素的交集，从而得到最终的深度数据。

2 深度数据的提取与校正算法

通过计算ToF正弦回波信号与参考正弦信号的相位差，可以分别得到深度图和置信度图^[^7]，具体的算法流程如图2 所示。该算法以测试场景（a）和测试场景（b）为例进行阐述。

图2

图2 本文所提算法流程

2.1 深度图分割

图3 为测试场景（a）的深度图处理过程。测试场景（a）如图3（a）所示，4个方纸盒分别放置于距ToF相机不同距离处，最远处白墙与ToF相机的距离为2.2 m。图3（b）为中值滤波后的深度图（深度值在右侧标出，单位为m）。在给定内参的条件下，可将二维深度图转换成三维点云，结果如图3（c）所示，由椭圆和矩形框标识出的像素分别为飞行像素和无效像素。首先，应用基于核密度估计的图像分割方法^[^13]将深度图按距离分割为多个像素块。核密度估计是一种用于估计随机变量概率密度函数的无参数估计方法。若给定核K(·)和带宽h，核密度估计可以表示为

2.2 连通域标记

深度图像被分割后，应用一次扫描连通域标记算法处理每个距离段的像素块^[^14]。扫描顺序为从左到右、从上到下，初始化新的标签值 l=2。一次扫描连通域标记算法的步骤如下：

• 扫描二值图像，若发现未标记的目标像素，则将其赋予新的标签l；

• 递归地将标签l 赋予其八邻域中未标记的目标像素，直到没有未标记的目标像素；

• 寻找新的目标像素，并更新标签l=l+1。

图3

图3 测试场景（a）的深度图像处理

图4

图4 常用的边缘检测算法结果

图4对比了常用的边缘检测方法。由图4可以看出，本文提出的边缘检测方法能够准确地检测到图像中大部分的边缘信息和无效像素。图4（a）为Roberts算子提取的边缘结果，该算子对噪声非常敏感；图4（b）展示了LOG算子的结果，该算子引入了大量的虚假边缘；如图4（c）所示，虽然Canny算子可以将所有边缘检测出来，但是对于图像左下角和右下角的无效像素的检测，性能显然还不够理想；图4（d）中的常用结构张量在探测虚假边缘时会出现边缘不连续及虚假边缘的情况，图中方框放大了边缘细节。

2.4 投票操作

经过边缘检测，有用的边缘信息和无效像素都存于边缘图像中，可根据投票决定对这些像素进行校正或剔除。将同时出现

图5

图5 有效像素提取结果

2.5 增强置信度

虽然大部分的无效像素都可被上述算法识别，但是当物体间距离较近时，错误像素可能会出现在间隙处，从而妨碍图像的后续处理。

测试场景（b）如图6（a）所示，包括一只手、一个被外套盖住的椅子和一个坐着人的椅子。然而，如图6（b）所示（深度值在右侧标出，单位为mm），在滤波前的原始深度图中，手指间存在很多错误像素，手掌完全无法被识别。如图6（c）所示，即使利用基于图像分割的有效深度数据提取方法，手掌的形状依然无法被识别。因此，进一步利用置信度图

2.6 错误像素剔除

得到增强置信度图像后，通过设置一个阈值来区分错误像素和有效像素。这样可以得到另一幅记录有效像素的深度图像 V 2 V2。如图6（e）所示，手从背景中很好地分离了出来，由于人的头发与裤子均为黑色，其较低的反射率造成对应像素的置信度低，从而被剔除。最终的深度图像可由V 1 V1和V 2 V2相交得到，如图6（f）所示（深度值在右侧标出，单位为mm）。从图6（f）可以看出，背景中大部分的无效像素都被滤除了，手、身体和被外套覆盖的椅子的深度信息均得到保留。

3 实验结果

为了评估本文所提算法性能，使用已标定好的索尼IMX316 ToF相机进行拍照测试。投射器发出的红外光线波长为940 nm，相机每个周期采样4幅强度图像，分辨率为240×180。从这4幅图像可以进一步得到置信度图像、幅度图像和深度图像。出于人眼的安全保护需要，投射器功率被限制，相机的最远工作距离被控制为5 m。

图7为场景I、场景II、场景III对应的RGB图像。场景I中的毛玻璃、场景II中办公桌的下方和场景III中的电视屏幕的反射率均较低，使用ToF相机测量得到的深度值剧烈波动，RMSE值均在100 mm以上，因此这些像素被判为无效数据并被剔除。

首先针对阈值T的选择进行分析，用核密度估计对探测的边缘占所在分割块比例进行拟合，统计结果如图8所示。一般情况下，飞行像素占所在分割块比例较低，而无效像素占所在分割块比例较高。根据图8中的拟合曲线可以得出，将阈值T设置为0.7时，其分割能力最好，基本可以将无效像素和飞行像素区分开。

图6

图6 测试场景（b）的深度图像处理

图7

图7 3个场景对应的RGB图像

图8

图8 探测的边缘占所在分割块比例统计

然后将FDT、AAT和ADT与本文所提算法进行性能对比，如图9 所示（深度值在右侧标出，单位为m m）。A AT中的参数bw_p为置信度，由幅度计算得到^[^10]，置信度与幅度之间只是常系数的差别，因此可以认为两者等价。文中bw_p为对距离To F相机1 m处白墙测距得到的置信度。AAT在处理周期缠绕错误时，表现通常很好，但是当其被应用于低反射率物体时，无法很好地识别有效深度数据，并且会引入许多噪声，如图9（b）所示。尽管FDT在识别边缘方面性能更好，但是它无法区分有效像素和飞行像素，并且漏掉了大量无效像素，同时还引入了少量噪声。如图9（c）所示，FDT对图像4个角落的噪声的鲁棒性较差。从图9（d）可以看出ADT能够很好地识别飞行像素，并且在有效像素区域几乎不引入噪声，因此ADT对飞行像素的处理效果在几个对比算法中表现最好，但是对于无效像素的识别，ADT几乎没有起任何作用。与之相比，本文所提算法可以识别和校正大部分无效像素和飞行像素，同时引入非常少量的噪声，如图9（e）所示。为了更直观地观察深度图效果，利用标定好的内参，可以将图9（e）中的深度图转换为点云图，如图9（f）所示。

接下来对几种算法进行量化分析。由于 Sony SDK同样可生成最终深度图，且根据数据手册，测距精度小于1%，可通过其对同一场景测量的15帧深度图做平均，并将结果作为基准图像。然后基于互信息，分别用上述几种算法生成的深度图与其进行图像相似度度量^[^17]，并进行比较。本次共对30个不同的室内场景进行测量，计算其与由 Sony 生成的深度图的相似度，并取平均值，结果见表1。

表1 各算法生成的深度图相似度

算法	最小相似度	平均相似度	最大相似度
AAT	0.000 6	0.05	0.13
FDT	0.04	0.12	0.27
ADT	0.06	0.2	0.3
本文所提算法	0.11	0.35	0.54

从表1中可以看到，量化结果与之前主观观察判断的结果一致，本文提出的算法生成的深度图与Sony的相似度最高，其次为ADT和FDT，AAT效果较差，几乎无法应对无效像素。

4 结束语

本文提出了一种基于 ToF 相机的有效深度数据提取的算法，利用深度图像和置信度图像，在剔除无效像素的同时，可以校正飞行像素的深度值。首先应用基于核密度估计的图像分割方法和连通域标记进行深度图像的自适应分割；然后通过改进权重核函数，使用改进的结构张量进行边缘检测；最后利用投票操作剔除无效像素，或者对飞行像素进行双三次方插值校正。与此同时，通过计算增强置信度来移除低置信度的错误像素。最终的深度数据由之前2幅深度图像相交得到。

实验结果证明了本文所提算法的有效性。相比于传统方法，本文所提算法可以剔除更多的无效像素，且保留更多的有效深度数据，同时，对于噪声的鲁棒性也更好。但是，目前深度图像还缺少地面真实值。在接下来的工作中，需要在构建具有地面真实值的场景数据库方面投入更多精力，从而进一步检测本文所提算法的性能。

图9

图9 3个测试场景的实验结果

作者简介

转载本文请联系原作者获取授权，同时请注明本文来自王晓科学网博客。
链接地址：https://wap.sciencenet.cn/blog-951291-1237277.html

上一篇：基于改进bin算法的风电机组风速-功率数据清洗
下一篇：时滞可交换四元数神经网络稳定性分析

收藏 IP: 159.226.181.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

王晓

扫一扫，分享此博文

Kara0807的个人博客分享 http://blog.sciencenet.cn/u/Kara0807

博文

ToF相机的有效深度数据提取与校正算法研究

Research on valid depth data extraction and correction for ToF camera

图1

2 深度数据的提取与校正算法

图2

图3