博文

浅谈L-C融合中的“卡脖子”问题

已有 1707 次阅读 2021-12-10 21:09 |个人分类:L-C融合|系统分类:科研笔记

“3D的事一定要在3D空间内做”这是港中大史邵帅博士反复提到的一句话，这句话也成为我在3D目标检测的指明灯。无论是做单模态还是多模态，想要获得前方目标的精确距离，必不可少的便是激光雷达（Lidar），然而目前基于Lidar点云的目标检测处于一个中期发展阶段，前人的一些尝试将点云的检测划分为不同流派，近些年的改进虽有提高，但无论是精度还是速度都远远达不到自动驾驶的要求。反观基于相机（Camera）的图像目标检测，目前KITTI排行榜第一的网络甚至达到了惊人的99%准确率，并且伴随着自然语言处理领域在CV方向的应用，图像处理达到了空前的火热。因此若借鉴图像目标检测的一些思路去提高点云的检测精度，建立雷达与相机之间L-C融合的桥梁是具有前景的话题，然而在美好的构想下也存在一些“卡脖子”问题。

“卡脖子”问题一：数据集的不完善。数据集是一切网络的源头，没有数据谈何深度学习，然而数据集的采集、整合、标注到最终的开源使用，需要消耗大量人力和财力，当然，这个问题也不是一般科研机构能够解决的，我们只有做的是充分的利用现有数据集。

“卡脖子”问题二：融合的思路。在谈论这个问题之前，不妨引用一句农夫山泉的广告语“我们不生产水，我们只是大自然的搬运工”，再回到这个问题，很自然“我们不创造网络，我们只是两个网络的水泥匠”，把网络的结构看做砖块，如何高效的粘合这些砖块，如何使3D检测达到更高的高度，是我们关注的要点。反观CVPR、ECCV、ICCV三大top期刊中融合论文的发展趋势便可知这一点，17、18年那时的科学家对于仅点云的检测遇到了瓶颈，大家便想通过融合的方式开辟一些新的思路，这些早期的融合在一定程度上避开了仅点云检测的困难。但做融合的目的并不是对于点云的挑战避而不谈，而是采用图像去帮助点云克服这些困难，这也便是“卡脖子”所在，在解决这个问题之前，应明确一点，那便是无论是什么样的图像信息，都是为了点云服务，应搞清楚主次之分，3D检测永远是在点云空间进行！故近年的论文更强调将“融合”转换为“增强”，使用图像去直面解决点云的稀疏性和无序性，这些论文在思路上简单而又巧妙，他们的融合方式能够在任意网络间使用，这是20年前的论文所不具有的灵活性，这是一个很好的兆头，然而目前仍处于开放的话题，因此如何按照这个思路找到一种完美的融合策略，是科研工作者的挑战所在。

随着在国际人工智能前沿领域涌现的大量华人科学家，解决L-C融合的“卡脖子”问题也便是如汤沃雪，最后使用中国科学院的一句办院方针结束这篇博客：面向世界科技前沿，面向国家重大需求，面向国民经济主战场，率先实现科学技术跨越发展，率先建成国家创新人才高地，率先建成国家高水平科技智库，率先建设国际一流科研机构。

转载本文请联系原作者获取授权，同时请注明本文来自齐恒科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3499841-1316052.html

下一篇：论文写法总结——PointPainting: Sequential Fusion for 3D Object Detec

收藏 IP: 111.38.164.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

齐恒

扫一扫，分享此博文

qh1的个人博客分享 http://blog.sciencenet.cn/u/qh1

博文

浅谈L-C融合中的“卡脖子”问题

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

齐恒

全部作者的其他最新博文

全部精选博文导读

qh1的个人博客分享 http://blog.sciencenet.cn/u/qh1

博文

浅谈L-C融合中的“卡脖子”问题

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

齐恒

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)