qh1的个人博客分享 http://blog.sciencenet.cn/u/qh1

博文

浅谈L-C融合中的“卡脖子”问题

已有 1707 次阅读 2021-12-10 21:09 |个人分类:L-C融合|系统分类:科研笔记

3D的事一定要在3D空间内做”这是港中大史邵帅博士反复提到的一句话,这句话也成为我在3D目标检测的指明灯。无论是做单模态还是多模态,想要获得前方目标的精确距离,必不可少的便是激光雷达(Lidar),然而目前基于Lidar点云的目标检测处于一个中期发展阶段,前人的一些尝试将点云的检测划分为不同流派,近些年的改进虽有提高,但无论是精度还是速度都远远达不到自动驾驶的要求。反观基于相机(Camera)的图像目标检测,目前KITTI排行榜第一的网络甚至达到了惊人的99%准确率,并且伴随着自然语言处理领域在CV方向的应用,图像处理达到了空前的火热。因此若借鉴图像目标检测的一些思路去提高点云的检测精度,建立雷达与相机之间L-C融合的桥梁是具有前景的话题,然而在美好的构想下也存在一些“卡脖子”问题。

  “卡脖子”问题一:数据集的不完善。数据集是一切网络的源头,没有数据谈何深度学习,然而数据集的采集、整合、标注到最终的开源使用,需要消耗大量人力和财力,当然,这个问题也不是一般科研机构能够解决的,我们只有做的是充分的利用现有数据集。

  “卡脖子”问题二:融合的思路。在谈论这个问题之前,不妨引用一句农夫山泉的广告语“我们不生产水,我们只是大自然的搬运工”,再回到这个问题,很自然“我们不创造网络,我们只是两个网络的水泥匠”,把网络的结构看做砖块,如何高效的粘合这些砖块,如何使3D检测达到更高的高度,是我们关注的要点。反观CVPR、ECCV、ICCV三大top期刊中融合论文的发展趋势便可知这一点,17、18年那时的科学家对于仅点云的检测遇到了瓶颈,大家便想通过融合的方式开辟一些新的思路,这些早期的融合在一定程度上避开了仅点云检测的困难。但做融合的目的并不是对于点云的挑战避而不谈,而是采用图像去帮助点云克服这些困难,这也便是“卡脖子”所在,在解决这个问题之前,应明确一点,那便是无论是什么样的图像信息,都是为了点云服务,应搞清楚主次之分,3D检测永远是在点云空间进行!故近年的论文更强调将“融合”转换为“增强”,使用图像去直面解决点云的稀疏性和无序性,这些论文在思路上简单而又巧妙,他们的融合方式能够在任意网络间使用,这是20年前的论文所不具有的灵活性,这是一个很好的兆头,然而目前仍处于开放的话题,因此如何按照这个思路找到一种完美的融合策略,是科研工作者的挑战所在。

  随着在国际人工智能前沿领域涌现的大量华人科学家,解决L-C融合的“卡脖子”问题也便是如汤沃雪,最后使用中国科学院的一句办院方针结束这篇博客:面向世界科技前沿,面向国家重大需求,面向国民经济主战场,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。




https://wap.sciencenet.cn/blog-3499841-1316052.html


下一篇:论文写法总结——PointPainting: Sequential Fusion for 3D Object Detec
收藏 IP: 111.38.164.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 11:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部