IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

【精选导读】深度神经网络在图像与目标跟踪中的应用

已有 1557 次阅读 2023-3-3 16:37 |系统分类:博客资讯

本期推荐3篇深度神经网络在图像与目标跟踪中的应用相关好文~

X. Y. Wang, J. Y. Ma, and  J. J. Jiang,  “Contrastive learning for blind super-resolution via a distortion-specific network,” IEEE/CAA J. Autom. Sinica, vol. 10, no. 1, pp. 78–89, Jan. 2023. doi: 10.1109/JAS.2022.105914 


Y. C. Li, W. B. Yu, and X. P. Guan, “Current-aided multiple-AUV cooperative localization and target tracking in anchor-free environments,” IEEE/CAA J. Autom. Sinica, vol. 10, no. 3, pp. 792806, Mar. 2023. doi: 10.1109/JAS.2022.105989



M. Liu and M. S. Shang, “On RNN-based k-WTA models with time-dependent inputs,” IEEE/CAA J. Autom. Sinica, vol. 9, no. 11, pp. 2034–2036, Nov. 2022. doi: 10.1109/JAS.2022.105932 




Contrastive Learning for Blind Super-Resolution via A Distortion-Specific Network


研究背景


单图像超分辨率(SISR)旨在从给定的低分辨率(LR)观测恢复高分辨率(HR)图像。该任务是医疗诊断、目标检测与识别等高级计算机视觉任务的先决条件之一。作为一个病态难的逆问题,SISR任务与图像退化过程高度耦合,具有高度不适定性,这需要在低级计算机视觉中进一步研究。解决SISR问题的一个流行策略是假定退化过程已知且固定,进而构造深度神经网络并通过数据驱动进行超分重构。因而,在相同退化过程评估的情况下,这类方法实现了客观指标结果的不断提升。然而,在真实场景中,由于成像和传输过程,图像退化模型通常多样且未知。现有单张超分算法中所采用的简单退化假设,与实际输入的退化之间往往不匹配。因而,即使退化过程稍有不同,这些方法的性能就会严重下降。这就给这些数据驱动的方法在实际应用中带来了困难。因此,近年来学者们开始关注退化过程未知的盲超分辨率问题,试图解决更加实际的超分问题(blind SR)。


成果介绍


为了使深度学习的超分辨率(SR)方法能够适应失真变化,武汉大学电子信息学院马佳义教授和哈尔滨工业大学计算机科学与技术学院江俊君教授联合提出了基于特定失真网络的盲超分辨对比学习方法--CRDNet。研究成果“Contrastive Learning for Blind Super-Resolution via A Distortion-Specific Network” 发表于IEEE/CAA Journal of Automatica Sinica 2023年第1期,DOI: 10.1109/JAS.2022.105914.

该模型将失真LR图像的全局统计信息作为先验信息,并对重建结果施加对比正则化,以解决blind SR问题,该问题由一个具有对比正则化的失真特定SR网络(称为CRDNe)实现。具有全局特征统计特性的均值对比度归一化(MSCN)系数可以大大减少邻域之间的依赖性,这是对神经网络中捕获的特征的补充。基于这一观察,作者将MSCN系数引入网络以提取全局先验,旨在捕获面向失真的全局统计特性,使SR网络对失真敏感,从而进一步提高网络的性能。为了减轻由像素损失引起的过度平滑的效果,该模型通过三重损失对结果图像进行对比学习的约束。如图1所示,预期中,对比学习会将超分辨率结果拉近高分辨率图像,推离特征域中的负样本,这将有利于盲超分预测结果更加清晰。

1-图1.png

图1  整体网络架构

所提出的方法在多种退化上的测试结果如表1和表2所示,从实验看出,该方法能实现更优且均衡的效果。超分辨率可视化结果如图2和图3所示。

表1  各向同性高斯核退化过程上的实验结果

1-表1.png

表2  各向异性高斯核退化过程上的实验结果

1-表2.png

1-图2.png

图2  无噪声退化的实验结果

1-图3.png

图3  噪声退化的实验结果

最后,本文将方法应用于真实场景图像中,超分辨率可视化结果如图4所示。

1-图4.png

图4  真实场景超分可视化结果


作者及团队


王歆雅武汉大学电子信息学院博士研究生。研究方向包括深度学习,图像超分辨率等。

江俊君哈尔滨工业大学计算学部长聘教授、博士生导师、智能接口与人机交互研究中心副主任,入选国家级青年人才计划。2014年12月于武汉大学计算机学院获得博士学位,2016年至2018年在日本国立情報学研究所担任特任研究员。研究方向主要包括图像处理、计算机视觉、深度学习。相关研究成果发表IEEE Transactions期刊论文和CCF A类会议论文70余篇,发表论文被谷歌学术引用9000余次,H因子为49,入选全球高被引科学家(2021年、2022年)和中国高被引学者(2020年、2021年)。出版人脸超分辨率和高光谱图象处理学术专著各1部,获得国家发明专利授权21项。担任Information Fusion、The Visual Computer、Remote Sensing等国际期刊编委和IEEE/CAA Journal of Automatica Sinica青年编委。曾获吴文俊人工智能优秀青年奖、中国计算机学会优秀博士论文奖、ACM-武汉优秀博士论文奖、湖北省优秀博士论文奖、ICME 2017最佳论文提名、MMM 2015最佳学生论文奖亚军、IFTC 2018最佳论文奖,2016年获湖北省科技进步一等奖。主持国家重点研发计划课题、国家自然科学基金青年/面上项目、黑龙江省自然科学基金优秀青年项目、中国人工智能学会-华为MindSpore学术奖励基金、哈工大青年拔尖人才支持计划项目。

马佳义,武汉大学电子信息学院教授、博导,入选国家高层次青年人才计划。2008年6月和2014年6月分别于华中科技大学获得理学学士和工学博士学位。攻博期间曾由国家公派赴美国UCLA联合培养一年,博士毕业后进入武汉大学任教,2018年晋升为教授。研究方向包括计算机视觉、模式识别、图像处理等。以第一或通讯作者在IEEE TPAMI、IJCV、IEEE TIP、IEEE/CAA JAS等中科院一区TOP期刊或CCF A类会议上发表论文100余篇,谷歌学术引用15000余次,H指数63,2019-2022年连续入选科睿唯安全球“高被引科学家”,爱思唯尔“中国高被引学者”。曾以第1完成人获湖北省自然科学一等奖1项,获吴文俊人工智能优秀青年奖,获中国人工智能学会、中国自动化学会、湖北省优秀博士论文奖。目前担任Information Fusion期刊(IF=17.564)领域编辑,IEEE/CAA Journal of Automatica Sinica、Neurocomputing、GSIS、Front. Neurosci.等SCI期刊编委,《中国图象图形学报》青年编委。IEEE资深会员。

......................................................................................................................................................


Current-Aided Multiple-AUV Cooperative Localization and Target Tracking in Anchor-Free Environments


研究背景


水下航行器技术的快速发展使得自主水下航行器(AUV)在海洋应用中得到广泛应用。在大多数情况下,任务的完成基于AUV和目标的已知位置。因此,AUV定位和目标跟踪都是水下的基本技术,它们分别为其AUV和感兴趣的目标提供连续的位置估计。然而,由于定位系统、通信条件、水下环境等复杂因素,水下定位和跟踪一直是具有挑战性的问题。


成果介绍


为了提升AUV定位和目标跟踪的精度,上海交通大学关新平教授团队提出了一种基于粒子的协同定位和目标跟踪算法。研究成果“Current-Aided Multiple-AUV Cooperative Localization and Target Tracking in Anchor-Free Environments” 发表于IEEE/CAA Journal of Automatica Sinica 2023年第3期,DOI:10.1109/JAS.2022.105989.

将当前的测量和地图与BP相结合,提出了一种Current-Aided的BP消息传递方案,为解决当前信息的定位和跟踪问题奠定了理论基础。在该方案下,电流辅助协同定位(CaCL)和电流辅助目标跟踪(CaTT)算法是由粒子设计和实现的,并针对CaTT中的非合作目标跟踪,设计了一种基于当前信息的无模型预测过程。该过程由两部分组成,第一部分通过历史估计和当前地图计算,第二部分通过粒子随机演化获得。该设计可以稳定地提高跟踪精度,并为CaTT提供了对于不同目标运动和地图质量的良好适应性。


作者及团队


Yichen Li上海交通大学电子信息与电气工程学院自动化系博士研究生。2016年获得中国西北工业大学电子与信息学士学位。主要研究方向为水下移动机器人定位和轨迹规划、无线网络、信息融合。

Wenbin Yu,上海交通大学智能无线网络与协同控制中心副研究员。2016年获得上海交通大学自动化系博士学位。主要研究方向为AUV系统传感与控制。

Xinping Guan,上海交通大学教授,IEEE Fellow。1999年获得哈尔滨工业大学控制科学与工程博士学位。撰写和/或合著五本研究专著,在IEEE Transactions等期刊发表论文270余篇。目前主要研究方向为工业信息物理系统、无线网络及其在智慧城市和智慧工厂中的应用、水下传感网络等。

......................................................................................................................................................


On RNN-Based k-WTA Models with Time-Dependent Inputs


研究背景


Winner take-all(WTA)网络作为一种竞争性神经网络,在多个领域得到了广泛的应用。作为一种广义形式,k-WTA被广泛应用于竞争框架的建模,其中k表示优胜者的数量。例如k-WTA策略通常被用于多机器人的目标追踪。近年来,递归神经网络算法在求解在线优化方面取得了巨大成功。例如,借助鞍点定理的RNN模型被用来处理非凸优化问题,该问题可被应用于遗传调控网络的识别问题。简而言之,基于RNN的模型在处理优化问题方面表现出显著优势。鉴于k-WTA运算可以转化为约束优化问题,许多RNN算法被研究用于k-WTA系统的在线求解。然而现有的基于RNN的模型在时变输入的情况下处理k-WTA系统不可避免地存在滞后误差。


成果介绍


中国科学院重庆绿色与智能技术研究所重庆大数据与智能计算重点实验室针对现有基于RNN的k-WTA模型的弱点,提出了一种新的基于RNN的k-WTA模型,该模型在时变输入下能够消除滞后误差,并通过理论分析和仿真实验证明该模型的可行性和有效性。将所提出的基于RNN的k-WTA模型应用于多机器人系统竞争协同的目标追踪并通过实验验证其高效性。研究成果“On RNN-Based k-WTA Models With Time Dependent Inputs” 发表于IEEE/CAA Journal of Automatica Sinica 2022年第11期,DOI: 10.1109/JAS.2022.105932.

作者通过理论分析,验证了基于对偶神经网络的k-WTA模型在时变输入下存在滞后误差,构造了一个结构简洁的基于RNN的k-WTA模型,该模型在时变输入系统中能够消除滞后误差。此外,通过理论分析和仿真结果验证了所构建的基于RNN的k-WTA模型的有效性。通过理论分析证明了现有基于利普希兹连续性的RNN方案在执行时变输入的k-WTA系统时不可能有限时间收敛。并针对这种情况作者提出一种能够有效、高效地执行收敛速度要求的可行方案。最后将所构建的基于RNN的k-WTA模型应用于多机器人系统的目标追踪,仿真结果验证了其有效性。


3-图1.png

3-图2.png


作者及团队


Mingsheng Shang,中国科学院重庆绿色智能技术研究院研究员。工学博士,管理学博士后。2015年入选中科院高层次人才计划,现任大数据与智能计算重庆市重点实验室主任。主要从事物联网、大数据、人工智能、云计算等领域的研究工作。发表学术论文100余篇,获省部级一等奖3项,二等奖1项,主持各类项目30余项,申请发明专利60余件,出版专著4部。




https://wap.sciencenet.cn/blog-3291369-1378771.html

上一篇:基于共面圆的距离传感器与相机的相对位姿标定
下一篇:求解三维装箱问题的多层树搜索算法
收藏 IP: 159.226.177.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-14 19:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部