|||
【CAA期刊】《模式识别与人工智能》第36卷 第9期
⭕ “基于深度学习的模式分类与检测“专题
高阶微分方程启发的红外小目标检测网络
张铭津1, 臧璠1, 岳珂1, 许嘉敏1, 李云松1, 高新波1
1.西安电子科技大学 通信工程学院 西安 710071
摘要: 红外小目标检测广泛应用于红外检测、红外跟踪等诸多实际领域,但红外小目标检测难度较大,现有红外小目标检测方法不能解决复杂背景问题,并且在特征提取中容易丢失细节信息.因此,文中提出高阶微分方程启发的红外小目标检测网络.在可解释的理论指导下设计四阶Adams引导的特征融合模块,引入自适应权重因子,有效融合不同层级的多尺度信息,并将求解的高阶差分方程应用于网络,通过深层次的学习消除冗杂信息.目标特征增强模块使用不同尺度卷积构成的残差结构,旨在对原始特征进行抑制背景噪声和增强信息量大的多尺度特征操作.在公开数据集SIRST上的小目标检测实验表明,文中网络检测结果的多个评估指标值以及视觉效果均较优.
关键词:红外小目标检测, 高阶微分方程, 特征融合, 特征增强, 多尺度特征
引用本文:
张铭津, 臧璠, 岳珂, 许嘉敏, 李云松, 高新波. 高阶微分方程启发的红外小目标检测网络[J]. 模式识别与人工智能, 2023, 36(9): 767-777.
ZHANG Mingjin, ZANG Fan, YUE Ke, XU Jiamin, LI Yunsong, GAO Xinbo. Infrared Small Target Detection Network Inspired by High-Order Differential Equation. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 767-777.
扫码阅读:
模糊逻辑引导的多粒度深度神经网络
周天奕1, 丁卫平1, 黄嘉爽1, 鞠恒荣1, 姜舒1, 王海鹏1
1.南通大学 信息科学技术学院 南通 226019
摘要: 准确识别和分类组织病理图像对于疾病的早期检测和治疗至关重要.病理医生诊断时通常会采用多层次的方式进行判断,即观察各个倍率下细胞的异常区域,然而现有模型通常只能在单一粒度上进行特征提取,忽略细胞的多粒度特性.因此,文中提出模糊逻辑引导的多粒度深度神经网络.首先,针对细胞的构造,在粗粒度、中粒度和细粒度这3个粒度层面上进行多粒度特征提取,充分利用病理组织图像中的信息.同时,针对多粒度特征提取时出现的关键信息冗余问题,引入模糊逻辑理论,设置多个模糊隶属函数,分别描述细胞在不同角度上的特征.然后,通过模糊运算得到模糊通用特征,由此设计模糊逻辑引导的交叉注意力机制模块,实现模糊通用特征对多粒度特征的引导.最后,通过编码器将特征扩散至所有的补丁令牌,获得较好的分类准确性和鲁棒性.实验表明,文中网络在组织病理图像分类上具有较高的准确率.
关键词:模糊逻辑, 医学图像分类, 特征融合, 特征提取, 注意力机制
引用本文:
周天奕, 丁卫平, 黄嘉爽, 鞠恒荣, 姜舒, 王海鹏. 模糊逻辑引导的多粒度深度神经网络[J]. 模式识别与人工智能, 2023, 36(9): 778-792.
ZHOU Tianyi, DING Weiping, HUANG Jiashuang, JU Hengrong, JIANG Shu, WANG Haipeng. Fuzzy Logic Guided Deep Neural Network with Multi-granularity. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 778-792.
扫码阅读:
基于自引导注意力的双模态校准融合目标检测算法
张惊雷1,2,3, 宫文浩1,2, 贾鑫3
1.天津理工大学 天津市复杂系统控制理论及应用重点实验室 天津 300384;2.天津理工大学 电气工程与自动化学院 天津 300384;3.天津理工大学 工程训练中心 天津 300384
摘要: 为了解决传统双模态目标检测方法难以在复杂场景(如大雾、眩光、黑夜)中克服低对比度噪声以及无法有效识别小尺寸目标的问题,文中提出基于自引导注意力的双模态校准融合目标检测算法.首先,设计双模态融合网络,利用通道特征和空间特征校准纠正输入图像(可见光图像与红外图像)中的低对比度噪声,从纠正后的特征中获取互补信息,并准确实现特征融合,提高算法在眩光、黑夜和大雾等场景下的检测精度.然后,构建自引导注意力机制,捕捉图像像素之间的依赖关系,增强不同尺度特征的融合能力,提高算法对于小尺寸目标的检测精度.最后,在行人、行人车辆、航拍车辆三类六种数据集上进行的大量实验表明,文中算法检测精度较高.
关键词:低对比度噪声, 目标检测, 双模态校准融合, 自引导注意力
引用本文:
张惊雷, 宫文浩, 贾鑫. 基于自引导注意力的双模态校准融合目标检测算法[J]. 模式识别与人工智能, 2023, 36(9): 793-805.
ZHANG Jinglei, GONG Wenhao, JIA Xin. Object Detection Algorithm with Dual-Modal Rectification Fusion Based on Self-Guided Attention. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 793-805.
扫码阅读:
时序动作单元感知的开集动作识别
杨凯翔1, 高君宇2, 冯洋博1, 徐常胜2
1.天津理工大学 计算机科学与工程学院 天津 300382;2.中国科学院自动化研究所 多模态人工智能系统全国重点实验室 北京 100190
摘要: 开集动作识别任务要求模型不仅能准确识别训练集中的类别,还能拒绝训练集上未出现的未知类动作.目前,大多数方法都将动作视为一个整体,忽略动作本身可被分解为更细粒度的动作单元.为此,文中提出时序动作单元感知的开集动作识别方法.首先,设计动作单元关系模块,学习细粒度的动作单元特征,得到动作和动作单元的关系模式,并通过已知类动作和未知类动作在动作单元上不同的激活程度识别未知类动作.然后,设计动作单元时序模块,建模动作单元的时序信息,研究动作单元的时序性,进一步区分因为外观相似而被混淆的已知类动作和未知类动作.最后,综合考虑关系模式与动作单元时序信息,使模型具备区分已知类动作和未知类动作的能力.在3个动作识别数据集上的实验表明,文中方法性能较优.
关键词:开集识别, 动作识别, 动作单元, 特征对齐, 时序感知
引用本文:
杨凯翔, 高君宇, 冯洋博, 徐常胜. 时序动作单元感知的开集动作识别[J]. 模式识别与人工智能, 2023, 36(9): 806-817.
YANG Kaixiang, GAO Junyu, FENG Yangbo, XU Changsheng. Temporal Action Unit Perception Based Open Set Action Recognition. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 806-817.
扫码阅读:
基于伪全局Swin Transformer的遥感图像识别算法
王科平1,2, 左鑫浩1,2, 杨艺1,2, 费树岷1,3
1.河南理工大学 电气工程与自动化学院 焦作 454003;2.河南理工大学 河南省智能装备直驱技术与控制国际联合实验室 焦作 454003;3.东南大学 自动化学院 南京 210096
摘要: 如何在多目标并列的情况下,确定符合人类思维习惯的核心目标是遥感图像识别的关键之一.因此,在全局视野下,为各目标分配符合人类视觉习惯的注意力,是甄选核心目标的有效途径之一.文中结合Transformer提取全局特征的思想和Swin Transformer对图像栅格化处理可降低计算量的优点,提出基于伪全局Swin Transformer的遥感图像识别算法.构建伪全局Swin Transformer模块,将遥感图像栅格化后的各局部信息聚合为一个特征值,替代以像素为基础的全局信息,以较小计算量为代价,获取全局特征,有效提升模型对所有目标的感知能力.同时,通过以可变形卷积为基础的感受野自适应缩放模块,使感受野向核心目标偏移,提高网络对核心目标信息的关注,从而实现对遥感图像的精确识别.在RSSCN7、AID和OPTIMAL-31遥感图像数据集上的实验表明,文中算法取得较高的识别精度和参数识别效率.
关键词:遥感图像识别, Transformer, Swin Transformer, 核心目标
引用本文:
王科平, 左鑫浩, 杨艺, 费树岷. 基于伪全局Swin Transformer的遥感图像识别算法[J]. 模式识别与人工智能, 2023, 36(9): 818-831.
WANG Keping, ZUO Xinhao, YANG Yi, FEI Shumin. Remote Sensing Image Recognition Algorithm Based on Pseudo Global Swin Transformer. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 818-831.
扫码阅读:
基于变分贝叶斯对比网络的非参数图像聚类方法
张胜杰1, 王一飞1, 向旺1, 薛迪展2, 钱胜胜2
1.郑州大学 河南先进技术研究院 郑州 450003;2.中国科学院自动化研究所 多模态人工智能系统全国重点实验室 北京 100190
摘要: 非参数图像聚类中聚类簇数是未知的,需要模型自动发现.虽然一些现有的贝叶斯方法可以自动推断聚类簇数,但由于计算成本过高或过于依赖已学习到的特征,在大规模图像数据集上并不可行.因此,文中提出基于变分贝叶斯对比网络的非参数图像聚类方法.首先,利用ResNet提取图像特征.然后,提出深度变分迪利克雷过程混合优化方法,自动推断聚类数量,可直接嵌入端到端的深度模型,并可与特征提取器进行联合优化.最后,提出极化对比聚类学习,利用极化标签去噪策略对标签进行去噪和极化处理,并利用极化标签与数据增强预测标签进行对比学习,联合优化图像特征提取器和分类器.在三个基准数据集上的实验表明,文中方法性能较优.
关键词:非参数图像聚类(NIC), 贝叶斯方法, 对比聚类, 极化标签, 变分方法
引用本文:
张胜杰, 王一飞, 向旺, 薛迪展, 钱胜胜. 基于变分贝叶斯对比网络的非参数图像聚类方法[J]. 模式识别与人工智能, 2023, 36(9): 832-841.
ZHANG Shengjie, WANG Yifei, XIANG Wang, XUE Dizhan, QIAN Shengsheng. Nonparametric Image Clustering Based on Variational Bayesian Contrastive Network. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 832-841.
扫码阅读:
⭕ 论文与报告
基于莫比乌斯陀螺矢量空间的双曲正定核
杨梅梅1,2, 方鹏飞1,2, 朱士鹏1,2, 薛晖1,2
1.东南大学 计算机科学与工程学院 南京 211189;2.东南大学 新一代人工智能技术与交叉应用教育部重点实验室 南京 211189
摘要: 层次结构数据广泛存在于各类机器学习场景中,双曲空间能够以极低的失真编码层次结构数据,引入核方法后,可进一步提高双曲空间的表征能力.然而,现有的双曲核仍然存在自适应能力较低或数据失真的缺陷.为了解决这些问题,文中提出基于莫比乌斯陀螺矢量空间的双曲正定核方法.利用莫比乌斯陀螺矢量空间与庞加莱模型之间的关系,构造莫比乌斯径向基核.具体使用莫比乌斯陀螺距离代替欧几里得距离,构造莫比乌斯高斯核和莫比乌斯拉普拉斯核,并进一步证明核函数的正定性.另外,将该核函数从复空间转换到实空间上,更适用于大多数机器学习任务.在多组真实的社交网络数据集上的实验验证文中方法的有效性.
关键词:双曲几何, 双曲核函数, 庞加莱模型, 正定核, 莫比乌斯陀螺矢量空间
引用本文:
杨梅梅, 方鹏飞, 朱士鹏, 薛晖. 基于莫比乌斯陀螺矢量空间的双曲正定核[J]. 模式识别与人工智能, 2023, 36(9): 842-855.
YANG Meimei, FANG Pengfei, ZHU Shipeng, XUE Hui. Hyperbolic Positive Definite Kernels Based on Möbius Gyrovector Space. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 842-855.
扫码阅读:
基于结构增强的异质数据联邦学习模型正则优化算法
张珉1,2, 梁美玉1,2, 薛哲1,2, 管泽礼1,2, 潘圳辉1,2, 赵泽华1,2
1.北京邮电大学 计算机学院 北京 100876;2.北京邮电大学 智能通信软件与多媒体北京市重点实验室北京 100876
摘要: 联邦学习中由于不同客户端本地数据分布异质,在本地数据集上训练的客户端模型优化目标与全局模型不一致,导致出现客户端漂移现象,影响全局模型性能.为了解决非独立同分布数据带来的联邦学习模型性能下降甚至发散的问题,文中从本地模型的通用性角度出发,提出基于结构增强的异质数据联邦学习模型正则优化算法.在客户端利用数据分布异质的本地数据进行训练时,以结构化的方式采样子网络,并对客户端本地数据进行数据增强,使用不同的增强数据训练不同的子网络学习增强表示,得到泛化性较强的客户端网络模型,对抗本地数据异质带来的客户端漂移现象,在联邦聚合中得到性能更优的全局模型.在CIFAR-10、CIFAR-100、ImageNet-200数据集上的大量实验表明,文中算法性能较优.
关键词:联邦学习, 非独立同分布(Non-IID), 数据异质性, 客户端漂移, 正则化
引用本文:
张珉, 梁美玉, 薛哲, 管泽礼, 潘圳辉, 赵泽华. 基于结构增强的异质数据联邦学习模型正则优化算法[J]. 模式识别与人工智能, 2023, 36(9): 856-865.
ZHANG Min, LIANG Meiyu, XUE Zhe, GUAN Zeli, PAN Zhenhui, ZHAO Zehua. Regularization Optimization Algorithm for Heterogeneous Data FederatedLearning Model Based on Structure Enhancement. Pattern Recognition and Artificial Intelligence, 2023, 36(9): 856-865.
扫码阅读:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-6-19 11:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社