引用本文
石保顺, 舒元飞, 姜轲, 苏月明. 基于伪影提示的稀疏角度CT金属伪影校正方法. 自动化学报, 2025, 51(8): 1800−1810 doi: 10.16383/j.aas.c240462
Shi Bao-Shun, Shu Yuan-Fei, Jiang Ke, Su Yue-Ming. Sparse-view CT metal artifact reduction method based on artifact prompts. Acta Automatica Sinica, 2025, 51(8): 1800−1810 doi: 10.16383/j.aas.c240462
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c240462
关键词
稀疏角度CT重建,金属伪影校正,提示学习,Transformer
摘要
联合稀疏角度CT重建和金属伪影校正任务旨在通过受金属迹污染的少视角投影数据重建高质量的CT图像. 现有稀疏角度CT重建方法和金属伪影校正方法通常依赖于CT图像或投影数据, 但其存在临床投影数据难以获取和校正精度差的问题. 为解决这些问题, 提出一种基于伪影提示Transformer的图像域方法, 仅利用受伪影影响的CT图像即可同时实现稀疏角度CT重建和金属伪影校正. 该方法将伪影区域作为提示, 并将提示特征融入Transformer提取的特征中, 提出伪影提示Transformer架构. 该架构能够通过伪影区域特征提示, 利用伪影区域和非伪影区域之间的全局上下文相关性提升伪影校正精度. 针对多种伪影校正问题, 在包含伪影的CT图像上构建伪影区域估计网络来估计伪影区域, 并设计由局部信息提取模块、伪影区域注意力模块和通道注意力融合模块构成的局部−全局信息交互网络来融合局部与全局信息. 实验结果表明, 该方法能够同时进行高精度CT重建并有效去除金属伪影.
文章导读
X射线计算机断层扫描(Computed tomography, CT)是一种广泛应用于临床、生物学和医学领域的无创成像技术, 但长时间的辐射暴露会增加患癌风险[1]. 稀疏角度CT (Sparse-view computed tomography, SVCT)采样能有效降低辐射剂量并缩短扫描时间, 其在扫描器旋转扫描时, 通过在特定角度位置遮挡X射线源以阻止部分X射线穿过被扫描部位. SVCT采样获得的是稀疏投影数据, 不可避免地会降低CT图像的质量, 并导致严重的条纹伪影. 当患者体内携带金属植入物时, 由于射束硬化和光子饥饿的影响, CT图像上叠加金属伪影, 这将严重影响医生诊断. 原始CT图像、SVCT图像和受金属植入物影响的SVCT图像如图1所示. 从图1(b)可以看到稀疏角度采样重建的图像中显现出条纹伪影. 此外, 在SVCT采样和金属植入物的双重影响下, 金属伪影的出现导致伪影进一步加重, 极大地降低了图像质量, 如图1(c)所示. 因此, 对于联合SVCT重建和金属伪影校正(Sparse-view CT reconstruction and metal artifact reduction, SVMAR)任务, 探索如何实现高质量的CT图像重建具有重要意义.
图 1 不同情况下重建图像的对比 ((a) 原始CT图像; (b) 稀疏角度采样下重建的CT图像; (c) 稀疏角度采样下重建的含金属植入物的CT图像)
对于SVCT重建任务, 现有的基于深度神经网络(Deep neural network, DNN)的方法展现出较好的重建性能, 它们可以按照不同的领域知识分为以下三类: 投影域方法、图像域方法和双域方法. 投影域方法通常通过U-Net[2]和空间通道注意力网络[3]等深度神经网络对稀疏角度投影数据进行修复, 再利用滤波反投影(Filtered back-projection, FBP)[4]算法重建CT图像. 图像域方法无需使用投影数据, 而是通过构建的网络架构[5−7]直接从退化的图像中学习干净的CT图像. 此外, 双域方法运用投影数据与CT图像之间的相互学习机制进行双域重建[8−11].
对于金属伪影校正(Metal artifact reduction, MAR)任务, 基于深度学习(Deep learning, DL)的方法同样表现出较好的伪影校正效果, 也可分为以上三种类型. 投影域方法首先对投影数据进行校正, 再进行CT图像重建[12−13]. 基于图像域的方法构建多种网络架构, 如数据驱动的残差网络和基于模型可解释的深度神经网络[14−16], 用于从受金属伪影影响的CT图像中学习伪影减少的图像. 为进一步提高校正精度, 双域方法[17−18]利用双域信息进行MAR, 并表现出卓越的性能.
在稀疏数据采样与金属植入物的共同影响下, CT图像的伪影进一步加重, 使得SVMAR问题更具有挑战性. 迄今为止, 针对SVMAR问题的研究往往采用双域方法, 这些方法能充分利用双域知识恢复高质量的CT图像. 然而, 由于商业隐私问题, 所需的设备参数和投影数据在实际情况下难以获取. 因此, 双域方法在灵活性方面不如仅关注退化的CT图像的图像域方法. 尽管图像域方法具有上述优势, 它们在伪影校正精度上仍有很大提升空间, 主要面临着以下三大局限性: 1)它们通常依靠卷积神经网络(Convolutional neural network, CNN)来提取局部图像细节, 但有限的感受野会限制恢复图像在伪影区域的细节保留; 2)这些方法无法对图像域内全局分布的伪影进行精确建模, 并且由于缺乏对每个像素的自适应处理, 通常会生成过度平滑的图像; 3)忽略伪影的位置信息对伪影校正的重要作用. 为解决上述问题, 本文尝试直接对CT图像的伪影区域进行估计, 并利用伪影区域和非伪影区域之间的全局上下文相关性来辅助伪影校正.
作为大模型的核心技术, 提示技术已被广泛应用于图像恢复(Image restoration, IR)领域, 并取得巨大的成功. AirNet[19]和PromptIR[20]等算法从输入图像或网络的特征输出中自适应地提取信息作为提示, 并通过大量样本学习不同IR任务的判别信息, 最终将其用于指导网络的训练. 这类方法被称为自适应提示学习方法, 它能够使网络更好地理解其下游任务, 从而极大地改善图像重建的效果.
受提示学习启发, 本文构建提示特征提取模块以自适应地从伪影图像中提取提示特征, 并将其融入网络中. 为校正多种伪影, 本文利用伪影特征提出基于伪影提示Transformer的图像域SVMAR网络, 命名为APFormer (Artifact-prompt based Transformer). 本文的主要贡献总结如下: 提出一种基于伪影提示Transformer的局部−全局信息交互网络, 该网络能有效地建模全局特征与局部特征之间的依赖关系, 并关注伪影区域的图像恢复. 为更充分地利用伪影区域信息, 本文设计伪影区域估计网络, 构建提示特征提取模块以自适应地从伪影图像中提取提示特征, 并将该提示特征融入Transformer提取的特征中. 该伪影提示使得整体网络通过非局部信息恢复伪影区域中的图像内容. 实验结果表明, 本文方法在定性和定量结果两方面均优于现有方法.
图 2 基于伪影提示Transformer的网络架构
图 3 在ARAM模块中对两个关键点(红、黄)在伪影与非伪影区域之间的相关映射进行可视化 ((a) 伪影图像; (b) 红色点对应的注意力映射; (c) 黄色点对应的注意力映射)
为提高伪影校正精度, 本文提出基于伪影提示Transformer的稀疏角度CT金属伪影校正方法. 该方法能够融合全局信息与局部信息, 从而可以有效地建模伪影区域与非伪影区域之间的全局上下文相关性, 以促进伪影区域的恢复. 此外, 本文利用估计的伪影掩膜作为提示以自适应地提取任务类型信息, 网络的性能因此得到显著提升. 大量的实验表明, 本文方法在定性和定量方面都优于目前最先进的SVMAR方法.
作者简介
石保顺
燕山大学信息科学与工程学院副教授. 主要研究方向为医学图像处理, 深度字典网络和计算机视觉. 本文通信作者. E-mail: shibaoshun@ysu.edu.cn
舒元飞
燕山大学信息科学与工程学院硕士研究生. 主要研究方向为计算机视觉和医学图像处理. E-mail: syfei@stumail.ysu.edu.cn
姜轲
燕山大学信息科学与工程学院博士研究生. 主要研究方向为医学图像处理和深度字典网络. E-mail: jiangke@stumail.ysu.edu.cn
苏月明
北京物资学院信息学院讲师. 主要研究方向为数字图像处理和压缩感知. E-mail: suyueming@bwu.edu.cn
转载本文请联系原作者获取授权,同时请注明本文来自Ouariel科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3291369-1503505.html?mobile=1
收藏