Chenfiona的个人博客分享 http://blog.sciencenet.cn/u/Chenfiona

博文

澳大利亚国立大学Nick Barnes团队 | 对息肉分割的再思考: 从分布外视角展开

已有 74 次阅读 2024-7-25 15:46 |个人分类:好文推荐|系统分类:论文交流

标签.jpg

澳大利亚国立大学Nick Barnes教授团队通过一种简单而高效的自监督学习方法,从分布外视角重新思考结直肠息肉的分割问题。与现有的全监督方法不同,本文利用掩码自动编码器——一种在重建任务上进行训练的自监督视觉变换器——来学习分布内特征表示,即健康结肠图像的分布。然后,本文执行分布外重建和推理,通过特征空间标准化将多样化异常样本的潜在分布与健康样本的统计量相对齐。通过计算输入图像与重建图像之间的差异,为图像生成逐像素异常分数,并使用此信号进行分布外(即息肉)分割。在六个基准实验上的结果表明,本文的模型具备出色的分割性能,并且能够在不同数据集之间进行泛化。

本文代码公开可用,地址为

https://github.com/GewelsJI/Polyp-OOD.

Springer截图.jpg

图片来自Springer

全文下载:

Rethinking Polyp Segmentation From An Out-of-distribution Perspective

Ge-Peng Ji, Jing Zhang, Dylan Campbell, Huan Xiong & Nick Barnes

https://link.springer.com/article/10.1007/s11633-023-1472-2

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1472-2

全文导读

结直肠癌是全球癌症相关死亡的第三大原因。结肠、直肠癌在早期局限期的5年生存率分别高达91%、90%。然而,根据美国癌症协会维护的SEER统计数据,结直肠癌在区域转移(72%、74%)和远处转移(13%、17%)期的生存率显著下降。从临床实践来看,定期的结肠镜检查对于癌症预防至关重要,旨在发现和去除癌前息肉生长(例如异常的结肠或直肠息肉)以防止其恶变。此过程通常依赖于医生的经验,而经验不足的医生可能无法识别癌前病变状况,自动化息肉分割技术应运而生。

在过去的几十年里,研究人员广泛探索了数据驱动范式,即使用全监督策略来分割结直肠息肉。然而,它们都存在一些数据方面的限制:1)数据多样性不足:由于在结肠镜检查中息肉出现的频率较低,很难收集到多样化的阳性样本(即息肉样本),而阴性样本则相对容易收集;2)标注成本高:只有经验丰富的医生才能为医疗图像提供真实标注,这导致数据标注成本高昂。为缓解上述问题,数据高效学习成为一种潜在的解决方案,即发挥智能学习器本身的潜力,减少人工监督,例如半监督和弱监督策略。然而,这些方法在训练过程中仍然需要大量的阳性样本。此外,与全监督环境相比,半标注或弱标注的数据可能会导致更严重的模型偏差。

另外,还可以选择无监督异常分割方案,即在分析异常样本时,专门对正常结肠镜检查图像进行训练的模型可以识别异常区域。此前的方法使用对比学习构建了一个单类分类器,其中设计了辅助预训练任务(例如使用合成或增强图像)来区分正常和异常模式。它们的性能高度依赖于设计精密的训练流程,并且存在过度拟合伪异常模式的风险。而基于重建的方法则是通过在医学图像上进行自监督训练来解决此类问题,其基本假设是训练重建分布内(ID)样本的自动编码器无法有效重建分布外(OOD)样本,即结直肠息肉。然而,最新研究表明,简单的自动编码器依然可以以相对较低的误差重建OOD样本,这表明该框架不能直接使用。为解决这一问题,Tian等研究者提出了一种基于掩码自动编码器的大掩码比率的记忆增强自注意编码器和多级交叉注意解码器,目的是在异常区域获得高重建误差。以往的研究通常使用不同的训练流程使模型的架构复杂化,与此不同的是,本文通过使用阴性(健康)样本使训练流程简化,然后执行数据自适应推断,以识别异常区域。

360截图20240703151421073.jpg

本文所提的息肉-OOD模型

本文认为,与健康数据相比,医学上的异常数据可以被视为分布外数据(OOD),这可以将结直肠息肉分割定义为逐像素的OOD检测任务。本文的基本假设是异常区域的分布与健康样本是不同的。遵循基于重建的检测原理,本文直接使用掩码自动编码器(MAE)的训练流程,并利用重建误差来分配异常分数。接下来,将推理任务转换为逐像素的OOD检测任务,这使我们能够从MAE的强大分布建模能力中受益。然而,本文发现结直肠息肉在外观上差异显著,其在隐藏空间有着非常不同的表征。这种情况下直接用MAE会出现问题,因为结直肠息肉特征没有紧密分布,导致网络识别它们的能力降低。为了解决该问题,本文提出执行特征空间内部标准化,从而生成分布紧凑且显著的结直肠息肉区域特征表示,以实现简单有效的推理。

本研究的主要贡献是:1)将息肉分割任务重新定义为分布外检测问题;2)使用掩码自动编码器学习健康样本的分布,通过易于获取的健康样本即可进行训练;3)验证特征空间标准化提高了网络推理时对于异常区域的识别能力,并且能够在不同数据集间泛化。本文所提方法在无监督异常(即息肉)分割方法中表现出色。

本文作者

作者团队.jpg

全文下载:

Rethinking Polyp Segmentation From An Out-of-distribution Perspective

Ge-Peng Ji, Jing Zhang, Dylan Campbell, Huan Xiong & Nick Barnes

https://link.springer.com/article/10.1007/s11633-023-1472-2

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1472-2

BibTex:

@Article{MIR-2023-06-092,

author={Ge-Peng Ji,  Jing Zhang,  Dylan Campbell,  Huan Xiong,  Nick Barnes},

journal={Machine Intelligence Research},

title={Rethinking Polyp Segmentation from An Out-of-distribution Perspective},

year={2024},

volume={21},

issue={4},

pages={631-639},

doi={10.1007/s11633-023-1472-2} }

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区。

片尾名片.jpg



https://wap.sciencenet.cn/blog-749317-1443716.html

上一篇:前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查
收藏 IP: 159.226.178.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-26 06:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部