MedImg:公共医学图像综合数据库
医学成像有助于定位病变和帮助诊断和治疗疾病,其中图像解释得出临床结论通常由医生进行。为了加快诊断过程并减少由于专业知识差异导致的假阳性/阴性结果,计算机辅助诊断系统应运而生。凭借自动化特征学习和非凡的性能,深度学习技术在医学图像分析领域,包括用于鉴别疾病的图像分类和正常个体,器官或病变检测以识别在完整图像上的小病变区域。图像分割用于将图像划分为多个段进行定位或定量分析,并配准以对齐更多跨模态或跨时间的图像进入一个坐标系。多种方法已开发出令人印象深刻的性能,特别是在图像分类和分割。例如,Zhu 等人提出了一种自动进化密集卷积网络(DenseNets),其性能优于区分急性呼吸道感染患者和非呼吸道感染患者的 ART 方法,以及能很好的对三种脑肿瘤类型进行分类。此外,用于对皮肤癌和良性痣进行分类的单卷积神经网络(CNN)已表现出与皮肤科医生相当的能力。开源人工智能 (AI)放疗图像分割(OSAIRIS)方法可精确分割癌性放疗前健康器官的区域,使专家放疗速度提高了两倍。尽管将深度学习算法应用于医学图像的研究呈爆炸式增长,将这些模型转化到临床实践仍然充满挑战。主要障碍之一是缺少大量可用图像数据,这对于通过训练、验证和测试挑选最优算法至关重要。
已经提供了几个收集大量医学图像的数据库。由美国国家癌症研究所(NCI)组织的癌症成像档案馆(TCIA)分享了来自大约 37,568 名癌症受试者的超过 3000 万张放射学图像。近日,NCI 癌症研究数据共享(CRDC) 发布了一个新的数据库,即成像数据共享(Imaging Data Commons,IDC)数据库。它将包括TCIA在内的癌症影像学收藏放在一起,拥有基于云的计算资源和数据分析工具。开放获取系列影像学研究(OASIS)平台包括丰富的神经影像学,具有多种模态数据集,涵盖3059个受试者。阿尔茨海默病神经影像学倡议(ADNI, http://adni.loni.usc.edu)数据库收集来自患有认知障碍或阿尔茨海默病的1700 多张的共振成像(MRI)和正电子发射断层扫描(PET)图像。OpenNeuro使用户公开共享大脑数据,并集成了 1066 个数据集,涉及超过40,000名的参与者。其他在线平台,例如国家心理健康数据档案研究所(NDA,https://nda.nih.gov/) 和图像数据档案(IDA),还集成了与大脑相关的图像和支持注册用户共享研究数据。国家胸部影像学数据库(NCCID)包括来自 7000 多名患者的各种胸部图像数据,该数据库的开发是为了改进急性呼吸道感染患者的医疗保健服务。大型在线Kaggle(http://www.kaggle.com)和Grand Challenge (https://grand101challenge.org/)举办数据科学竞赛,促进人工智能的发展算法并存储丰富的医学图像数据集。值得注意的是,大挑战具有专门解决医疗问题的各种挑战,使其成为一个为研究人员访问医学图像数据集的有价值资源。然而,这些数据集或大多数数据库主要关注单个器官/疾病或单个成像模态,这阻碍了广义深度学习模型的进步。开发一个全面且专业的平台是非常必要的,该平台需要包括来自不同模式、器官和地理区域的广泛医学图像。
为此,Zhong等人提出了 MedImg(图1,https://www.cuilab.cn/medimg/),这是一个在线医学图像数据库,它集成来自多个公共来源的各种医学图像数据集。MedImg 按器官和成像方式组织所有可用数据,使用户可以轻松浏览、检索、下载所有图像。此外,对于每个数据集,平台提供了详细的信息和示例图像以供预览。
图1 MedImg医学图像数据平台
参考文献
[1] Zhong B, Fan R, Ma Y, Ji X, Cui Q, Cui C. MedImg: An Integrated Database for Public Medical Image. Genomics Proteomics Bioinformatics. 2025 Aug 20:qzaf068. doi: 10.1093/gpbjnl/qzaf068.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
转载本文请联系原作者获取授权,同时请注明本文来自张俊鹏科学网博客。
链接地址:https://wap.sciencenet.cn/blog-571917-1503939.html?mobile=1
收藏