|
论文赏析:
肺结节是良性还是恶性:基于甲基化标记物和影像学特征的鉴别模型
https://bmccancer.biomedcentral.com/articles/10.1186/s12885-021-08002-4
通过低剂量计算机断层扫描(LDCT)早期发现肺癌可以降低患者死亡率。但仅凭LDCT难以确诊肺结节的恶性和良性,对术前诊断是一项挑战。本研究的目的是建立一个基于DNA甲基化标记物和放射影像学特征的预测模型,用来判断CT发现的肺结节是良性还是恶性。
本文采用了四种建模方法来区分肺结节是良性还是恶性。模型变量包括3个基因的甲基化水平和不同影像学变量。金标准为组织切片的病理诊断结果。模型的性能表现用ROC分析的AUC值评判。
四种建模方法为:
K近邻法(KNN)
随机森林法(RF)
支持向量机法(SVM)
logistic回归法(LR)
一、试验设计
1、患者队列
根据样本量计算公式,检测10%的差异,需要91例样本。以此为依据,本研究收集了良性和恶性各100例左右。
肺结节患者合计 | 肺结节恶性患者 | 肺结节良性患者 | |
募集患者总数 | 210例 | 120 | 90 |
训练队列 | 110例 | 63 | 47 |
验证队列 | 100例 | 57 | 43 |
2、样本特征
样本类型 | 5毫升外周血/人 |
纳入标准 | (1)受试者在CT扫描中发现肺结节 (2) LDCT得出的结节直径在4到35 mm之间 , (3) 参与者的临床信息完整。 |
排除标准 | (1)怀孕或哺乳 (2) 当前肺部感染 (3) 6个月内手术 (4) 1年内放射治疗 (5)儿童的预期寿命< 1年 |
一般特征变量 | 年龄、性别、吸烟行为(吸烟状况、吸烟年限和戒烟后的年数)和癌症史。 |
影像特征变量 | 最大横径;位置;结节分型(非实性或磨玻璃病变、肺裂、部分实性、实性和毛刺状)。 |
3、诊断模型
DNA来源 | 血浆 |
DNA类型 | CfDNA(磁珠法提取) |
肿瘤标记物 | PTGER4、RASSF1A和SHOX2甲基化 |
检测方法 | 甲基化特异性荧光定量PCR检测 |
单个标记物甲基化水平 | 2-ΔCt,其中ΔCt=Ct标记物-Ct内标 |
样本甲基化水平 | 肺癌分析软件v2.2分析PCR输出,计算综合得分,反映标记物中的整体甲基化水平 |
建模参数 | 3个DNA甲基化标记物和患者临床变量 |
建模方法 | 4种机器学习预测模型:K近邻(KNN)、随机森林(RF)、支持向量机(SVM)和logistic回归(LR)算法。 |
模型优化 | 逐步回归法优化变量组成 |
模型性能评价 | 通过4折交叉验证得到ROC曲线下面积(AUC)。 |
最优模型 | 以3个甲基化位点和结节大小为变量构建的逻辑回归模型 |
*金标准:通过组织切片和病理诊断确诊肺结节是良性还是恶性。
结果
良性和恶性肺结节在PTGER4、RASSF1A和SHOX2基因的甲基化状态方面均有显著差异(图1)。
本研究首先以三个甲基化位点和所有影像学参数构建模型,在恶性结节诊断中的AUC值达0.951,显著高于3种DNA甲基化标记物模型(AUC值=0.912,95%可信区间:0.843–0.958,p=0.013)以及梅奥临床模型(AUC值=0.823,95%可信区间:0.739-0.890,p=0.001) (图2)。
同样基于3个甲基化标记物和影像学特征,用4种不同的方法,即K近邻(KNN)、随机森林(RF)、支持向量机(SVM)和logistic回归(RL)算法,建立预测模型在区分良性和恶性肺结节方面,具有明显的性能差异(表3)。SVM和RL法相对较优。
通过逐步回归筛选最佳变量,模型中减少了影像学参数。最后,以3个基因的甲基化水平和结节大小为变量构建的逻辑回归模型具有最佳效果 (AUC=0.951)。预测模型在100名受试者的测试队列中得到了验证,证实了其诊断价值。
结论
研究表明,结合DNA甲基化标记物和放射影像学特征可以更准确地识别肺癌,提高肺癌的诊断水平。
Wenqun Xing,et al.(2021) A prediction model based on DNA methylation biomarkers and radiological characteristics for identifying malignant from benign pulmonary nodules,BMC Cancer volume 21, Article number: 263 (2021).
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 03:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社