||
人工智能(AI)已经越来越广泛的融入医学领域的临床诊断和治疗。了解AI在具体疾病诊疗中的介入模式,有助于我们对AI如何在医学领域发挥作用的理解,帮助我们在医疗护理中正确使用AI这种强大的智能工具。
LUCID 是新近开发的一项开创性的多模式人工智能(AI)框架,旨在通过整合多模式数据,精准预测肺癌患者的 EGFR 突变状态和生存结果,为精准肿瘤学以及个性化治疗方案的制定提供了极具可扩展性的工具。LUCID 能够同时处理四类关键数据:肺部 CT 影像,可敏锐捕捉其中存在的肿块或异常区域;患者主诉,涵盖如 “胸痛 10 天” 等详细的症状描述文本;实验室检查结果,包含血常规等多达 92 项指标;人口学信息,涉及年龄、性别、吸烟史等。
LUCID 模型的 AI 整合分析过程采用两阶段架构,借助多模态数据融合与分层注意力机制,实现肺癌的精准诊断与预后预测,具体步骤如下:
阶段 1:CT 图像筛选与特征提取
CT图像预处理:将肺部CT图像统一调整为256×256像素,随即随机裁剪为 224×224 像素的图像补丁,并通过水平翻转和旋转操作,极大增强了数据的多样性。在验证阶段,采用中心裁剪的方式,确保评估过程的一致性。
基于 Vision Transformer(ViT)的病变识别:首先,利用ImageNet-1000数据集对ViT进行预训练,而后采用华西医院56例患者的4099张CT图像(其中 447张标注有病变)进行微调。通过ViT将CT图像分割为 16×16 像素的补丁,进而生成特征向量,再经多层感知器(MLP)将其分类为“正常”或“可疑病变”,筛选出的可疑CT图像将进入下一阶段。此阶段的准确率 AUC 高达 0.957,F1分数达到 0.878 ,能显著减轻放射科医生的阅片负担,极大提升工作效率。
阶段 2:多信息 “综合推理”
将 CT 特征、患者症状主诉文本、实验室检查数据以及个人人口统计学信息,一同输入特制的AI“推理引擎”(Transformer 架构),借助 “交叉注意力” 和 “联合注意力”机制,实现不同信息之间的深度交互与融合,最终对两个关键问题进行推断:
EGFR 基因突变预测:精准判断患者是否携带 EGFR 敏感突变(如 exon19 缺失、L858R),准确率 AUC 达到 0.881,相较于单独依据 CT 影像或化验单进行判断,具有更高的准确性。
生存时间预测:对患者 1 年、3 年、5 年的生存概率进行预测,其中 5 年预测AUC高达0.912 ,能够为医生提供关键信息,以准确判断病情的严重程度。同时,将人口统计学等信息标准化后转为 768 维向量。
分层注意力机制融合:
交叉注意力模块(前3层):采用 AdamW 作为优化器,设置初始学习率为 1×10⁻⁵,权重衰减为 1×10⁻² 。通过多任务联合优化损失函数,其中包含主损失(多模态融合结果)和辅助损失(CT与临床嵌入的分类损失),确保各模态特征在融合前能够保持良好的判别性。在这一模块中,CT 图像嵌入与临床嵌入(文本 + 检验)互为查询(Q)、键(K)、值(V),从而有效捕捉模态间的依赖关系,通过注意力机制显著增强跨模态信息交互。
联合注意力模块(后9层):将交叉注意力后的 CT 与临床嵌入进行融合,借助多头注意力(MHA)进一步提取全局关联特征。最终,与人口统计学嵌入进行拼接,经 MLP 分类层输出 EGFR 突变预测或生存风险评分。
检测任务结果:
EGFR 突变预测:在区分 EGFR 敏感型(如 exon19 缺失、L858R)与耐药型方面,内部测试队列(华西医学院 5175 例患者)的 AUC 达到 0.881,明显优于纯影像模型(AUC 0.822)和纯文本模型(AUC 0.669)。外部验证队列(中山大学医院 1285 例患者)的 AUC 为 0.876,研究发现实验室数据缺失对模型性能的影响最大(ΔAUC 0.094)。
生存时间预测:运用 Kaplan-Meier分析与对数秩检验,对 1年、3年、5年生存预测的 AUC 分别为 0.821、0.884、0.912 ,风险分层效果显著。
模型鲁棒性与创新点:模型具备出色的单模态适应性(鲁棒性 robustness,即模型在面对数据噪声,如样本标注错误、数据缺失值、添加干扰信息的数据,以及数据分布变化,如训练集和测试集的数据分布不一致等情况时,依然能够保持良好的泛化能力和预测准确性)。当仅输入 CT 图像时,AUC 可达 0.822(纯影像模型为 0.803),文本输入时 AUC 为 0.669(纯文本模型为 0.657),充分体现了跨模态的知识迁移能力。
问题 1:EGFR 突变预测,还需要基因测序数据吗?
AI response:LUCID 模型预测 EGFR 突变无需直接依赖基因测序数据,而是通过整合多模态临床数据,实现无创预测。其预测逻辑基于临床数据与基因突变之间的间接关联。举例来说,EGFR 突变型肿瘤在 CT 影像上可能呈现出如磨玻璃结节等特定形态,同时伴随着特定实验室指标(如炎症因子水平)的异常,模型通过学习这些关联模式,从而实现对 EGFR 突变的预测 。
问题 2:基因测序不是更准确吗?价格也便宜了,为什么不去做基因测序呢?
AI response:尽管基因测序(如 NGS)是 EGFR 突变检测的金标准,且价格逐渐降低,但 LUCID 模型等无创预测方法仍具有不可替代的临床价值,原因如下:
基因测序的局限性与临床痛点
有创风险:组织活检需要通过穿刺、手术等方式获取肿瘤样本,这可能引发如出血、感染等并发症,对于晚期或体弱患者而言,风险更高 。
检测局限性:液体活检(如 ctDNA)虽为无创检测手段,但存在肿瘤异质性问题,若肿瘤细胞释放入血的 DNA 量不足,可能导致假阴性结果(如 EGFR 突变丰度低于检测阈值时出现漏检)。
时间成本:测序流程(从样本制备到生信分析)通常需要 3 - 7 天,这可能延误紧急治疗,比如晚期患者急需快速启动靶向治疗,却因等待测序结果而错过最佳时机 。
经济负担:单次 NGS 检测费用在不同地区虽存在差异,但仍约数千元,对于经济条件有限或医保覆盖不足的患者来说,是一笔不小的负担 。
操作难度:部分患者肿瘤位置特殊(如靠近大血管),活检操作难度极大,或者因肿瘤体积过小,无法获取足够的样本 。
动态变化问题:在治疗过程中,肿瘤突变可能会动态变化(如出现 T790M 耐药突变),多次测序不仅成本高昂,而且患者的依从性较低 。
LUCID 模型的互补价值:无创预测的临床场景
早期初筛与治疗决策加速:对于 CT 提示可疑肺癌的患者,LUCID 可在 24 小时内预测 EGFR 突变概率,帮助医生迅速优先选择治疗策略。若预测为敏感突变,可提前启动 EGFR - TKI 治疗,无需等待测序结果,有效避免病情进展 。若预测为野生型,可尽早规划化疗或免疫治疗,减少治疗空窗期 。
减少不必要的活检:对于 LUCID 预测为 EGFR 敏感突变且临床特征典型的患者(如不吸烟的腺癌患者),可尝试 “无创治疗策略”,避免活检带来的创伤。研究显示,LUCID 预测 EGFR 敏感型的 AUC 达 0.881,具有较高的临床参考价值 。
动态监测与资源优化:在治疗过程中,LUCID 可通过定期获取 CT 和检验数据更新预测,辅助判断是否出现耐药情况(如生存预测恶化时提示可能需二次测序),从而减少重复测序次数 。对于基层医院或资源有限地区,LUCID 可作为 “预筛选工具”,仅将高怀疑病例转诊至上级医院进行测序,实现医疗资源的优化分配 。
AI-enabled molecular phenotyping and prognostic predictions in lung cancer through multimodal clinical information integration. Cell Reports Medicine. July 15, 2025
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-7-6 18:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社