MDPI开放科学
COVID:基于症状特征精准界定长新冠——一项机器学习研究带来的新视角
2026-3-12 09:21
阅读:152
  • 研究背景

长新冠 (Long COVID) 作为SARS-CoV-2感染后持续存在的健康问题,已成为全球公共卫生的重要挑战。据美国2024年3月数据显示,约7%的成年人 (约1700万人) 受其困扰。尽管世界卫生组织 (WHO) 和美国国家科学院等机构已提出相关定义,但目前尚无统一、精准的病例判定标准。该研究通过结合症状频数与严重性的多维评估体系,利用机器学习方法,构建出一个高精度的长新冠诊断模型,为临床识别与干预提供科学依据。

         

  • 现有定义局限与研究创新

当前长新冠定义多依赖“症状是否存在”的二元判断,如Thaweethai等人提出的12症状评分系统 (得分≥12分的个体归类为患有长新冠),将“嗅觉/味觉丧失或改变”作为关键指标 (占12分中的8分)。然而,仅依赖“是否出现”忽略了症状的持续性与严重程度,可能导致诊断偏差。该研究在此基础上引入症状频数 (frequency) 与严重性 (severity) 的双维评估,并采用LASSO回归与留一交叉验证 (LOOCV) 进行特征选择与模型优化,显著提升鉴别能力。

         

  • 研究方法与数据构建

1.研究对象

长新冠组:55例,经问卷、访谈、医学检查与实验室检测系统确认。纳入标准包括核酸/抗体检测阳性,且症状持续≥3个月,并排除其他可能解释症状的疾病。

康复对照组:55例,在性别、年龄、种族方面与病例组匹配。

2.症状评估工具

使用DePaul症状问卷 (DSQ) 及DSQ-COVID扩展版,涵盖38项常见长新冠症状。每项症状按频数 (0–4分) 与严重性 (0–4分) 分别评分,每项症状的综合评分通过计算其频数和严重程度的平均值,然后乘以25得出范围为0–100的综合分,高分代表症状更频繁/更严重。

3.数据处理与模型构建

针对数据缺失问题,该研究采用配对填补策略,保持频数与严重性间的内在关联。使用LASSO回归进行变量筛选,并通过ROC曲线确定最佳诊断阈值。为提升小样本稳定性,采用110次LOOCV模型平均系数,最终生成整数化症状权重评分系统。

        

  • 主要研究发现

1. 关键症状及其权重

模型识别出以下症状对区分长新冠与康复者最具鉴别力:

表1. 关键症状及其权重

2 (2).png

           

表2. 使用频率与严重程度指标定义长新冠的症状

2 (2).png

          

2. 诊断公式与阈值

患上长新冠的可能性计算公式为:

患上长新冠的可能性 = (6) × (呼吸困难综合症状) + (5) × (胃肠道综合症状) + (3) × (嗅觉和味觉综合症状) + (2) × (头晕综合症状) + (2) × (腿部沉重综合症状) + (2) × (身体疲惫综合症状) + (2) × (鼻塞综合症状) + (1) × (肌肉疼痛综合症状) + (1) × (视力问题综合症状) + (1) × (食欲不振综合症状) + (1) × (注意力不集中综合症状)

当总分≥530分时,诊断为长新冠的准确率为90.91%,灵敏度为89.09%,特异性为92.73%。

          

2 (2).png

图1. 利用评分模型识别长新冠的最佳阈值

         

  • 讨论与意义

症状评估维度的重要性:与以往研究相比,该研究降低嗅觉/味觉变化的权重,提升胃肠道症状的鉴别价值。这说明仅凭“是否发生”可能高估某些症状的普遍性,而加入频数与严重性评估能更真实反映长新冠的临床表型。

宽严定义的平衡:长新冠已报告超200种症状,过于宽松的定义虽灵敏度高,但易将其他疾病 (如心因性症状) 误判为长新冠,导致特异性下降。该研究通过量化评分与设定阈值,在灵敏与特异之间取得良好平衡,有助于减少误诊与疾病污名化。

临床与科研启示:

诊断工具化——该研究提供的评分公式可发展为临床自评或医师评估工具。

研究方向——未来需扩大样本多样性,纳入未感染对照组,并探索生物标志物,以进一步提高诊断客观性。

       

  • 结论与展望

这项研究为长新冠的精准识别开辟了一条有前景的道路。通过系统收集症状频数与严重性数据,并运用机器学习方法,该研究构建了一个高精度、可操作的长新冠病例定义模型。该模型不仅为临床诊断提供量化工具,也为后续病因研究、治疗策略制定及公共卫生政策规划奠定基础。

    

阅读英文原文:https://www.mdpi.com/3635438

       

  • COVID 期刊介绍

COVID (ISSN 2673-8112) 是一个同行评审的开放获取 (Open Access) 期刊。本刊旨在建立一个先进的多学科论坛,专门用于研究冠状病毒 (Coronaviruses)、冠状病毒相关疾病及其对全球的深远影响。

我们的目标是覆盖冠状病毒研究的方方面面,出版涵盖从基础分子生物学和临床研究,到与疫情相关的公共卫生、生理与心理健康、经济与环境影响,以及受冠状病毒影响的其他所有领域的学术成果。

COVID 诚邀广大学者提交以下类型的稿件:

原创研究论文 (Original Research Articles);

综述 (Reviews):欢迎投递非特刊 (Special Issues) 范围内的综合性综述;

简报 (Communications / Brief Reports);

其他类型文章:包括述评、书评等。

     

我们鼓励科学家尽可能详细地发表其实验和理论结果。为确保研究的可重复性,作者必须提供完整的实验细节。对于无法在正文中展示的大型电子文件、软件及视频等资料,可作为补充材料  (Supplementary Material) 在线发布。

为什么选择在 COVID 发表?

多学科视角:打破学科壁垒,通过多领域交叉研究应对全球卫生挑战。

开放获取:文章一旦发表,全球读者均可免费、立即访问,提升学术影响力。

出版高效:专业的编辑团队与严谨的同行评审流程,确保稿件得到快速处理。

资料详尽:支持丰富的补充材料形式,全方位展示科研产出。

期刊主页:https://www.mdpi.com/journal/covid

2026-01-20_banner.jpg

转载本文请联系原作者获取授权,同时请注明本文来自MDPI开放科学科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3516770-1525447.html?mobile=1

收藏

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?