资料来源:离床医学 2024年07月10日 00:00 云南
重症监护环境中的决策是复杂的,充满不确定性和压力。一名重症监护医生在查房6名患者时做出大约100个决定,在24小时轮班期间做出多达244个临时决定。其中大多数是诊断评估和治疗干预的复杂、事件驱动的组合。然而,重症监护医生相信证据会推动他们的临床决定。
认为证据触手可及,随时可用于支持临床决策的想法是一种错觉。PubMed 纳入了超过3500万项研究,现有搜索引擎效率低下。因此,从业者越来越依赖文献的一些综合来做出决策。教科书在印刷时通常已经过时。Cochrane图书馆包含大量系统综述,但其中只有不到500篇是关于重症监护相关主题的。通常情况下,meta分析表明,在早期试验中观察到的非常大的效应和死亡率获益,在后期试验中会减弱或完全消失。
即使是在最新综述中汇总的广泛文献,也往往不能很好地推断出个体的临床情况。根据编辑的判断进行更新,每 2 年对内容进行一次同行评审。最新综述涵盖约440种期刊,而目前已出版超过30,000种生物医学期刊。Up-to-Date还希望对其建议使用建议评估、开发和评估(GRADE)标准进行分级。但是,与所有其他对文献的系统评估一样,这些建议大多基于其作者和编辑人员的专家意见。最终,当需要快速决策时,经验丰富的重症监护临床医生被迫在不咨询现有证据的情况下做出所需的临时决策。
现有证据的价值是什么?临床问题的领域是广阔的;为他们提供信息的随机对照试验(RCT)数量有限且很少。更糟糕的是,这些研究中很少有完美无缺的,许多研究的效力不足,而且每天都有越来越多的这些试验变得过时。随机对照试验往往过于简单化临床现实的复杂性。进行高质量的重症监护试验非常困难。一般来说,重症监护试验面临着招募少数符合非常严格纳入要求的患者和大量满足更宽松要求的患者之间的权衡。严格的纳入导致招募率低,而且往往导致研究在完成之前就被淘汰或放弃。即使采用宽松的标准,大多数大型多中心试验也难以以每个中心每月约1例患者的速度招募具有常见诊断的患者。因此,大多数COVID-19前冠状病毒病(pre-coronavirus disease 2019,COVID-19)重症监护随机对照试验未能产生新的证据来指导医疗决策。
虽然所有重症监护期刊都支持CONSORT的声明,但一项研究表明,报告的完整性并未改善。患者群体选择得越少,就越难证明治疗的益处。这种现象首先由约翰·约阿尼迪斯(John Ioannidis)证明,并在《纽约客》上发表的一篇文章中进行了非常简洁的描述:“真相会消失”。事实上,对现有实践的肯定是非常困难的。此外,医生仍然不知道P值为0.05意味着什么;如果观察到的效应是实际效应,并且原始P值为0.05,则尝试复制该发现将在大约一半的时间内产生大于0.05的P值。在3年的多中心重症监护试验中可以找到这方面的证据,这些试验表明未能复制的做法,例如超生理氧合、围手术期β受体阻滞剂、激素替代疗法、严格血糖控制、急性呼吸窘迫综合征(ARDS)的高呼气末正压、早期目标导向治疗、重组人活化蛋白 C(APC)和治疗性低体温。
指南通常基于荟萃分析,因此被认为优于个人判断。在重症监护文献中系统评估meta分析质量的唯一综述已经有20年的历史了。报告显示,139份报告的审查质量总体较差。只有不到1/3的评价被评分为存在最小或轻微的缺陷。许多meta分析受到检索方法不佳的限制。在许多情况下,人群、干预、比较和结局(Population,Intervention,Comparison,and Outcome,PICO)要素在方案设计和发表之间会发生变化。最常见的变化之一是将具有统计学意义的次要结局提升为主要结局。
荟萃分析就像教科书一样,需要在很长一段时间内付出巨大的努力。像教科书一样,当它们最终公开时,它们也可能已经过时。它们也是资源密集型的,因此在财务上或后勤上对每个相关的临床问题进行荟萃分析是不切实际的。单个 PICO 搜索可能会产生 2,000-10,000个引用。这些参考文献由专家筛选并缩小到 100-300个参考文献。从任何符合标准的参考文献中提取数据需要进一步的专家工作。即使是被选中进行数据提取的少数论文也可能受到未解决的异质性和偏见的困扰。统计分析、写作和编辑审查都会造成进一步的延误和资源成本。整个过程可能需要长达 2 年的时间,最终许多荟萃分析只不过是肯定了专家从业者已经认为理所当然的事情。
这一现实的结果是,指南中的大多数建议往往不是基于高质量的证据。在缺乏高质量或决定性证据的情况下,专家们利用他们的经验和最佳判断来综合“最佳证据”。在目前被认为是我们最佳证据的文献中包含个人偏见导致了已故的卡瓦纳如此简洁地陈述的结论,即“......目前尚不清楚尽职尽责、明智、受过良好教育和经验丰富的临床医生的意见是否一定不如系统化的意见”。
最后,回答许多问题的成本可能大于知道答案的收益。较新的试验方法,包括连续的多种类型的补充研究系列、适应性和平台试验、临床试验与实践和核心结局集之间的更多整合,都反映了更好地模拟现实的尝试。然而,努力提高我们进行临床试验的速度可能会以更高的速度产生较低质量的证据。
随着我们对生物学的理解的提高,我们已经认识到许多综合征(急性呼吸窘迫综合征、脓毒症)具有不同的表型,不同的表型具有不同的病因,并且可能受益于不同的疗法。同样,人们越来越认识到许多常见疾病(例如糖尿病、哮喘)具有重要的不同表型,而这些表型又需要特定和不同的治疗方法。没有区分需要不同疗法的表型的旧临床试验已经过时。大多数此类试验可能纳入了无法获益甚至受到所评估干预措施伤害的患者(治疗效果的异质性)。具有象征意义的是,对试验数据的分析确实越来越多地接受不确定性,并改进了对异质性的探索。
更深入地了解疾病的机制将能够在更短的时间内以更少的患者开发更具体的疗法。基因组学、转录组学、蛋白质组学等组学研究将能够开发和改进比传统表型方法更具针对性的疗法。然而,目前仍缺乏用于识别表型的临床工具,目前尚不清楚表型是否以及如何用于指导治疗,而且这些工具目前在中等收入和低收入国家尚不可用。因果推断也可以从观测数据中得出。希望机器学习和大型语言模型的突破不仅会有所改善,而且会使所有人都能有效地利用这些数据。
从随机对照试验到个性化医疗
在此期间,许多科学学科无法进行随机试验来评估假设(例如进化生物学、天体物理学),而是应用Bradford-Hill标准来评估支持或反驳它们的假设和观察。Archie Cochrane指出,随机对照试验应“适当”应用。适当的应用意味着临床医生必须接受更好的贝叶斯思维教育,并且必须将他们对基础科学和临床科学的理解应用于特定患者(图1)。用第一临床流行病学系的创始主席David Sackett的话来说,“循证医学并不局限于随机试验和荟萃分析。如果没有临床专业知识,实践就有可能被证据所束缚。因为即使是优秀的外部证据也可能不适用于或不适合个体患者”。
来源:Einav. The limitations of evidence-based medicine compel the practice of personalized medicine. Intensive Care Med 2024;epublished June 27th.斌哥话重症
转载本文请联系原作者获取授权,同时请注明本文来自聂广科学网博客。
链接地址:https://wap.sciencenet.cn/blog-279293-1441684.html?mobile=1
收藏