heruspex的个人博客分享 http://blog.sciencenet.cn/u/heruspex

博文

新冠药物为什么不能完全依赖双盲试验 精选

已有 9886 次阅读 2020-2-25 08:59 |系统分类:科研笔记

可以说,双盲试验是保证统计意义上药物具有普适性的科学标准。 

如果没过通过双盲试验的,这种药物进入市场往往会具有一定的风险。 

然而,这是针对一般情况而言。但当如新冠病毒引发的疫情出现时,如何选择药物就需要做些调整。

首先,双盲试验存在伦理学的问题。试想,对于一群危重病人,在进行新药测试时,如果这个药物是有效的,那么,哪些病人该作为服用安慰剂的组呢? 

按金钱、按地位、按关系?显然没有唯一答案。 

在人工智能里有个经典的电车难题(Trolley Problem),可以和这个病人的选择等价。一个疯子把五个无辜的人绑在电车轨道上,此时一辆失控的电车正向他们驶来。现在,你有权利选择换轨道,但问题是,疯子在另一个轨道上也绑了一个人。那,你怎么选择呢?

Picture1.png

                 1:人工智能里的电车难题

 

这同样是药物双盲试验的难点或不足。正因为如此,所以有的的时候,制药公司会在药物测试时做折衷或寻找替换方案。 

首先,可以考虑不选择危重病人做测试,这样一来可以避免危重病人的并发症干扰对药物性能的评价,二来也可能降低伦理问题带来的风险。其次,当双盲试验已经验证了药物是显著有效的时候,可以马上终止试验,对安慰剂方也开始给药。第三,对病情发展特别快且时间不等人的情况,以及病例相对少见的情况,直接采用没有平行对照的单臂临床试验 (Single Arm)。单臂的好处是研发周期短、费用低,可以很快得到药物是否有效的证据。而且,它也比较好的避免了伦理上的不合理性。比如目前新冠的治疗中,很多已经获准上市的药就在采用单臂测试来评价其治疗的有效性。单臂的不足在于难以判断药物的真实有效性。比如新冠轻症患者,也许病情的治愈是因为自身的免疫系统已经起作用了,而用药与否并不影响患者的康复。所以,单臂试验可以作为药物的初筛。 

当然,也不能说双盲试验就一定是绝对的黄金准则,因为它涉及到一个统计显著性的定义问题。粗略来说,我们是要求用药方的有效性明显超越某个值时,比如统计上常用的p-valuep值)小于0.05,才能判定该药物的效果与安慰剂存在显著差异。

然而,关于这个值,统计上两个流派“频率派”和“贝叶斯派”的看法是不同的。 

这两个流派的最大区别在于,是否承认先验。 打个比方来说,就是前一次买彩票的情况会不会影响下一次买彩票的中奖率。频率派是不相信先验的,而贝叶斯派则认同先验的存在。关于这一问题,两大流派自贝叶斯派诞生至今已经争论了250多年,也没有达成一致。 

相对药物测试来说,就有个比较有意思的现象。比如某种药物在9年的药物测试中,由于测试人数的数量原因始终无法在统计上验证统计上是显著的,而到第10年时,人数增加一些后,就超过了这个显著有效性的临界值。按统计意义来看,这个药应该就可以上市用了。可是,如果负责管理药物上市的人刚好是个频率派的,他很可能会以不应该考虑这种先验性来拒绝药物的上市。

另外,统计上的显著有效性还有个不足,就是整体与个体的差异。 某些药对某些人群很适合,但对其它体质的人群则不适用且存在风险,因此,按统计显著性来看,这个药是不应该上市的。可是,如果能准确判断哪些人适用的情况下,是否也可以考虑部分用药呢,尤其在情况比较危急的时候。 

这大概就是,我们可以看到的双盲试验的利与弊了。

 

张军平

2020225

 

前文阅读 

新冠药物为什么要做双盲试验

 

要检验一个药物是否有效,通常我们的意思是具有通用性或统计上有意义,而非是只针对某个人。

因为个体的差异比较大,有的时候A好了,并不意味着在B身上也适用。

另外,从某种意义来讲,人类从生病中恢复,免疫系统的功能占主要因素,药物多是助一臂之力。所以,有的时候,意志力强也能起到一定的作用。比如新冠疫情中,有不少恢复过来的人都提到了“千万不要睡”、“要主动呼吸”。

还有一种情况是药物只是安慰剂,但受心理暗示的影响,使它产生了一些“效果”,病人自我感觉良好,但实际无帮助。

所以,要让药物真正在统计上有效,我们就必须有一套更为客观的标准来评价。可是好不好,本身又带有病人感觉的主观性。怎么去掉主观性呢?

一个合理的策略是双盲,即制药公司在发放测试药物的时候,会将安慰剂药物和实际药物做到不可区分,让病人和参与测试的医生都不清楚病人服用的是实际药物还是安慰剂,同时对一定数量的病人做随机分组,一些服用安慰剂,另一些组给予不同剂量的药物。其间,不得向参与医生或向病人透露是否服用了真正的药物。

在进行完一定的疗程后(比如新冠的某新药测试要到427日结束),然后制药公司再根据其掌握的数据来进行分析,得出结论是否有效。

但这里有两点需要注意:

一、对统计的有效性或显著性似乎与参与病人的数量有关系,对这一关系的认识,统计上的两大流派“频率派”和“贝叶斯派”,看法是不同的。

二、在疫情发展比较迅猛的时候,我们有时候是无法用这种耗时较长的双盲测试来检测一个药物具有统计意义的有效性,因为时间不等人。所以,只能因人而异的、根据以往的经验去尝试一些可能有用的药物和治疗方案。即使这些方案不见得具有普适性,也必须先摸着石头过河。

 

张军平

2020224

 




https://wap.sciencenet.cn/blog-3389532-1220271.html

上一篇:读研秘技十七:虎头蛇尾与画蛇添足的结论
下一篇:读研秘技十八:完美主义的排版
收藏 IP: 101.87.253.*| 热度|

16 武夷山 冯大诚 周忠浩 黄永义 郁志勇 文克玲 曾杰 蔡小宁 吕秀齐 蔡宁 李剑超 许培扬 刘山亮 田云川 谢蜀生 赵凤光

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 12:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部