五千年(敝帚自珍)

主题:【原创】关于RCT与RWS -- 懒厨

共:💬132 🌺434 🌵16 新:
分页树展主题 · 全看
/ 9
下页 末页
  • 家园 【原创】关于RCT与RWS -- 有补充

    我已经很久没有正经写点东西了,国庆几天吃吃喝喝,现在终于有点闲暇,静下心来,网上看了一些资料,是之前最近我和中医粉争论的一个验药的方法问题。

    先把关键词解释一下:

    RCT (Randomised Controlled Trial)- 随机对照试验。

    RWS/RWD/RWE/RWR (Real World Study/Data/Evidence/Research)真实世界研究(数据/证据),四个简写说的是同一回事,以下使用RWS这个缩写。

    这两种都是方法而已,除了验药,我还见过社会问题的研究,也可以用这两种方法进行研究。而这里说的,涉及中西医之争,讨论限于验药的方法。通过一个例子来解释,应该是最容易理解的了,解释有误之处,恳请行家指点。

    假如有一个新药上市,声称可以治某个病,我们要如何检验这个药效呢?

    传统的做法,是使用RCT来验药,简单来说,做法如下:

    1. 招募病人,有鉴定过程,需要保证两组病人的患者特征基本一致;

    2. 将病人随机分成两组;

    3. 一组吃安慰剂,另一组吃新药;

    4. 负责的医生不知道某个病人吃的到底是安慰剂还是新药;

    5. 负责发药的人,也不知道新药和安慰剂分别发给了什么人;

    6. 疗程结束后,公布哪些病人吃了安慰剂,哪些病人吃了新药,然后对结果进行统计

    7. 最后,再根据统计结果,如果比安慰剂的一组高很多,即可视为有效。

    需要强调两点:

    1. 这个方法的模式基本是固定的,无论什么药,只要遵循这个模式,满足该模式下的各个具体要求,就能获得一个可靠的结果。

    2. 这个模式操作起来确实麻烦,之所以这么麻烦也要这么操作,是因为有两个因素必须排除,其一是人体有一定的自愈能力,其二是人体有一个安慰剂效应,假如一个人吃了药好了,其中的因果关系,要如何确认呢?到底是自愈,还是真的有效? RCT的方法,正是一个有效排除干扰因素的利器。

    这些年开始提出RWS的验药方法,主要的区别在于C字,Controlled, 这种验药的方法,就直接用药,也有对照组,以争议起点的清肺排毒汤为例,他们实际上就是安排了一些病人喝这个中药,另一些病人没有喝药,然后对上万个病历进行分析统计,虽然没有严格控制的对照组病人,他们从病历数据下手,尽力排除干扰数据,从而推出相应的结论。

    两种方法对比,很明显,无论数据如何挖掘,RWS方法里面,安慰剂效应是无法排除的,毕竟吃了药,听说这药有用,多少会影响病人的心理。这个不是我说的,是中医药抗疫的领军人士张伯礼说的,有截屏为证:

    点看全图

    于是,我接着上网调查,发现了这里有篇不错的文章, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6097073/

    想省时间的话,可以看两个表,第一个是两种方法的对比,

    点看全图

    我尝试翻译一下:

    对比项 RCT RWE
    目的 Efficacy 验证有效性 Effectiveness 验证效果
    设置 按实验设置 按真实世界情形来设置
    跟进 按设计进行 按实际情况进行
    治疗 固定模式 可变模式
    研究对象组别 同质 非同质
    参与医生 仅限调查者 多个行医者
    对照项 安慰剂或挑选过的其他干预方式 多种干预方式
    病人监控 持续,按研究方法进行 可变

    这个表里面,最重要的是第一条,两者的目的是不一样的,RCT是用来验证药的有效性(Efficacy),RWS用来验证药的效果(Effectiveness)(注意:英文里面Efficacy与Effectiveness是有微妙的区别的,按照我的理解,Efficacy存在因果关系,Effectiveness仅是用来说明效果,其效果不一定存在因果关系)

    关于Efficacy以及Effectiveness的区别,还是以上述的例子,RCT可以用来证明,排除了人体自愈以及安慰剂效应等各种干扰因素,某种药物的有效性,而RWS则不然,这个方法只会告诉大家,吃了这个药,通过一些数据的处理,可以确认有效率达到某个百分比,至于这个是否由安慰剂效应导致的,我们无法排除。

    然后我们可以看一下第二个表,这个是对比这两种方法的优劣:

    Advantages

    Less time and cost consumption compared with RCT

    - Possible to shorten the duration of clinical research

    - No period needed for patient recruitment/enrollment

    Presentation of the directionality for RCT

    Research that cannot be done with RCT is possible

    - Safe research on high-risk groups

    Detection of less frequent side effects

    Rapid access/easier information and data retrieval

    Prediction model or high-risk group selection

    Set a foundation on AI

    Limitation

    For correct analysis, a massive amount of data should be collected.

    Much time needed for DQM

    Experienced experts needed for the analysis of the massive amount of data

    Lack of privacy/confidentiality/lost data

    Standardized research protocol needs to be established before research

    - High possibility of bias

    - Possible to interpret with bias or incorrectly based on research results

    简单翻译如下:

    优点:

    - 时间与成本较低

    ----有可能缩短临床研究的时间

    ----无需耗时招募病人

    - 为RCT展示了方向

    - 可在RCT不适用的情况下进行研究

    ----在高风险组别的研究较为安全

    - 可检查出较少发生的副作用

    - 迅速获取信息与数据

    - 可以用于预测模型或者高风险组别的选择

    - 为人工智能奠定基础

    缺点:

    - 如要正确的分析,需要收集数量庞大的数据

    - 需要很多时间进行数据质量管理

    - 需要有经验的专家对数量庞大的数据进行分析

    - 存在缺少隐私,保密,数据丢失的问题

    - 在开始研究之前,需要对研究方法(protocol)进行标准化处理

    ---- 很高的可能性出现偏差

    ---- 对研究结果可能存在有偏差或者不正确的解读

    总结一下:

    对比完两者的目的和优劣,结论显而易见,这两个方法是互补的,换言之,在RCT不适用的情况下,可以用RWS顶上,但由于没有一个固定模式,其效果取决于研究者的本领。总而言之,根本就不存在用RWS代替RCT的问题。

    当然,我的话中医粉可以不信,但进行清肺排毒汤RWS研究的人的话不能不信吧?请看这里:

    qq97:补充,一篇与该论文相关的报道(节选)

    “若能针对清肺排毒汤开展随机对照试验,将有望进一步确证其临床疗效,并推动其广泛应用,挽救全球数以万计的新冠肺炎患者的生命。”李静补充道。

    如果RWS足够完美,李静不会这么说吧?这不就默认了RWS就是不如RCT那么可靠吗?

    中医想翻身,RCT这个坎是一定要过的,不要想着走捷径,用RWS就可以万事大吉了。

    通宝推:从来,菜根谭,
    作者 对本帖的 补充(1)
    家园 【原创】一个RCT实操例子 -- 补充帖

    最近在看一本关于数学在生活中的应用的书,碰巧看到一个例子,关于RCT的,虽然不是真实案例,但很有意思,值得说一下:

    有一个治疗高血压芬塔可的新药上市,招了2000人做试验,男女数目一样,分成两组,每组1000人,做RCT的总结如下:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 560 350
    无改善 440 650
    改善率 56% 35%

    从结果看,似乎这药还行,但是,由于性别这个因素很重要,我们又对性别做了一下细分,结果发现是这样的:

    男性:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 40 200
    无改善 160 600
    总数 200 800
    改善率 20% 25%

    而女性:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 520 150
    无改善 280 50
    总数 800 200
    改善率 65% 75%

    太震惊了,只不过细分了一下而已,结论居然相反!一个优于安慰剂,另一个差过安慰剂!

    为啥会有这种不同呢?其实就是由于性别这个因素非常重要,而这男女在这两组之中的占比并不一样,导致合并之后得不到一致的统计结果。

    既然知道了性别是很重要的因素,我们可以尝试一下同样占比的试验数据:

    男性:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 100 125
    无改善 400 375
    总数 500 500
    改善率 20% 25%

    女性:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 325 375
    无改善 175 125
    总数 500 500
    改善率 65% 75%

    然后再看看合并的统计数据:

    治疗效果 A组: 芬塔可 B组: 安慰剂
    有改善 425 500
    无改善 575 500
    改善率 42.5% 50%

    现在看,用于控制了性别这个关键变量,无论是性别分组,还是汇总,我们都能得到一致的结论,这个新药确实不如安慰剂。

    这个例子简单吧,只要初中水平的数学能力,应该都能理解吧?RCT的原理就是这么简单,模式固定,自己去找变量,有对照组就是方便。

    好了,轮到我来向RWS的粉丝提问了,这个药在没有安慰剂对照组的情况下,要如何操作?

    先说说我的理解,RWS是直接上药,进行统计,肯定能够发现男性有20%的改善率,女性有65%的改善率,然后呢?

    通宝推:光头佬,从来,
  • 见前补充 4668554
      • 家园 男女比例如此失衡,这个怕不是RCT吧。

        真正的RCT重在随机分配,两个组在统计上应该是无差异的。在1000名这么大的样本规模,两个组的男女比例竟然是4:1对1:4,说明这个实验的样本分配不是随机的,本身就不是RCT.

      • 家园 这个例子充分说明RCT是比垃圾略好的工具

        第一次合并结果,芬塔可对比安慰剂并没有明显的改善;第二次也没有明显改善,说明这个药本身就不行。

        但是缩小了检测范围,出现了数据反常,这正常吗?很正常。因为血压这东西本来就是非常主观的东西,测试的时候兴奋一点,马上就会升高,相反则会降低。明显的证据是女生那一组,安慰剂也明显改善了。

        用和主观意图密切相关的例子来证明RCT,本身说明了RCT仅仅对药效不明显的病来做不靠谱的微弱区分。

        • 家园 是否垃圾是价值观的判断

          我只想了解RWS会如何操作,是否比RCT更容易操作,在没有安慰剂对照组的情况下,如何判断到底是安慰剂引起的,还是真实的药效。

          另外关于你说的这个:

          第一次合并结果,芬塔可对比安慰剂并没有明显的改善

          我给的例子是56%对35%,应该说是优于安慰剂的。

          但是缩小了检测范围,出现了数据反常,

          不是缩小了检测范围,而是拿着同样的数据,根据性别来分组。

          另外,第一段话已经说了这个不是真实的案例,只是用来做示范的。

          高血压做过太多的研究,安慰剂效应肯定已有不少历史记录做参考的了,但是,假如一种新的疾病,例如新冠,你会没有安慰剂效应的数据,RWS要怎么办?

          通宝推:从来,
          • 家园 建议看统计会犯错和Regina Nuzzo关于P值的论文。
            • 家园 理论要经过实践检验

              讲真,这栋楼里,关于RWS的理论都是一套一套的,唯一见到一点操作实践的还是清肺排毒汤那篇文章,虽然没有说明白要如何排除安慰剂效应,好歹还是有实操的。

              你也不用再说什么理论了,实践一下,用这个例子,做个方案出来,看看能不能说明白,你的方案如何排除安慰剂效应?

              我问了陈王了,他似乎也没啥好招,要不你试试?

          • 家园 RWS的前提是已知这个药由降血压的生理机制

            且已经证明五毒,在动物试验证明疗效,在小组人群中证明有效。接下来可以征求志愿者,在住院病人身上治疗,收集数据。一年后收集到12800人的血压数据,进行各种去差异化处理,发现该数据和沿用其他降压药的,要低2%, 且没有严重副作用,最后证明该药有效。

            在你的这个例子中,本来药效就不明显,范围扩大后出现数据反常的根本不可能,唯一可以推翻这种可能的,是系统性作弊。所以说RCT唯一的作用,就是对付资本的大规模作弊,提升作弊成本。

            没有前面的生理机制研究,后面的RCT也好,RWS也好全身垃圾。有了生理机制的研究和多角度确认,哪怕统计数据不那么明显,在没有更好的药之前,也可以临时批准,瑞德希韦就是因为这个被FDA批准的。

            就科学工具而言,RCT是垃圾,就反腐工具而言,RCT是神器。

            • 家园 反腐神器跟可靠性是一个硬币的两面

              不可靠,是无法作为反腐神器的。

              那么问题来了,难道一个只比垃圾好一点的方法,居然可以成为反腐神器?

              • 家园 反腐制度是科学神器?

                你想一想就明白了。假如世界上的药不赚钱,RC还有这么重要吗?假如药一吃绝大部分都好了,RCT还这么重要吗?

                • 家园 切勿混淆制度与方法

                  RCT跟RWS一样,都是方法,反腐的制度选择了RCT,而没有选RWS,说明RCT能鉴别真假,更为可靠。我想问的是:这种可靠性,难道就是比垃圾好一点?

                  至于你说的:

                  假如药一吃绝大部分都好了,RCT还这么重要吗?

                  我的回答是:需要,因为我们需要一个相对准确的数字,这个数字,对研究者来说,很重要。

    • 家园 非常好奇地问个技术问题,西药真的都能实现双盲测试么

      中药存在性状的不同,西药固然没这个问题,药片里是淀粉还是药物,点滴打是不是生理盐水,确实看不出来,算是“盲”的。

      但有一个问题,但凡药物往往都是会引起身体反应的,感冒药可以提纯作为毒品,更不要说化疗的副作用了,在这种情况下,怎么实现受试者的“盲”呢?

      • 家园 一般来说,都能

        “但凡药物往往都是会引起身体反应的”,这话没错。同时,也要注意,非药物(安慰剂)也会引起身体反应。人体就是这么奇怪。

        如果试验设计得好,这种受试者可感知的身体反应是可以“控制”的。

        比如说,I期临床试验就是为了了解药物的安全性、耐受性,得到安全剂量、可耐受剂量。说白了,就是让受试者吃了没啥可感知的副反应。

        还有就是,有的受试者万一真的出现了可感知的副反应,可以通过“控制”分析数据时将其“脱出”。其实他也有可能吃的是安慰剂出现了心理反应。

        其实,药物临床试验并非绝对要求设对照或设盲。

        比如,单臂试验,都知道目前没特效疗法,就是死马当活马医,没必要设对照组,因为对照组都是无效的。

        但是对照组的设置,就是为了剔除安慰剂/自愈,这是RCT的优势。

      • 家园 我的理解绝大部分应该都行

        具体的操作,要问@夕曦 @胶州大白菜 等行家才行了。

分页树展主题 · 全看
/ 9
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河