药物临床试验的进展很大程度受限于受试者招募的进展,受试者招募的进展与入组标准密切相关。
Nature杂志4月的一篇文章,介绍了AI在简化临床试验入组标准方面的价值和应用。
临床试验的高失败率
药物临床试验的计划和执行不仅消耗时间、精力和资源,而且成功率很低、影响极大。试验失败导致药企股价暴跌、公司裁员的事件时有发生。
2018年,麻省理工学院的研究人员曾分析了2000年1月1日至2015年10月31日期间,超过21,143个化合物的406,038条临床试验数据,结果发表在Biostatistics杂志上。
药物临床试验成功公司概率-按阶段和治疗领域统计
这项大规模的调查显示,药物从进入I期临床试验起到获得FDA批准的总体成功概率只有13.8%,也就是说,将近90%的进入临床阶段的药物无法最终获得监管批准。肿瘤药物的成功概率只有3.4%。
临床试验入组标准可能过于严格
药物临床试验的失败跟诸多因素相关。这其中,受试者招募是起始的关键环节,86%的临床试验未能在目标时间内完成招募。而受试者的招募,往往因为试验方案的入组标准严格而影响进度。
美国国家癌症研究所的专家认为,入组标准可能淘汰了合适的受试者,所以应该考虑简化和扩大范围。FDA也有类似的表述,认为某些人群通常在没有充分的临床理由的情况下被排除在临床试验之外。在美国临床肿瘤学会的一项评估中,56%的受访临床医生同意有些标准过于严格,损害了临床试验。
然而,扩大临床试验的入组标准极具挑战,目前缺乏有足够证据的方法。仅仅基于现有的数据,试验相关各方无法就取消具体标准达成一致意见。
AI发现许多入组标准对试验结果影响甚微
问题的关键在于,每一条入组标准,如何影响最终的合格受试者数量和试验结果,还无法确定。
这个问题可以转换为另一种表述方式,那就是:各个特征是如何最终影响和决定模型的输出。这样的话,就可以采用Shapley值法(一种AI的归因方法)来分析了。
2021年4月,斯坦福大学的James Zou等人在Nature杂志发表文章,使用一种AI工具Trial Pathfinder,从肿瘤患者的真实世界数据中学习,来优化入组标准的包容性。分析结果显示,许多常见的入组标准,对临床试验的结果影响甚微。
研究指标。入组标准对临床试验结果的影响,以总生存期的风险比(Hazard Ratio, HR)为指标。风险比越低,治疗的获益越大。
研究工具。Trial Pathfinder是研究团队开发的一个框架,可以整合真实世界数据,系统分析不同入组标准下队列总生存期的风险比,评估包含或忽略临床试验中的某些入组标准后产生的效果。
数据来源。该研究使用了Flatiron Health EHR衍生的数据库,其中包括来自美国大约280家癌症中心的去除身份识别的61,094例晚期非小细胞肺癌(aNSCLC)患者的数据。
Trial Pathfinder工作流程和应用
Trial Pathfinder的工作流程分为两大部分。
首先是临床试验模拟。Trial Pathfinder将真实世界数据和目标试验方案(治疗和资格标准)作为输入。根据患者特征、诊断、实验室值、生物标志物和先前的治疗方法,以编程方式对不同的入组标准(从文本中提取)进行编码,并使用倾向评分的加权分析法(propensity score weighting)进行临床试验模拟。然后,对模拟的治疗组进行生存分析,并报告符合条件的患者数和由此产生的风险比。
其次是分析。Trial Pathfinder将标准的重要性分析与Shapley值相结合,评估了每个纳入/排除标准如何影响合格受试者的数量和试验结果。
研究表明,几个常用的纳入/排除标准不会对试验的总生存期的风险比产生实质性影响,也不会潜在地降低试验的有效性。这些标准包括实验室检查的指标(比如血压,白蛋白水平,淋巴细胞或中性粒细胞计数,丙氨酸氨基转移酶、碱性磷酸酶和天冬氨酸氨基转移酶水平)和先前的疗法(ALK,PDL1,EGFR和CYP34A疗法、系统性或抗肿瘤疗法)。
扩大入组标准后,入组人数平均增加一倍多
研究从ClinicalTrials.gov中,筛选了10项(要求临床试验方案可获取、每个臂至少有250例相关患者)已完成的aNSCLC临床试验,使用Trial Pathfinder进行完整的模拟。
研究发现,当使用数据驱动的方法来扩大入组标准时,可使符合标准的受试者平均从1,553人增加到3,209人,同时总生存期的风险比平均下降了0.05。新的入组标准平均删除了9个纳入/排除标准。这表明,许多在原先试验标准下不符合条件的患者有可能从治疗中受益。
不同入组标准的比较
研究结果得到进一步验证
研究通过几个补充性的分析,进一步证明了结果具有稳健性。
在使用无进展生存期(progression-free survival)这一不同的临床终点时,结果仍然是一致的。
研究还分析了其他类型的癌症,如结肠直肠癌、晚期黑色素瘤和转移性乳腺癌,也发现了不利于试验的限制性标准。Trial Pathfinder的分析表明,当使用数据驱动的方法来扩大入组标准时,对于患有其它类型的癌症的患者来说,符合标准的受试者和数量可以平均增加53%。
其他类型的癌症的分析结果
研究另外分析了22项癌症药物试验的患者(11,602例)安全性数据。结果显示,改变一些常用的基于实验室测试的入组标准,放宽资格门槛,同时不增加受试者的毒性风险是有希望的也是可行的。
AI+RWE改进临床试验设计的前景
用数据驱动的方法来评估入组标准,可以增加临床试验设计的包容性,同时保证受试者的安全。
本研究主要针对数据量最为丰富的非小细胞肺癌来研究,体现了临床试验入组标准设计中使用AI的价值,可能会推动AI在临床试验中的进一步应用。
然而要做到这一点,还需要克服数据质量局限性方面的挑战。比如,完整的临床试验方案的可获得性、数据库的完整性等。
该研究使用的Flatiron数据库经过精心设计和统一编码,而来自其他EHR系统的数据通常更具可变性,并且完整性和准确性也有所不同。此外,肿瘤以外的其他疾病,目前还很难具有丰富的真实世界数据,并且可能有更为复杂的终点。
但随着更多高质量数据的出现,这项工作将有机会扩展到肿瘤之外的其他疾病。
可以在
GitHub(https://github.com/RuishanLiu/TrialPathfinder)上获得Trial Pathfinder的开源Python代码。
参考资料
1.https://www.nature.com/articles/s41586-021-03430-5
2.https://www.nature.com/articles/d41586-021-00845-y
3.WongCH, Siah KW, Lo AW. Estimation of clinical trial success rates and relatedparameters. Biostatistics. 2019 Apr 1;20(2):273-286.
4.https://centrial.org/news/augmenting-clinical-trials-with-ai
----------- End -----------