

文献来源: Sun D, Gao W, Hu H, Zhou S. Why 90% of clinical drug development fails and how to improve it? Acta Pharmaceutica Sinica B. 2022;12(7):3049–3062. DOI: 10.1016/j.apsb.2022.02.002 作者单位: 密歇根大学药学院;百时美施贵宝公司(BMS)临床药理部
一款新药从靶点验证到上市,平均耗时 10–15年,花费逾 10–20亿美元。然而,即便是已经通过层层严格筛选、成功进入 I 期临床试验的候选药物,仍有约90%最终以失败告终。
更令人警醒的是:这90%的失败率,仅统计了进入临床阶段的候选药物。若将临床前阶段的淘汰纳入计算,真实失败率远不止于此。
过去几十年,学术界和工业界在药物研发的每一个环节——靶点验证、高通量筛选、AI辅助设计、药代动力学(PK)优化、临床试验设计——都投入了巨大资源并取得了显著进步,但总体临床成功率始终徘徊在 10%–15%,几乎毫无改善。
这篇来自密歇根大学团队的综述,直击这一核心困境,提出了一个长期被制药界系统性忽视的根源性问题,并给出了具体的改进框架。

基于2010–2017年临床试验数据的系统分析,临床失败的原因可归结为以下四类:
失败原因 | 占比 |
|---|---|
缺乏临床疗效(Lack of efficacy) | 40%–50% |
毒性难以管理(Unmanageable toxicity) | 30% |
药物特性不佳(Poor drug-like properties) | 10%–15% |
商业战略问题(Poor strategic planning) | ~10% |
值得注意的是:
当前药物优化流程已高度成熟,核心包括:
靶点验证层面:
药物优化层面(SAR):
药物特性优化层面:
临床试验设计层面:
尽管以上策略全面而严谨,作者指出:整个优化流程存在一个根本性盲点——对药物在"病变靶器官 vs. 正常器官"中暴露量与选择性的系统评估被长期忽视。
临床剂量/疗效/毒性的平衡,不仅取决于药物对靶点的效力与特异性(SAR),同样取决于药物在病变组织与健康组织间的暴露量与选择性分布(STR)——而后者在当前药物优化标准流程中几乎是缺席的。
当前以血浆 PK 为核心的候选药物筛选标准,其理论基础是"自由药物假说(Free Drug Hypothesis)":
然而,该假说在以下情形下并不成立(甚至完全相反):
结论: 血浆暴露量高的候选药物,其在病变靶器官中的实际暴露量可能严重不足;而血浆暴露量看似偏低的候选药物,可能恰恰是因为大量药物分布进入了靶组织——这两类药物在现行筛选体系中会得出截然相反的错误结论。
EGFR 抑制剂家族(吉非替尼、拉帕替尼、厄洛替尼、凡德他尼): 尽管共享相似的药效团和接近的 SAR/PK 特性,四者在不同癌种中的临床疗效与毒性谱却差异显著。仅凭 SAR 和药物特性无法解释这些差异,结构微调对其在不同肿瘤组织中的分布选择性可能是关键因素。
BTK 抑制剂(伊布替尼、阿卡替尼、泽布替尼 vs. spebrutinib): 前三者均获批上市,而 spebrutinib 在早期临床中折戟。除靶点特异性差异外,各药物在病变淋巴组织 vs. 心脏等正常器官中的暴露量差异,可能是决定其临床命运的重要维度。
选择性雌激素受体调节剂(SERMs): 超过600项 SERM 临床试验,11个已获批(他莫昔芬、雷洛昔芬等),众多结构高度相似的候选药物却在乳腺癌、骨质疏松、更年期症状等不同适应症中呈现截然不同的疗效/毒性谱。研究表明,微小的结构修饰会显著改变药物在肿瘤、脂肪垫、骨骼等组织中的暴露量与选择性,进而决定临床结局。
瑞德西韦(Remdesivir)治疗 COVID-19: 尽管体外抗 SARS-CoV-2 活性良好,100 mg 静脉给药方案的临床疗效十分有限——作者分析认为,其在肺组织(靶器官)的暴露量/选择性可能不足以充分抑制病毒,同时在肾脏(毒性靶器官)的暴露量却相对偏高,形成了不利的剂量/疗效/毒性平衡。
作者提出结构–组织暴露/选择性–活性关系(Structure-Tissue exposure/selectivity-Activity Relationship, STAR)框架,在现有 SAR + 药物特性评估体系的基础上,引入组织暴露/选择性(STR,Structure-Tissue exposure/selectivity Relationship)作为第三维度,将候选药物分为四类:
组织暴露/选择性(STR)
低 高
┌──────────┬──────────┐
高 │ Class II │ Class I │
效力/特异性 │ 高剂量需求 │ 低剂量需求 │
(SAR) │ 毒性风险高 │ 疗效优越 │
├──────────┼──────────┤
低 │ Class IV │ Class III│
│ 应终止开发 │ 潜力被低估│
│ │ 毒性可控 │
└──────────┴──────────┘
Class I(高 SAR + 高 STR)——最理想,成功率最高
Class II(高 SAR + 低 STR)——需谨慎评估
Class III(低 SAR + 高 STR)——最常被错误淘汰的类别
Class IV(低 SAR + 低 STR)——应尽早终止
STR 可通过以下参数量化:
组织暴露量(AUC):
组织血浆
其中 (血浆分配系数)= 组织总药浓 / 血浆总药浓(或 AUC 之比)。
组织选择性(两种计算方式):
组织选择性组织所有组织
全面评估所有主要器官的药物分布,用于识别潜在毒性靶器官,适合小批量候选药物深度分析。
组织选择性(比值)效应组织()毒性组织()
直接评估治疗窗,效率更高,适合候选药物的比较性筛选。
关于"总药物浓度 vs. 游离药物浓度"的争议:
作者倾向于使用总药物浓度/暴露量进行 STR 评估,理由是:游离药物浓度极难准确测量(组织匀浆法破坏亚细胞结构,无法真实反映作用位点的游离浓度),且 AstraZeneca 的 PK/PD 模型研究表明,总药物水平与临床 PK/PD 关系的相关性优于游离药物水平。
作者建议将 STR 评估作为现有筛选流程的补充环节而非颠覆性替代,具体路径如下:
>10,000 化合物
↓ 体外活性筛选(SAR,IC₅₀/Ki)
~250 化合物
↓ 体外 ADME 筛选(溶解度/渗透性/稳定性/蛋白结合)
10–20 化合物
↓ 体内血浆 PK 评估
少数候选药
↓ 【新增】体内组织暴露/选择性评估(STR)
↓ 综合 SAR + ADME + 血浆 PK + 组织 STR 做最终决策
临床候选药(1–2 个)关键点在于:STR 的体内评估资源消耗大,不适合对数百个化合物全面铺开,应在已完成血浆 PK 筛选后,仅对少数进入候选阶段的化合物实施。

体外高通量 STR 筛选:

AI 辅助计算预测:
生理药代动力学模型(PBPK): 现有 PBPK 模型主要用于药物相互作用预测和儿科/首次人体给药剂量预测,其预测临床组织暴露量的能力受限于:(1)依赖大量动物组织浓度数据,耗时耗力;(2)临床阶段人体组织浓度数据难以获取,模型无法实时校正。未来若能结合体外 STR 筛选数据驱动 PBPK 建模,将显著提升预测精度和实用性。
临床阶段非侵入性影像技术:
值得强调的是,STAR 框架的核心并非否定靶点验证的重要性,而是在承认其局限性的基础上提出补充方案。
靶点验证本身面临两大根本挑战:
即便靶点验证完全正确,仍有大量候选药物在临床失败——这正是 STAR 框架所要解决的核心问题所在。
作者估计,若 STAR 体系得到广泛应用,临床药物开发成功率有望从当前的 10%–15% 提升至 30%–40%。这一改善,意味着:
这篇文章的价值,不在于提出了一个全新的实验技术,而在于系统性地揭示了制药行业长期内化的一个认知偏差——我们用血浆 PK 参数代替组织暴露评估,不是因为这样做是对的,而是因为这样做最方便,且长期以来没有人追问这个假设。
从方法论层面看,STAR 框架本质上是将治疗指数(Therapeutic Index)的概念从"血浆浓度空间"拓展至"组织浓度空间",是对传统 PK/PD 框架在药物优化应用中的一次重要修正。
从实践层面看,Class III 候选药物的"平反"尤为值得关注。在日益激烈的靶点竞争中,那些被主流筛选体系淘汰的"低血浆暴露"化合物,很可能藏匿着真正具有临床价值的候选药——这是一个被系统性忽视的机会。
当然,将 STR 研究真正纳入工业化药物优化流程,仍面临巨大的技术、成本和数据挑战。但如本文所言:若能将成功率从10%提升至30%,这将是整个药物研发领域有史以来最具影响力的系统性改进之一。