

文献来源:Wei, H. & McCammon, J. A. Structure and dynamics in drug discovery. npj Drug Discovery 1, 1 (2024). DOI:10.1038/s44386-024-00001-2 发表期刊:npj Drug Discovery 作者单位:加州大学圣地亚哥分校(UCSD)化学与生物化学系、药理学系
新药研发是人类科技活动中最昂贵、周期最长的工程之一。据统计,一款新药从靶点确认到最终上市,平均需要 10–14 年、耗资逾 10 亿美元。而计算机辅助药物发现(Computer-Aided Drug Discovery, CADD)的引入,被估算可将上述成本压缩至多 50%。
本文由计算生物物理学的奠基人之一、美国国家科学院院士 J. Andrew McCammon(UCSD)与其合作者 Haixin Wei 联合撰写。McCammon 课题组是分子动力学(MD)模拟应用于生物大分子的先驱,其工作直接催生了多个 FDA 批准药物。这使得本综述不仅是一篇文献梳理,更是一份由亲历者书写的领域备忘录。
文章发表于 npj Drug Discovery 创刊号(2024 年 11 月),系统回顾了 SBDD(基于结构的药物设计)从早期 X 射线晶体学应用,到分子动力学模拟,再到当前机器学习浪潮的完整演进路径,并展望了"计算机驱动药物发现"的未来图景。
文章开篇厘清了 CADD 的基本分类:
方法类别 | 英文全称 | 适用前提 | 核心逻辑 |
|---|---|---|---|
SBDD | Structure-Based Drug Design | 靶点三维结构已知 | 基于靶点结构进行分子对接与构象分析 |
LBDD | Ligand-Based Drug Design | 靶点结构未知 | 利用已知活性配体的结构-活性关系推断 |
近年来,随着 cryo-EM、串行飞秒晶体学(SFX)和 AlphaFold 等技术的突破,可用靶点结构的数量发生了量级跃升,使 SBDD 的适用范围大幅扩展,并成为当前药物发现的主流驱动力。

实验结构方面,结构生物学技术的进步推动了 PDB(蛋白质数据库)条目的持续扩充:
预测结构方面,AlphaFold 的横空出世是近年最具颠覆性的进展:

获得靶点结构后,下一步是将化合物库"对接"至靶点,预测结合构象并打分排序。文章总结了这一领域的关键进展与挑战:
筛选效率:
打分函数的挑战:
文章专门讨论了化合物库的规模化趋势:
SBDD 的根本局限在于:蛋白质在溶液中并非静止不动的刚体,而是处于持续的构象涨落之中。传统对接软件通常将受体固定,仅允许配体柔性,这导致两大严重问题:

McCammon 课题组提出的**松弛复合物方法(Relaxed Complex Method, RCM)**直接应对这一挑战:
标志性案例——HIV 整合酶抑制剂雷特格韦(Raltegravir)的发现:
这一案例是计算方法直接推动新药上市的经典范例。
MD 模拟的经典痛点在于时间尺度问题:积分步长被限制在数飞秒(fs),导致模拟难以穿越较高的能垒,无法有效探索蛋白质能量景观的宏观结构。多种增强采样策略被发展出来,文章将其分为两大类:
第一类:基于集体变量(Collective Variables, CVs)的方法
方法 | 核心原理 | 优势 | 局限 |
|---|---|---|---|
伞形采样(Umbrella Sampling) | 沿 CV 施加约束势,获取自由能曲线 | 精确计算 PMF | 需预先知道反应坐标 |
元动力学(Metadynamics) | 在已访问构象处持续填充高斯势,促进逃离 | 自适应探索自由能面 | CV 选择影响结果 |
加权系综方法(Weighted Ensemble) | 按统计权重在相空间内复制/终止轨迹 | 适合稀有事件采样 | 对定义明确的端态最有效 |
第二类:不依赖集体变量的方法
方法 | 核心原理 |
|---|---|
副本交换 MD(Replica Exchange MD) | 多个不同温度的副本间定期交换,促进翻越能垒 |
混合蒙特卡洛–MD(MC-MD) | 结合 MC 的全局探索与 MD 的局部动力学 |
加速 MD(aMD) | 在势能低谷区施加非负 boost 势,平滑能量面 |
高斯加速 MD(GaMD) | boost 势服从高斯分布,支持精确重权重(reweighting) |
加速 MD 的应用优势:
代表性应用:
MD 模拟的另一重要贡献是允许计算结合自由能(Binding Free Energy)——这是对分子对接打分函数的根本性超越:
理论基础:
自由能微扰(Free Energy Perturbation, FEP):
工业界大规模实践:
机构 | 规模与结果 |
|---|---|
Merck KGaA(2016–) | 12 个靶点、23 个化学系列,逾 35,000 次 FEP 计算,新识别 400+ 高亲和力分子 |
Bayer | 用计算赋能工作流发现 KRAS G12C 共价变构结合剂 |
GPCR 研究(A2B 腺苷受体) | 对数百万化合物枚举库进行 FEP 筛选 |
诺如病毒 RdRp 研究 | 对 121 个虚拟核苷类似物进行 FEP 打分,鉴定出 2 个有体外活性的新分子 |
AlphaFold 对药物发现的冲击是多层次的:
AlphaFold 2(2021 年发布):
AlphaFold 3(2024 年发布):
当前局限:
发展现状:
物理模型与 ML 模型的互补策略:
QSPR(定量结构–性质关系):
QSAR(定量结构–活性关系):
文章以 Fig. 4 的范式图为核心,展示了下一代药物发现管线的整体逻辑:

靶点结构来源:
├── AI 结构预测(AlphaFold 等)
└── MD + 增强采样(构象集合)
│
▼
初始筛选阶段:
├── 物理/AI 混合对接(超大规模虚拟筛选)
└── AI QSAR 预筛
│
▼
命中到先导阶段:
├── 自由能微扰计算(FEP)
└── AI QSAR 精排
│
▼
先导优化阶段:
└── AI QSPR(多参数优化:溶解度/渗透性/PK)
│
▼
候选药物趋势总结:
维度 | 现状(CADD) | 未来(计算机驱动) |
|---|---|---|
靶点结构 | 实验结构为主,覆盖有限 | AI 预测+实验互补,近全覆盖 |
初始筛选 | 百万级化合物,依赖人工判断 | 数十亿化合物,AI 全自动排序 |
亲和力预测 | 对接打分,精度有限 | FEP 计算,达到实验级精度 |
ADMET 预测 | 少数性质,事后评估 | 多参数同步优化,贯穿全程 |
隐蔽靶点 | 几乎无能为力 | 增强采样+ML 联合发现 |