首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >SCI CHINA INFORM SCI | AI 驱动药物研发的范式革新:从技术突破到临床转化

SCI CHINA INFORM SCI | AI 驱动药物研发的范式革新:从技术突破到临床转化

作者头像
MindDance
发布2026-01-08 12:59:59
发布2026-01-08 12:59:59
3310
举报

AI in drug development: advances in response, combination therapy, repositioning, and molecular design

期刊: SCIENCE CHINA Information Sciences 链接: https://doi.org/10.1007/s11432-024-4461-0 简介: 本文综述了人工智能在药物研发中的最新进展,重点关注药物响应预测、联合治疗、药物重定位和分子设计四个关键领域,创新点在于系统梳理了各类 AI 技术在这些领域的应用框架及协同作用。研究采用深度学习、图神经网络、生成模型等 AI 技术,结合多组学数据、药物数据库等进行建模与分析。实验中使用了 GDSC、CCLE、DrugBank 等数据集,通过多种评估指标验证了 AI 模型在提高预测准确性、优化药物组合、发现新适应症和生成有效分子结构等方面的显著效果,例如 AlphaFold 系列模型在蛋白质结构预测上的高精度,以及各类深度学习模型在药物敏感性和协同效应预测中的良好表现。该综述为 AI 在药物研发中的进一步应用提供了理论支持和实践指导,强调了跨学科合作的重要性,并指出了数据质量和模型可解释性等未来需解决的挑战。


今日向大家介绍《SCIENCE CHINA Information Sciences》最新刊发的综述文献《AI in drug development: advances in response, combination therapy, repositioning, and molecular design》。作为AI制药领域的系统性总结,该文以"技术-应用-挑战"为脉络,构建了人工智能赋能药物研发的完整知识体系。

一、药物研发的困局与AI的破局之道

传统药物研发的"四阶段困境"已成为行业共识:靶标发现的盲目性、筛选过程的低效性、临床试验的高失败率、上市后监测的滞后性。数据显示,仅临床阶段的淘汰率就高达80%,而这背后是疾病复杂性与技术局限性的双重制约:

  • • 肿瘤微环境的异质性导致药物响应个体差异显著,传统预测模型准确率不足60%
  • • 单药疗法难以应对多通路驱动的疾病(如阿尔茨海默病),而组合疗法的协同机制解析仍依赖经验性探索
  • • 现有药物的未被挖掘适应症超过已知适应症3-5倍,但受限于数据孤岛难以系统发现
  • • 化学空间的理论规模达10^60,传统高通量筛选仅能覆盖万亿分之一

该综述敏锐指出,AI技术的核心价值在于将生物学问题转化为可计算问题:通过深度学习处理高维组学数据,利用图神经网络建模分子相互作用,借助生成模型拓展化学空间探索边界。这种转化不仅提升效率,更重塑了药物研发的底层逻辑——从"试错驱动"转向"预测驱动"。

该图清晰呈现了输入数据、AI 方法与药物研发之间的协同关系和信息流。AI 整合的药物研发流程包括:准备药物属性、基因组信息等数据;通过 AI 方法提取药物或生物细胞的特征表示;将特征向量和任务标签输入机器学习或深度学习模型并优化参数;评估模型性能并验证预测结果;最终通过生物学实验或文献验证结果,同时通过可解释性分析揭示潜在生物学机制。此流程体现了数据驱动的药物研发模式,强调了各环节的协同作用。
该图清晰呈现了输入数据、AI 方法与药物研发之间的协同关系和信息流。AI 整合的药物研发流程包括:准备药物属性、基因组信息等数据;通过 AI 方法提取药物或生物细胞的特征表示;将特征向量和任务标签输入机器学习或深度学习模型并优化参数;评估模型性能并验证预测结果;最终通过生物学实验或文献验证结果,同时通过可解释性分析揭示潜在生物学机制。此流程体现了数据驱动的药物研发模式,强调了各环节的协同作用。

该图清晰呈现了输入数据、AI 方法与药物研发之间的协同关系和信息流。AI 整合的药物研发流程包括:准备药物属性、基因组信息等数据;通过 AI 方法提取药物或生物细胞的特征表示;将特征向量和任务标签输入机器学习或深度学习模型并优化参数;评估模型性能并验证预测结果;最终通过生物学实验或文献验证结果,同时通过可解释性分析揭示潜在生物学机制。此流程体现了数据驱动的药物研发模式,强调了各环节的协同作用。

二、技术基石:AI如何破解药物研发的计算难题?

该图展示了药物研发中核心的人工智能方法及其架构。涵盖了深度神经网络(DNN)、生成对抗网络(GAN)、图神经网络(GNN)、循环神经网络(RNN)、Transformer、卷积神经网络(CNN)、长短期记忆网络(LSTM)、强化学习、自编码器和迁移学习等。这些架构分别适用于不同的数据类型和任务场景,例如 GNN 擅长处理分子图结构数据,Transformer 在序列数据处理中表现突出,迁移学习则在数据稀缺场景中发挥优势,为药物研发的各环节提供了技术支撑。
该图展示了药物研发中核心的人工智能方法及其架构。涵盖了深度神经网络(DNN)、生成对抗网络(GAN)、图神经网络(GNN)、循环神经网络(RNN)、Transformer、卷积神经网络(CNN)、长短期记忆网络(LSTM)、强化学习、自编码器和迁移学习等。这些架构分别适用于不同的数据类型和任务场景,例如 GNN 擅长处理分子图结构数据,Transformer 在序列数据处理中表现突出,迁移学习则在数据稀缺场景中发挥优势,为药物研发的各环节提供了技术支撑。

该图展示了药物研发中核心的人工智能方法及其架构。涵盖了深度神经网络(DNN)、生成对抗网络(GAN)、图神经网络(GNN)、循环神经网络(RNN)、Transformer、卷积神经网络(CNN)、长短期记忆网络(LSTM)、强化学习、自编码器和迁移学习等。这些架构分别适用于不同的数据类型和任务场景,例如 GNN 擅长处理分子图结构数据,Transformer 在序列数据处理中表现突出,迁移学习则在数据稀缺场景中发挥优势,为药物研发的各环节提供了技术支撑。

文章对核心AI技术的剖析颇具深度,尤其强调了"算法特性与生物学问题的匹配性":

  • 深度神经网络(DNNs):在处理多组学数据时,其自动特征提取能力避免了传统方法的人工偏差。如MOLI模型整合体细胞突变、拷贝数变异和基因表达数据,将药物响应预测准确率提升至78%
  • 图神经网络(GNNs):通过原子节点与化学键边的拓扑结构建模分子,完美契合药物-靶标相互作用的空间特性。DeepCDR采用图卷积网络(GCN)处理分子图,在非小细胞肺癌药物响应预测中AUC达0.83
  • Transformer模型:自注意力机制能捕捉SMILES序列中远距离原子的相互作用,较RNNs提升约15%的特征提取效率。DeepTTA将药物SMILES分解为子结构单元,通过Transformer编码器实现跨分子结构的模式识别
  • 生成对抗网络(GANs):通过生成器与判别器的对抗训练,能产生具有类药特性的新型分子。DRAGONFLY结合图转换神经网络与化学语言模型,生成的化合物合成可行性达82%
  • 强化学习(RL):在分子优化阶段,通过"奖励函数"(如类药性评分、毒性预测)引导结构迭代,POLYGON模型以此实现双靶点抑制剂的成药性提升40%

特别值得关注的是多技术融合趋势:如AlphaFold 3整合扩散模型与SwiGLU激活函数,将蛋白质-配体结合预测准确率提升50%,其关键突破在于将进化信息与物理约束融入同一计算框架。

三、应用突破:AI在药物研发关键环节的实战表现

1. 药物响应预测:从群体平均到单细胞精度

综述重点分析了三代预测模型的演进:

  • 第一代:基于单一组学数据(如基因表达),如RefDNN采用ElasticNet预处理基因表达数据,在NCI-60细胞系数据集上RMSE为0.18
  • 第二代:整合多组学与药物结构数据,DeepCDR通过多子网架构处理基因组、转录组和分子图数据,在TCGA数据集上AUC达0.81
  • 第三代:单细胞水平预测,scDEAL通过迁移学习协调 bulk RNA-seq与单细胞数据,解决了稀有细胞类型的样本稀缺问题,在三阴乳腺癌患者来源类器官模型中验证准确率达73%

评估体系上,回归任务采用Pearson相关系数(PCC)与均方根误差(RMSE),分类任务则侧重AUC与F1分数,这种精细化评估确保了模型的临床适用性。

该图展示了药物敏感性预测的主要 AI 方法,及其涉及的数据、模型和评估指标。列出了 AI-DrugNet、DeepCoVDR、DeepCDR 等多种方法,涵盖回归和分类任务。回归任务使用 Pearson 相关系数(PCC)、Spearman 相关系数(SCC)等评估指标,分类任务则采用 AUC、AUPR 等。这些方法整合了药物理化性质、多组学数据等,通过不同的深度学习模型提高药物敏感性预测的准确性,为个性化治疗提供依据。
该图展示了药物敏感性预测的主要 AI 方法,及其涉及的数据、模型和评估指标。列出了 AI-DrugNet、DeepCoVDR、DeepCDR 等多种方法,涵盖回归和分类任务。回归任务使用 Pearson 相关系数(PCC)、Spearman 相关系数(SCC)等评估指标,分类任务则采用 AUC、AUPR 等。这些方法整合了药物理化性质、多组学数据等,通过不同的深度学习模型提高药物敏感性预测的准确性,为个性化治疗提供依据。

该图展示了药物敏感性预测的主要 AI 方法,及其涉及的数据、模型和评估指标。列出了 AI-DrugNet、DeepCoVDR、DeepCDR 等多种方法,涵盖回归和分类任务。回归任务使用 Pearson 相关系数(PCC)、Spearman 相关系数(SCC)等评估指标,分类任务则采用 AUC、AUPR 等。这些方法整合了药物理化性质、多组学数据等,通过不同的深度学习模型提高药物敏感性预测的准确性,为个性化治疗提供依据。

2. 药物组合优化:从经验筛选到机制驱动

该领域的突破体现在从现象预测到机制解析的跨越

  • 多模态输入:DTSyn模型同时纳入药物SMILES、基因表达谱和蛋白质相互作用网络,协同效应预测AUPR达0.76
  • 可解释性提升:TranSynergy通过注意力权重可视化,能定位组合疗法中关键的协同通路(如BRAF与MEK抑制剂组合中的MAPK通路)
  • 临床转化:ComboFM采用高阶张量建模,在10种实体瘤细胞系中预测的37对协同组合,经实验验证阳性率达62%,远高于传统方法的35%

综述特别强调,组合疗法的AI模型必须满足剂量依赖性预测——这也是当前多数模型的短板,而MTLSynergy通过多任务学习框架初步实现了剂量-效应曲线的精准建模。

该表汇总了用于药物组合预测的代表性 AI 方法。每种方法都明确了所使用的模型(如 Transformer、GNN、多任务学习等)、输入数据(如 SMILES、基因表达、蛋白质相互作用等)、评估指标(如 AUC-ROC、PR-AUC、MSE 等)以及代码链接。这些方法通过分析药物组合的协同效应,旨在提高组合疗法的疗效、降低耐药性和副作用,为临床药物组合选择提供参考。
该表汇总了用于药物组合预测的代表性 AI 方法。每种方法都明确了所使用的模型(如 Transformer、GNN、多任务学习等)、输入数据(如 SMILES、基因表达、蛋白质相互作用等)、评估指标(如 AUC-ROC、PR-AUC、MSE 等)以及代码链接。这些方法通过分析药物组合的协同效应,旨在提高组合疗法的疗效、降低耐药性和副作用,为临床药物组合选择提供参考。

该表汇总了用于药物组合预测的代表性 AI 方法。每种方法都明确了所使用的模型(如 Transformer、GNN、多任务学习等)、输入数据(如 SMILES、基因表达、蛋白质相互作用等)、评估指标(如 AUC-ROC、PR-AUC、MSE 等)以及代码链接。这些方法通过分析药物组合的协同效应,旨在提高组合疗法的疗效、降低耐药性和副作用,为临床药物组合选择提供参考。

3. 药物重定位:从偶然发现到系统挖掘

文章揭示了药物重定位的三大AI策略

  • 知识图谱推理:LAGCN在疾病-基因-药物异质网络中引入层注意力机制,新适应症预测准确率达79%,成功发现巴瑞替尼治疗特应性皮炎的新用途
  • 基因扰动匹配:DRIAD通过比对阿尔茨海默病不同病理阶段的基因表达谱与药物扰动谱,筛选出的匹莫范色林已进入Ⅱ期临床
  • 多组学整合:DeepDRK融合药物结构相似性、细胞系响应数据和通路富集分数,在COVID-19药物重定位中AUC达0.89,预测的瑞德西韦与巴瑞替尼组合已获FDA紧急使用授权

值得注意的是,该领域正从"单疾病-单药物"预测转向"多病种-多药物"全景挖掘,STRGNN通过拓扑正则化处理多模态网络,实现了跨疾病类型的药物重定位推荐。

该图呈现了药物重定位的代表性 AI 方法,涉及输入数据、模型及相关概念。输入数据包括疾病描述信息、药物 - 药物相互作用、药物 - 蛋白质相互作用等;模型涵盖线性回归、随机森林、迁移学习、图嵌入等。这些方法通过挖掘多源数据中的潜在关联,识别现有药物的新适应症,加速药物重定位进程,降低研发成本。
该图呈现了药物重定位的代表性 AI 方法,涉及输入数据、模型及相关概念。输入数据包括疾病描述信息、药物 - 药物相互作用、药物 - 蛋白质相互作用等;模型涵盖线性回归、随机森林、迁移学习、图嵌入等。这些方法通过挖掘多源数据中的潜在关联,识别现有药物的新适应症,加速药物重定位进程,降低研发成本。

该图呈现了药物重定位的代表性 AI 方法,涉及输入数据、模型及相关概念。输入数据包括疾病描述信息、药物 - 药物相互作用、药物 - 蛋白质相互作用等;模型涵盖线性回归、随机森林、迁移学习、图嵌入等。这些方法通过挖掘多源数据中的潜在关联,识别现有药物的新适应症,加速药物重定位进程,降低研发成本。

4. 分子设计:从结构优化到功能定制

生成模型的突破使分子设计进入**"按需定制"时代**:

  • 1D序列生成:s4dd模型基于结构化状态空间序列(S4)模型,生成的抗菌肽MIC值(最小抑菌浓度)较传统设计降低2-4倍
  • 2D分子图生成:DeepBlock采用模块化生成策略,先构建分子片段再组装完整结构,生成化合物的类药性评分(QED)达0.85
  • 3D结构生成:GEOM-CVAE通过蛋白质约束条件生成的抑制剂,与靶标结合能垒降低12 kcal/mol,体外活性提升1个数量级
  • 多靶点设计:Multitarget-ligands采用迁移学习,在激酶家族交叉反应预测中准确率达83%,解决了传统多靶点药物的脱靶问题

综述特别指出,生成模型与实验验证的闭环是关键——如PGMG模型生成的300个化合物经虚拟筛选和湿实验验证,23个具有显著生物活性(命中率7.7%),远高于传统方法的0.1-0.5%。

该表总结了药物分子生成的各类方法,按分子表示维度(1D、2D、3D)分类。1D 方法基于 SMILES 字符串,如 DrugLLM、TransGEM 等,多采用 Transformer、VAE 等模型;2D 方法基于分子图,如 CRAG、DRAGONFLY 等,常使用 GNN;3D 方法关注分子三维结构,如 GEOM-CVAE、PMDM 等,结合了几何特征和扩散模型。这些方法旨在设计具有特定生物活性和理化性质的新型化合物,拓展潜在治疗药物的化学空间。
该表总结了药物分子生成的各类方法,按分子表示维度(1D、2D、3D)分类。1D 方法基于 SMILES 字符串,如 DrugLLM、TransGEM 等,多采用 Transformer、VAE 等模型;2D 方法基于分子图,如 CRAG、DRAGONFLY 等,常使用 GNN;3D 方法关注分子三维结构,如 GEOM-CVAE、PMDM 等,结合了几何特征和扩散模型。这些方法旨在设计具有特定生物活性和理化性质的新型化合物,拓展潜在治疗药物的化学空间。

该表总结了药物分子生成的各类方法,按分子表示维度(1D、2D、3D)分类。1D 方法基于 SMILES 字符串,如 DrugLLM、TransGEM 等,多采用 Transformer、VAE 等模型;2D 方法基于分子图,如 CRAG、DRAGONFLY 等,常使用 GNN;3D 方法关注分子三维结构,如 GEOM-CVAE、PMDM 等,结合了几何特征和扩散模型。这些方法旨在设计具有特定生物活性和理化性质的新型化合物,拓展潜在治疗药物的化学空间。

四、挑战与展望:AI药物研发的下一个十年

该综述并未回避行业痛点,而是直面三大核心挑战:

  1. 1. 数据质量瓶颈:多中心临床数据的异质性(如不同测序平台的批次效应)导致模型泛化性下降,需建立跨机构的数据标准化框架
  2. 2. 模型可解释性:黑箱模型难以满足监管要求,注意力机制、因果推断等可解释AI技术的融合势在必行
  3. 3. 生物学复杂性:细胞微环境、表观遗传调控等动态因素尚未被充分建模,需发展时空多尺度预测框架

未来方向上,文章提出**"四个融合"**:多模态数据融合(如空间转录组与电镜图像)、多尺度模型融合(从分子动力学到系统药理学)、跨学科知识融合(AI与结构生物学)、产学研资源融合(建立开源药物研发平台)。这些方向不仅是技术趋势,更可能催生药物研发的新商业模式。

结语

这篇综述的价值不仅在于系统梳理,更在于构建了AI药物研发的"问题-技术-应用"逻辑闭环。它提醒我们:AI不是替代实验科学,而是通过计算洞察力缩小实验探索范围——从"大海捞针"到"定向捕捞"。对于从事药物研发的同仁而言,理解这些技术进展不仅能提升工作效率,更能帮助我们在这个变革时代找准研究定位。


(●'◡'●) 需要进一步讨论的同学欢迎留言交流!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • AI in drug development: advances in response, combination therapy, repositioning, and molecular design
  • 一、药物研发的困局与AI的破局之道
  • 二、技术基石:AI如何破解药物研发的计算难题?
  • 三、应用突破:AI在药物研发关键环节的实战表现
    • 1. 药物响应预测:从群体平均到单细胞精度
    • 2. 药物组合优化:从经验筛选到机制驱动
    • 3. 药物重定位:从偶然发现到系统挖掘
    • 4. 分子设计:从结构优化到功能定制
  • 四、挑战与展望:AI药物研发的下一个十年
  • 结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档