首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat Rev Drug Discov | QSAR六十年,深度学习让它脱胎换骨

Nat Rev Drug Discov | QSAR六十年,深度学习让它脱胎换骨

作者头像
MindDance
发布2026-06-24 15:15:53
发布2026-06-24 15:15:53
760
举报

本文解读自:Tropsha A, Isayev O, Varnek A, Schneider G, Cherkasov A. Integrating QSAR modelling and deep learning in drug discovery: the emergence of deep QSAR. Nature Reviews Drug Discovery, 2024, 23: 141–155.


一个值得纪念的时间节点

2020年3月11日,世界卫生组织正式宣布新冠为全球大流行。就在同一天,一篇论文上线,它报告了用深度学习方法对13亿个化合物进行虚拟筛选、锁定新冠主蛋白酶潜在抑制剂的结果。能在宣布大流行的当天就拿出初步筛选结果,背后正是这篇综述要讲的故事——深度QSAR如何把原本需要超级计算机数月才能完成的工作,压缩到普通课题组也负担得起的算力与时间之内。

这篇发表在 Nature Reviews Drug Discovery 上的展望文章,由计算药物设计领域的五位资深学者联合撰写。它选了一个很巧妙的纪念性时间点:2022年既是定量构效关系(QSAR)方法诞生的六十周年,又恰好是深度学习首次进入QSAR领域的十周年。作者借这个双重纪念,系统梳理了一个他们正式命名为深度QSAR的新兴方向。

下面,我们顺着药物发现的真实流程——分子怎么表征、怎么设计、怎么合成、怎么筛选、怎么算得更准——把这篇综述拆开来读,并在最后专门分析这篇综述本身是如何被构思组织的,以及它的批判性与前瞻性体现在何处。


二、一甲子的传承:从汉施方程到深度学习

QSAR的核心思想其实非常朴素:把一个分子的结构用数字描述出来,再去寻找这些数字与分子生物活性之间的数学关系。这一思路可以追溯到1962年 Hansch 等人的奠基性工作,他们把苯氧乙酸类化合物的生物活性与哈梅特取代基常数、分配系数关联了起来。

此后六十年,QSAR沿着两条线不断扩张:一条是分子表征越来越复杂,从一维数到四维;另一条是建模算法越来越强,从简单的线性回归,一路走到k近邻、支持向量机、随机森林、人工神经网络。与此同时,QSAR的理念也外溢到了材料科学、健康管理等多个数据密集型领域。

深度学习进入这个故事的时间,作者标定得很清楚:2012年Kaggle举办的默克分子活性挑战赛,是深度学习首次被用于QSAR建模的标志性事件。参赛者被要求用化合物结构生成的数值描述符建模,再去预测训练集之外化合物的活性。三年后的2015年,第一篇正式描述深度学习用于QSAR的论文发表。从那以后,这个领域论文已经超过200篇——深度QSAR正是在这股浪潮里成形的。


三、范式之变:从描述符工程到分子嵌入

如果要在整篇综述里挑出一个最根本的转变,那就是分子表征方式的改变。这也是理解深度QSAR与传统QSAR本质区别的钥匙。

传统QSAR遵循一种分两步走的逻辑:先用预先定义好的公式,从分子结构里算出一组显式的数值描述符(比如分子量、氢键供体数、极性表面积等),然后再把这些描述符喂给机器学习模型。描述符计算与模型学习是相互分离的两件事

深度QSAR则把这两件事融为一体。它不再依赖人工设计的描述符,而是用分子嵌入(molecular embedding)——直接从SMILES字符串或分子图这类标准输入出发,让神经网络在训练过程中自己学习出一组高维向量来表征分子。关键在于,这种表征的学习与模型的优化是不可分割的同一个过程:模型在学会预测的同时,也学会了该怎么看分子。

传统QSAR与深度QSAR的对比。两种方法都使用从一维到四维的分子输入表征。但传统QSAR(左侧)需要先从分子表征中计算出显式的数值描述符,再用于各类机器学习任务,描述符计算与机器学习彼此分离;而深度QSAR(右侧)则在潜在化学空间中,把分子表征的学习作为模型优化的一部分同步完成。
传统QSAR与深度QSAR的对比。两种方法都使用从一维到四维的分子输入表征。但传统QSAR(左侧)需要先从分子表征中计算出显式的数值描述符,再用于各类机器学习任务,描述符计算与机器学习彼此分离;而深度QSAR(右侧)则在潜在化学空间中,把分子表征的学习作为模型优化的一部分同步完成。

传统QSAR与深度QSAR的对比。两种方法都使用从一维到四维的分子输入表征。但传统QSAR(左侧)需要先从分子表征中计算出显式的数值描述符,再用于各类机器学习任务,描述符计算与机器学习彼此分离;而深度QSAR(右侧)则在潜在化学空间中,把分子表征的学习作为模型优化的一部分同步完成。

这一转变带来了一个实在的好处:深度QSAR更擅长处理多目标优化。通过知识迁移,模型可以同时利用针对不同任务的数据,从而提升每个任务的预测精度。不过作者在这里没有把话说满——他们明确指出,多任务相对单任务并非稳赚不赔,效果好坏取决于不同靶点活性之间的相关程度,相关性低时甚至可能反而更差。

更值得注意的是,作者反复强调:那些在传统QSAR时代就被反复叮嘱的老规矩——数据清洗、模型适用域评估、独立外部验证——在深度QSAR时代不仅没有过时,反而因为数据量暴增而变得更难做、更要紧。当数据集大到无法人工清洗时,就需要像基于KNIME的自动化流程这样的工具来保证模型的可信度。

围绕这套基本功,文章用了一个专门的方框(Box 1)来介绍QSAR建模的来龙去脉,包括一维到四维描述符的定义和经典机器学习方法的谱系。如果你想给读者补足背景,这个方框是很好的引用素材。

药物发现中的QSAR建模导论。系统介绍QSAR的基本数学形式、一维至四维描述符的分类,以及从k近邻、支持向量机到随机森林、神经网络的方法演进,并强调数据清洗与严格验证这些最佳实践的持续有效性。
药物发现中的QSAR建模导论。系统介绍QSAR的基本数学形式、一维至四维描述符的分类,以及从k近邻、支持向量机到随机森林、神经网络的方法演进,并强调数据清洗与严格验证这些最佳实践的持续有效性。

药物发现中的QSAR建模导论。系统介绍QSAR的基本数学形式、一维至四维描述符的分类,以及从k近邻、支持向量机到随机森林、神经网络的方法演进,并强调数据清洗与严格验证这些最佳实践的持续有效性。


四、化学空间的大爆炸

深度QSAR之所以在这十年里真正派上用场,离不开一个大背景:可供搜索的化学空间正在以惊人的速度膨胀。这部分内容综述同样放在一个方框里(Box 2),而其中那张ZINC数据库增长曲线图,是全文最有冲击力的一张图之一。

数字本身就足够震撼。以最常用的ZINC数据库为例,2006年它还不到一百万个分子,而最新的ZINC22版本已经超过370亿个独特化合物,增长超过五万倍,且最剧烈的增长就发生在最近两年。商业库同样在狂飙:Enamine REAL目前可提供约55亿个可订购化合物,其按需扩展的REAL Space在考虑异构体后可达约380亿。再往前看,研究者已经枚举出166.4亿个最多含17个原子的虚拟分子(GDB-17),而可触及的化学空间已经被展望到万亿乃至10的18次方量级。

ZINC数据库分子数量的增长。2004年约72.7万个,2012年约340万个,2015年约2.2亿个,2020年约14亿个,2022年达到约370亿个,呈现近乎指数式的爆发,且最陡峭的一段出现在最近几年。
ZINC数据库分子数量的增长。2004年约72.7万个,2012年约340万个,2015年约2.2亿个,2020年约14亿个,2022年达到约370亿个,呈现近乎指数式的爆发,且最陡峭的一段出现在最近几年。

ZINC数据库分子数量的增长。2004年约72.7万个,2012年约340万个,2015年约2.2亿个,2020年约14亿个,2022年达到约370亿个,呈现近乎指数式的爆发,且最陡峭的一段出现在最近几年。

这张图其实点出了整篇综述的核心矛盾:化学空间的扩张是机遇,更是挑战。当待筛分子从几百万跃升到几百亿,传统的逐一对接早已力不从心。如何在这样的巨型库里高效捞针,正是深度QSAR后半篇要解决的问题。


五、生成式设计:让AI从头造分子

虚拟筛选解决的是从现成分子库里挑分子,但真正的医药创新需要从头创造全新分子。这就是从头设计(de novo design)的用武之地,也是深度QSAR与生成式化学结合得最紧密的地方。

从头设计有两条技术路线。一条是基于规则的方法,用预设的分子砌块和虚拟反应规则像搭积木一样拼出新分子;另一条是无规则的生成式深度学习方法,它从训练数据的潜在分布(即潜空间)里采样出新分子,整个过程不显式地用化学语言表达,因此往往难以解释——这是它的优势,也是它的软肋。

目前主导这个领域的,是所谓化学语言模型。它把分子当成SMILES字符串这样的文本来处理,学习字符串内在的语法,再生成对应于真实新分子的新字符串。综述用一张大图集中展示了几类主流生成架构。

生成式分子设计。常用生成模型架构包括强化学习(a)、扩散模型(b)、生成对抗网络(c)和变分自编码器(d)。这些架构在如何利用潜空间中的分子嵌入来训练并生成新化合物上各有不同。生成模型(e,蓝框)用一批具有目标性质的分子训练,逼近训练数据的统计分布,再通过采样生成新分子;其生物活性既可用外部QSAR模型评分(红框),也可直接用模型内在的采样概率作为评判标准。在数据有限时,可借助少样本学习或迁移学习把通用生成模型偏置到目标分子上;模型强化则在QSAR模型与学习过程之间建立反馈回路。f中给出两个实例:化合物1是RORγ反向激动剂,化合物2是PI3Kγ抑制剂。
生成式分子设计。常用生成模型架构包括强化学习(a)、扩散模型(b)、生成对抗网络(c)和变分自编码器(d)。这些架构在如何利用潜空间中的分子嵌入来训练并生成新化合物上各有不同。生成模型(e,蓝框)用一批具有目标性质的分子训练,逼近训练数据的统计分布,再通过采样生成新分子;其生物活性既可用外部QSAR模型评分(红框),也可直接用模型内在的采样概率作为评判标准。在数据有限时,可借助少样本学习或迁移学习把通用生成模型偏置到目标分子上;模型强化则在QSAR模型与学习过程之间建立反馈回路。f中给出两个实例:化合物1是RORγ反向激动剂,化合物2是PI3Kγ抑制剂。

生成式分子设计。常用生成模型架构包括强化学习(a)、扩散模型(b)、生成对抗网络(c)和变分自编码器(d)。这些架构在如何利用潜空间中的分子嵌入来训练并生成新化合物上各有不同。生成模型(e,蓝框)用一批具有目标性质的分子训练,逼近训练数据的统计分布,再通过采样生成新分子;其生物活性既可用外部QSAR模型评分(红框),也可直接用模型内在的采样概率作为评判标准。在数据有限时,可借助少样本学习或迁移学习把通用生成模型偏置到目标分子上;模型强化则在QSAR模型与学习过程之间建立反馈回路。f中给出两个实例:化合物1是RORγ反向激动剂,化合物2是PI3Kγ抑制剂。

这部分最打动人的,是作者拿出的两个真实分子。化合物1是一个全新的RORγ反向激动剂,半数抑制浓度约370 nM,它作为采样概率估计下的最高分设计被挑出来——这个束搜索方法甚至不再严格需要一个显式的QSAR模型,而是直接依赖训练数据学到的统计分布。化合物2则更进一步:研究者用ELECTRA算法训练了一个由100个深度QSAR模型组成的集成,每个模型给候选分子投票;得票数最高的化合物2,对靶点PI3Kγ展现出约63 nM的强效抑制(Ki)。

不过,作者在这里也保持了清醒。他们坦言,真正包含实验验证的生成设计研究至今仍然稀少,只是刚刚开始出现。同时,生成分子的目标性质评估,是整个设计流程中最关键也最易出错的环节——AI能在几秒到几小时内提出候选分子,但把它合成出来做实验,反而成了当前的限速步骤。这就自然引出了下一个话题。


六、合成规划:把分子真正做出来

设计出来的分子,得有人能合成。计算机辅助合成规划是个老问题,可以追溯到Corey的开创性工作,而深度学习近年给它注入了新动力。

合成规划有正向与逆向两个方向。逆合成从目标分子出发倒推前体,正向合成则从砌块出发逐步生长。Segler等人的奠基性工作把深度神经网络与蒙特卡洛树搜索结合,用来评估各种转化的概率并挑出最可行的路径。方法上又分模板法与无模板法两类:

模板法依赖转化规则,这些规则要么由专家提炼,要么从反应数据库自动抽取。早期的LHASA是大约五十年前由Corey和Wipke开发的第一个有机合成规划专家系统;如今广为人知的CHEMATICA(也叫SYNTHIA)整合了超过五万条人工提炼的机理转化规则;而当前的主流趋势是从反应数据库自动抽取规则,AiZynthFinder就是这类工具的代表。

无模板法则直接推断反应物与产物结构之间的关系。其中一个很有意思的类比是:化学反应可以被当成一种语言翻译任务——反应物的SMILES字符串好比原文,产物的SMILES好比译文,于是NLP里的序列到序列模型就能拿来预测逆合成路线和反应产物。

除了能不能合成,还要评估好不好合成。合成可及性评分(如经典的SAscore)和合成复杂度评分(如SCScore)就是为此而生的筛选指标。更进一步,借助反应缩合图(CGR),研究者还能把反应物、产物乃至溶剂、温度的信息整合起来,去建模反应速率常数甚至反应条件。在反应条件预测上,有工作做到了在前十个预测中以约69.6%的比例命中实验条件。

作者由此勾勒出一个更大的图景:当分子设计与合成规划都能交给机器,全自动分子设计就成为可能——机器人平台可以在无人干预下,自己决定要合成什么分子、走什么合成路线。深度QSAR尤其擅长大数据和多任务优化,正好适合处理这类系统实时产生的海量数据,把模型预测即时翻译成新的合成指令。

不过这里作者依然没有过度乐观。他们指出反应产率预测的结果颇有争议:对高通量实验采集的数据,模型质量通常不错;可一旦换成从文献里东拼西凑的多样化反应数据,效果就相当差。这种诚实的判断,贯穿全文。


七、深度对接:十亿分子里的高效筛选

如果说前面讲的是设计与合成,那么这一节就是整篇综述技术含量最高、也最能体现深度QSAR价值的部分——基于结构的虚拟筛选。

当有靶点蛋白结构时,虚拟筛选通常分两步:先把分子对接进结合口袋摆出一个合理的姿势,再给这些姿势打分,用打分来排序、决定测哪些化合物。问题在于,对接打分必须先算出姿势才能进行,面对几十亿分子的库,即便用上现有算力也几乎不可能逐一完成。

深度对接(deep docking)正是为破解这一困境而生。它的思路其实非常巧妙:与其老老实实对接每一个分子,不如先对接一小部分,用得到的对接分数训练一个QSAR模型,让这个模型去预测剩下海量分子的对接结果,从而逐轮剔除低分分子。

深度对接的工作流程。深度对接用一个在部分对接分数上训练的QSAR模型,迭代预测超大库中其余分子的对接结果。流程大致为:第一步训练,随机抽取数据库的一小部分分子做常规对接,再训练深度神经网络把分子的Morgan指纹与按阈值(如前1%)二值化的对接分数关联起来;第二步预测,模型给库中其余分子打分,所有被判为活性的分子作为模拟虚拟命中并入下一轮训练集;随后在库缩减步骤中剔除被判为非活性的分子,并在每轮迭代中收紧活性与非活性的阈值。如此反复直到收敛,最终把始终高分的模拟命中真正对接进靶点位点。
深度对接的工作流程。深度对接用一个在部分对接分数上训练的QSAR模型,迭代预测超大库中其余分子的对接结果。流程大致为:第一步训练,随机抽取数据库的一小部分分子做常规对接,再训练深度神经网络把分子的Morgan指纹与按阈值(如前1%)二值化的对接分数关联起来;第二步预测,模型给库中其余分子打分,所有被判为活性的分子作为模拟虚拟命中并入下一轮训练集;随后在库缩减步骤中剔除被判为非活性的分子,并在每轮迭代中收紧活性与非活性的阈值。如此反复直到收敛,最终把始终高分的模拟命中真正对接进靶点位点。

深度对接的工作流程。深度对接用一个在部分对接分数上训练的QSAR模型,迭代预测超大库中其余分子的对接结果。流程大致为:第一步训练,随机抽取数据库的一小部分分子做常规对接,再训练深度神经网络把分子的Morgan指纹与按阈值(如前1%)二值化的对接分数关联起来;第二步预测,模型给库中其余分子打分,所有被判为活性的分子作为模拟虚拟命中并入下一轮训练集;随后在库缩减步骤中剔除被判为非活性的分子,并在每轮迭代中收紧活性与非活性的阈值。如此反复直到收敛,最终把始终高分的模拟命中真正对接进靶点位点。

这套方法的威力体现在一个标志性案例上:研究者仅用60个CPU核做Glide对接、4个GPU核训练神经网络,就完成了对ZINC15库中14亿个化合物针对新冠主蛋白酶的评估。前1000个命中(对应585个不同骨架)被公开,其中许多后来被独立确认为活性化合物。前文提到的那个在宣布大流行当天就发布结果的工作,正是这套方法。

深度对接发表后,类似的工作如雨后春笋。综述用一张表格系统汇总了这些用机器学习预测对接分数的虚拟筛选方法,对比了它们各自模拟的对接软件、用的配体描述符和QSAR函数。

用机器学习预测对接分数的虚拟筛选方法。汇总了从深度对接到DOCKSTRING等十余种代表性方法,逐一对比其所模拟的对接打分来源(如Glide、AutoDock-Vina、FRED等)、所用配体描述符(如Morgan指纹、扩展连接性指纹等)以及背后的QSAR函数(如深度神经网络、随机森林、贝叶斯优化、图神经网络等)。
用机器学习预测对接分数的虚拟筛选方法。汇总了从深度对接到DOCKSTRING等十余种代表性方法,逐一对比其所模拟的对接打分来源(如Glide、AutoDock-Vina、FRED等)、所用配体描述符(如Morgan指纹、扩展连接性指纹等)以及背后的QSAR函数(如深度神经网络、随机森林、贝叶斯优化、图神经网络等)。

用机器学习预测对接分数的虚拟筛选方法。汇总了从深度对接到DOCKSTRING等十余种代表性方法,逐一对比其所模拟的对接打分来源(如Glide、AutoDock-Vina、FRED等)、所用配体描述符(如Morgan指纹、扩展连接性指纹等)以及背后的QSAR函数(如深度神经网络、随机森林、贝叶斯优化、图神经网络等)。

更前沿的方向是共识深度对接。作者举了一个堪称壮观的例子:研究者把Glide、ICM、FRED、GPU-AutoDock和QuickVina2五个对接程序一起用上,针对新冠主蛋白酶筛选了400亿个分子(合并ZINC15与Enamine REAL Space)。整个过程在250个GPU和640个CPU核上跑了约90天,把初始库缩减了1500倍。借助五个程序加上配体结构聚类与药效团过滤,他们开发并评估了28种共识策略,其中26种完全自动化。在为每种自动策略订购并测试最多100个化合物时,部分策略命中率达到13%——已经相当可观。而两种引入专家最终审查的策略命中率分别达到16%和23%,明显胜出。

这个对比很值得玩味:它一方面证明深度对接已经能支撑全自动的超大库筛选,另一方面又诚实地承认,人类专家的经验眼下仍然能带来实打实的提升。作者还专门列出了深度对接的软肋:它本质上完全依赖对接软件现有的打分函数,因此打分函数的所有局限和缺陷,深度对接照单全收。换句话说,深度对接加速的是找高分分子的过程,而不是让打分本身变得更准。

这部分还延伸到了多重药理学建模。借助多任务学习联合建模新旧靶点的对接数据,能同时超越单任务学习和主动学习。更有想象力的是针对所谓冷靶点(即此前从未研究过、毫无已知配体的靶点)的策略:有研究用强化学习,从同源蛋白的已知配体出发启动生成模型,仅凭JAK1、JAK3、TYK2这几个近缘激酶的配体,就找到了JAK2激酶的潜在结合分子。


八、给量子力学装上加速器

打分不准是深度对接的命门,而要打分准,归根结底要把分子间相互作用算准——这就涉及量子力学计算。量子力学精确但极慢,长期以来难以用于QSAR和计算药物设计。深度学习给这个老大难问题带来了转机。

核心工具是原子神经网络势(NNP)。它能预测分子的能量等量子力学性质,在一大批有机分子上达到与密度泛函理论相当的精度,速度却快了六个数量级。配合主动学习,训练所需的数据量相比朴素随机采样可以减少多达90%。这个领域的代表性突破是ANI系列势,其中ANI-1是第一个面向有机分子的通用原子NNP,其精度可以逼近化学精度(误差约1 kcal/mol)。

更实用的是,这套机器学习势被用来改善配体结合自由能的计算。

深度学习势增强的分子模拟用于配体结合亲和力计算。用深度学习开发的机器学习(ML)势(a),通过一种ML与分子力学(MM)相结合的混合方案(b),提升蛋白-配体相互作用能的计算精度。其净效果是:把配体在真空中较不精确的MM势能,替换为更精确的ML势能。图中MM部分使用OpenFF小分子力场,ML部分使用ANI-2x。
深度学习势增强的分子模拟用于配体结合亲和力计算。用深度学习开发的机器学习(ML)势(a),通过一种ML与分子力学(MM)相结合的混合方案(b),提升蛋白-配体相互作用能的计算精度。其净效果是:把配体在真空中较不精确的MM势能,替换为更精确的ML势能。图中MM部分使用OpenFF小分子力场,ML部分使用ANI-2x。

深度学习势增强的分子模拟用于配体结合亲和力计算。用深度学习开发的机器学习(ML)势(a),通过一种ML与分子力学(MM)相结合的混合方案(b),提升蛋白-配体相互作用能的计算精度。其净效果是:把配体在真空中较不精确的MM势能,替换为更精确的ML势能。图中MM部分使用OpenFF小分子力场,ML部分使用ANI-2x。

效果是看得见的。在对酪氨酸蛋白激酶2(TYK2)抑制剂的结合自由能预测中,纯分子力学方法的均方根误差为0.97 kcal/mol,而用ML与MM混合方案校正后,误差降到了0.47 kcal/mol——精度几乎翻了一倍。此外,新一代的AIMNet模型受原子在分子中理论启发,用可学习的原子特征向量近似复杂的原子间相互作用,能在仅用6%训练数据的情况下,把溶剂化吉布斯自由能预测到1.8 kcal/mol的精度。学到的分子表征甚至能高精度预测对药物发现至关重要的性质,比如蛋白pKa值预测达到了0.5个对数单位的精度。

作者把这条线索收束得很漂亮:深度学习势不仅加速了量子力学计算,还提升了结合亲和力和分子性质计算的精度。而前面提到的深度对接命门正在于打分函数——又快又准的NNP,恰好有望改善打分函数,催生更准确的新一代深度对接方法。一条逻辑链就此闭合。


九、量子计算的远方,与已经显现的影响

展望部分,作者把视野进一步放远到量子计算。经典计算机用0和1这样的离散比特,而量子计算机用可以同时处于0和1的量子比特,借助叠加与纠缠特性,有望在量子化学计算和机器学习这两个与计算药物设计高度相关的领域实现颠覆性加速。从靶点发现、蛋白折叠,到生成式分子建模、对接与力场优化,量子计算已经在不少环节被初步评估。作者预期,未来计算药物设计的流水线将由多种为特定任务微调的混合模型来服务。

但全篇真正落地的判断,是对早期药物发现影响的评估。作者给出的态度相当克制:现在还太早,深度学习乃至深度QSAR尚未促成任何一款已获批的药物。话虽如此,越来越多的证据表明,这些方法确实加速了临床前研究阶段。2020年Exscientia宣布其首个AI设计的候选药物进入一期临床,多家公司随后跟进;Exscientia称仅用12个月就完成了临床前的探索研究阶段,而Insilico Medicine则报告,从发现新靶点开始,用30个月开发出了一个AI设计的抗纤维化一期临床候选药物。

作者借Gartner技术成熟度曲线给出了自己的定位判断:深度QSAR正开始走向生产力的高原期。它不再是炒作高峰上的概念,而是逐渐沉淀为能持续加速小分子药物候选发现的实用工具——这一点在面对新冠这类突发、难预测的传染病威胁时尤为重要。


底层逻辑

读完内容,更值得退一步看看:作为一篇综述,它本身是如何被设计的?好的综述不只是文献的堆叠,而是一种有立场、有结构的论证。这篇文章在这三个维度上都很有代表性。

1. 构思与组织:用一条流水线串起一个新领域

这篇综述最聪明的一步,是给一个本来略显松散的研究方向起了个名字——深度QSAR,并用双重纪念(QSAR六十年加深度学习十年)作为叙事钩子。这个框架一上来就把文章定位为里程碑式的回顾,而不是又一篇技术罗列,赋予了全文一种历史纵深感。

在主体结构上,作者没有按算法分类来组织,而是沿着药物发现的真实工作流来铺陈:分子怎么表征(基础)、怎么设计(生成)、怎么合成(规划)、怎么筛选(对接)、怎么算得更准(量子力学),最后落到影响。这条线索几乎完全对应于设计-合成-测试-分析这一经典闭环。这样组织的好处是,读者无论来自哪个细分方向,都能在自己熟悉的位置找到入口,同时又能看清各模块之间的衔接关系。

另一处值得学习的手法,是用三个独立方框(基础QSAR、化学空间扩张、分子制图)把基础性或旁支性的内容剥离出去,让主线叙事保持紧凑。作者还在引言里明确划定了边界——ADMET预测、GPU硬件细节等虽与深度QSAR相关,但被有意排除在外,理由是讨论它们会扩展篇幅却无助于深化主旨。这种主动取舍,本身就是综述质量的体现。

更深一层看,这篇文章其实在做一件事:为一个新兴领域确立边界、术语和谱系。它把分散在两百多篇论文里的进展,收拢进一个统一的概念框架之下。从这个意义上说,这不只是一篇综述,更像是一份领域宣言。

2. 批判性:处处可见的不把话说满

这篇综述最难得的品质,是它的诚实。它没有把深度学习包装成万灵药,而是在每一个看似乐观的结论后面,都补上了一句冷静的限定。这种批判性至少体现在以下几处:

  • 多任务学习并非稳赚不赔,效果取决于不同靶点活性之间的相关程度,相关性低时甚至可能更差;
  • 反应产率预测的结果颇有争议,对高通量数据好用,对文献来源的多样化数据则相当差;
  • 生成式设计中真正含实验验证的研究至今稀少,只是刚刚起步;
  • 深度对接完全依赖现有打分函数,因此继承了后者所有的局限和缺陷;
  • 在共识对接的命中率对比中,作者坦承引入专家审查的策略(16%、23%)明显优于全自动策略(13%),承认人类经验眼下仍有不可替代的价值;
  • 在影响评估上,作者直言现在还太早,深度QSAR尚未促成任何获批药物。

把这些限定串起来看,会发现作者的批判并非零散的免责声明,而是有意识地提醒读者:深度QSAR加速的是流程,而非保证了正确性。无论是生成分子的活性评估,还是深度对接的打分,最终瓶颈都落在评估或打分的准确性上。这个一以贯之的主线判断,正是全文批判性的内核。

3. 前瞻性:技术远景之外,更看重可及性

这篇综述的前瞻性是多层次的。表层上,它指向了若干技术远景:全自动的闭环药物发现、自驱动实验室、量子计算对量子化学和机器学习的颠覆性加速、用NNP改善打分函数从而催生新一代深度对接。

但真正让这篇文章的前瞻视角与众不同的,是它反复强调的一个非技术主题——民主化与开源。作者明确指出,超大库的常规对接对全球大多数研究者并不可负担,软件许可和高性能计算的成本是一道现实门槛。而深度学习方法的价值,恰恰在于它们更易获取、更便宜,从而为药物发现的全球民主化提供了机会。文中专门呼吁开源和图形界面化的实现,好让超大化学库的虚拟筛选惠及更广泛的研究社区。

这是一个很有分量的视角:它把评判标准从单纯比拼性能,转向了谁能用得起。在一个动辄需要数万CPU、相当于几十年连续计算量的研究领域里,这种对公平性与可及性的关注,让整篇展望超越了纯技术叙事,多了一层对科研生态的关怀。

最后,作者用Gartner成熟度曲线给出定位——深度QSAR正走向生产力的高原期——既不否认它曾经的炒作色彩,也不夸大它当下的成就,而是落在一个克制而可信的判断上。这种分寸感,或许正是一篇优秀展望文章最该有的姿态。


结语

把这篇综述读完,会得到一幅相当完整的图景:深度学习并没有推翻QSAR六十年积累的方法论,而是在分子表征这个最根本的环节上,把它带入了一个新范式;继而沿着设计、合成、筛选、计算这条流水线,逐一突破原先被算力和精度卡住的瓶颈。化学空间在以指数速度扩张,而深度QSAR提供的,正是在这片浩瀚空间里高效、且人人用得起地导航的工具。

它尚未交出第一款获批新药,但已经实实在在地缩短了通往临床的时间。对于这样一个刚刚走上生产力高原的领域,比起追问它能不能成,或许更值得期待的是——当算力、数据和算法继续向前,又有多少原本不可负担的探索,会变成寻常课题组也做得起的日常。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一个值得纪念的时间节点
  • 二、一甲子的传承:从汉施方程到深度学习
  • 三、范式之变:从描述符工程到分子嵌入
  • 四、化学空间的大爆炸
  • 五、生成式设计:让AI从头造分子
  • 六、合成规划:把分子真正做出来
  • 七、深度对接:十亿分子里的高效筛选
  • 八、给量子力学装上加速器
  • 九、量子计算的远方,与已经显现的影响
  • 底层逻辑
    • 1. 构思与组织:用一条流水线串起一个新领域
    • 2. 批判性:处处可见的不把话说满
    • 3. 前瞻性:技术远景之外,更看重可及性
  • 结语
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档