人工智能(AI)如何在我们最关心的健康领域,特别是药物设计中大显身手。即将落幕的ICLR 2025大会上,涌现了一大批令人兴奋的研究成果,预示着AI正以前所未有的速度和深度,加速新药发现的进程。本文汇总了几个热门方向的最新进展,具体每个领域的文章总结请参照前面相应的推文!
AI不仅能理解分子,还能“创造”出具有特定药效的全新分子?这正是ICLR 2025上的一大看点。
SynFlowNet 和 RXNFLOW 这样的新模型,在生成分子时就考虑到了“怎么合成”的问题,直接从可行的化学反应出发,确保了生成分子的“可落地性”。 UniGEM 模型则尝试将两者统一,一边生成分子,一边优化性质预测,实现“边造边调”,效率更高。 NExT-Mol 巧妙地结合了1D语言模型处理序列的优势和3D扩散模型处理空间的优势,让生成的3D分子既化学有效,几何结构也更精确。而 3D-MolT5 则更进一步,将3D结构信息转化为离散标记,与文本信息一起学习,让模型对分子的理解更立体。 MOLLEO 将LLM的“智慧”融入进化算法,更聪明地在庞大的化学空间中搜索更优的分子。Atomas 则致力于让模型更精细地理解分子结构与相关文本描述之间的联系。
蛋白质是生命活动的主要执行者,理解它们的结构至关重要。AI 在这方面也取得了惊人进展。
AlphaFold 3不仅能预测蛋白质结构,还能处理DNA、RNA和小分子,真正实现了对生物大分子复合物的统一建模,其基于扩散模型的结构预测模块代表了新的方向。 cryoSPHERE 利用AI技术分析冷冻电镜数据,更好地捕捉蛋白质不同状态下的构象变化。DynamicFlow 则尝试将蛋白质的动态性直接融入药物设计,模拟从“空闲”到“工作”状态的变化。 ISM 通过巧妙的“结构蒸馏”,将结构信息编码进序列模型,提升了预测性能。 ProtComposer 允许我们像搭积木一样,通过设定椭球布局来控制生成蛋白质的整体形态。ProtPainter则能让我们通过“手绘”或“拖拽”3D曲线来引导蛋白质骨架的生成,实现更精确的拓扑控制。
找到合适的药物分子后,它如何与靶点蛋白结合?结合的强度如何?药效如何?这些都是关键问题。
PharmacoMatch 将药效团筛选问题转化为图匹配问题,利用神经网络大幅提升了筛选效率。 FLEXDOCK 和 FABFlex 等模型在对接时考虑了蛋白质的柔性,让预测结果更接近真实情况。GROUPBIND 则利用同一靶点的多个配体信息进行协同对接。 CheapNet 通过分层表示和注意力机制,更高效准确地预测蛋白与配体的结合强度。 LAC 通过课程学习策略,让模型更擅长区分这类“棘手”分子。SIU 则构建了更严格的数据集和评估标准,推动生物活性预测走向更实用的阶段。
具体见今天发送的另外一篇推文😄
除了小分子药物,抗体、多肽以及新型材料也是研发的热点。
RADAb 利用检索到的相似结构信息来指导抗体设计,生成更符合结构要求的抗体序列。IgGM 则致力于无模板的功能性抗体和纳米抗体设计。 CloneBO 借鉴了免疫系统抗体进化的规律,结合贝叶斯优化,更高效地指导抗体序列的优化。 PepHAR 先识别肽链上的关键“热点”残基,再进行自回归扩展,精准生成功能性肽。 CrysBFN 和 TGDMat 专注于解决晶体材料生成中的周期性对称难题,前者利用贝叶斯流网络,后者则首次实现了文本引导的晶体生成。SymmCD 则在生成过程中显式地整合了晶体学对称性。
具体见今天发送的另外一篇推文😄
药物设计离不开底层的物理化学原理,大模型的融入也带来了新的可能性。
EG-XC 利用等变图神经网络改进了密度泛函理论(DFT)中的计算,提升了能量预测的准确性。WANet 则致力于提升Kohn-Sham哈密顿量预测在大分子体系中的可扩展性。 知识蒸馏 方法可以将大模型压缩成快速专用模型,同时保持精度。 Llamole 是首个能进行文本和图交错生成的多模态大模型,能同时进行分子逆向设计和逆合成路线规划。MOOSE-Chem 则探索用LLM自动发现化学研究假设。ChemAgent 通过自更新知识库提升LLM在化学任务中的推理能力。OSDA Agent 则利用LLM作为“大脑”,结合计算工具进行有机结构导向剂的设计。
随着 AI 制药走入深水区,结构生成、亲和力预测与抗体优化等任务纷纷拥抱大模型、扩散建模与物理感知。ICLR 2025 已然超越了单纯的机器学习竞技场,它正成为一面旗帜,引领着人工智能与生命科学走向前所未有的深度融合。