
期刊: Journal of Chemical Information and Modeling 链接: https://doi.org/10.1021/acs.jcim.5c00817 代码: https://github.com/zzzzld/MTGNN
简介: 该论文提出了MTGNN模型,用于预测药物-靶点-疾病三元组关联,解决现有方法忽视三元组方向性依赖和协同机制的问题。MTGNN构建包含方向感知元路径的异构图,利用双路径Transformer架构整合生物实体的拓扑结构和语义特征,并通过交叉注意力机制促进跨模态交互。实验在肿瘤相关GTD数据集上进行,采用5折交叉验证,结果显示MTGNN在NDCG、MRR、AUC等指标上优于Tucker、HyperAttentionDTI等多种基线模型,消融实验验证了多模态集成等组件的有效性。该研究为药物重定位提供了有效的计算工具,展现了在复杂生物网络中建模三元组关系的优势。

期刊: Journal of Chemical Information and Modeling 链接: https://doi.org/10.1021/acs.jcim.5c00584 代码: https://github.com/Whhhzc/biological-information/tree/main
简介: 论文提出MNopt框架,将蒙特卡洛树搜索(MCTS)与多目标遗传算法(NSGA-II)结合,用于分子优化,解决传统方法生成分子有效性和可行性低的问题。MNopt利用NSGA-II的非支配排序和拥挤度距离机制平衡多目标优化,通过MCTS增强分子结构有效性,无需大量训练数据。实验针对阿尔茨海默病相关的JNK3和GSK3β抑制剂,优化QED和SA等属性,在成功率、新颖性和多样性指标上优于JT-VAE、MolDQN等基线模型,消融实验验证了组合算法的优势。该研究为分子设计提供了高效工具,在多目标优化中表现出良好性能。

期刊: Journal of Chemical Information and Modeling 链接: https://doi.org/10.1021/acs.jcim.5c00944 代码: https://github.com/HIM-AIM/MOFF
简介: 论文提出MOFF框架,通过基于功能片段的强化学习生成共价和非共价分子,解决现有生成框架缺乏基于片段的共价分子设计问题。MOFF以对接分数为奖励函数,使用Soft Actor-Critic算法训练,支持共价弹头整合。实验针对BTK和EGFR靶点,在对接分数、命中率等指标上优于FREED、LIMO等基线模型,生成分子具有良好的药物样属性,分子动力学模拟验证了结合稳定性。该研究为基于片段的分子生成提供了灵活框架,在共价和非共价分子设计中展现出优势。

期刊: arxiv 链接: https://arxiv.org/abs/2506.05628v1 代码: https://huggingface.co/ibm-research/GP-MolFormer-Uniq
简介: 该论文提出了一种无需训练的方法GP-MOLFORMER-SIM,利用生成化学语言模型(CLM)在分子空间中导航和采样,以目标分子的分子相似性为指导,通过CLM学习到的上下文表示来估计分子相似性,调整CLM的自回归采样策略,在解码过程中跟踪当前生成与目标的距离并更新对数几率,促使生成保持相似性。该方法基于约4700万参数的GP-MOLFORMER模型,还集成到遗传算法中,在涉及属性优化、分子重新发现和基于结构的药物设计等标准分子优化基准测试中进行了测试。结果表明,GP-MOLFORMER-SIM与GA结合在黑盒预言机情况下优于现有的无训练基线方法,为理解和指导CLM的生成机制迈出了一步。

期刊: arxiv 链接: https://arxiv.org/abs/2506.05427v1 代码: https://github.com/ZishanShu/MTPNet
简介: 论文提出了Multi-Grained Target Perception网络(MTPNet)用于统一的活性悬崖预测,这是首个将受体蛋白信息纳入活性悬崖预测的条件框架,通过多粒度蛋白质语义条件动态优化分子表示。MTPNet包含宏观目标语义(MTS)指导和微观口袋语义(MPS)指导两个组件,通过条件深度学习内化相互作用模式。在30个有代表性的活性悬崖数据集上的实验表明,MTPNet显著优于先前方法,在几种主流GNN架构上平均RMSE提高了18.95%,在分类任务上也表现出色,如在CYP3A4数据集上AUC达到0.924,且作为插件能显著提升多种主流GNN架构的预测性能,为加速化合物优化和设计提供了有效框架。

期刊: arxiv 链接: https://arxiv.org/abs/2505.21469v2
简介: 该论文提出了PropMolFlow,一种基于几何完整SE(3)等变流匹配的属性引导分子生成新方法。它将五种不同的属性嵌入方法与标量属性的高斯展开相结合,在各种属性的条件分子生成中实现了与先前最先进扩散模型相当的性能,同时保持了生成分子的稳定性和有效性,且推理速度更快,时间步长显著少于基线模型。实验在QM9数据集上进行,结果表明PropMolFlow在标准指标如分子稳定性和PoseBuster有效性等方面表现出色,还引入了新的属性指标评估模型生成属性值代表性不足分子的能力,揭示了现有结构指标的不足。该研究为开发有针对性的属性引导生成方法铺平了道路,增强了分子生成模型在各种应用中的设计。

期刊: biorxiv 链接: https://doi.org/10.1101/2025.03.16.643501
简介: 论文提出了COMRADE框架,通过CE-Screen模块利用蛋白质语言模型嵌入、分子转换器和基于物理的相互作用势编码等七种高维预训练表示,结合对比压缩神经网络和轻量级集成分类器,实现快速筛选,比对接快约100倍。实验在D-DUD-E、BindingDB和ChEMBL等数据集上进行,CE-Screen在回顾性基准上表现优于现有端到端模型,AUPRC提升最高达111.11%,并成功用于筛选1080万化合物,为五个靶点发现新命中物,包括代谢疾病和肿瘤学中的BCKDK新支架。该研究提供了一个模块化、可扩展的配体发现框架,为加速药物发现提供了有效途径。
