首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | LigUnity利用对比学习,采用列表排序方法,在虚拟筛选和先导化合物优化中均表现出色

AI+Drug 文献速递 | LigUnity利用对比学习,采用列表排序方法,在虚拟筛选和先导化合物优化中均表现出色

作者头像
用户1151118
发布2026-01-08 11:36:21
发布2026-01-08 11:36:21
690
举报

1. A foundation model for protein-ligand affinity prediction through jointly optimizing virtual screening and hit-to-lead optimization

biorxiv https://doi.org/10.1101/2025.02.17.638554

本文提出了一种名为LigUnity的基础模型,通过联合优化虚拟筛选和先导化合物优化来预测蛋白质-配体结合亲和力,创新点在于将这两个任务统一在一个模型中以提高性能。该方法利用对比学习进行虚拟筛选,采用列表排序方法进行先导化合物优化,并在八个基准数据集上进行了验证,结果显示在DUD-E和DEKOIS 2.0基准上性能提升了50%以上,且在未见过的蛋白质上表现出良好的泛化能力。实验表明,LigUnity在虚拟筛选和先导化合物优化中均表现出色,能够有效加速药物发现流程。


2. Protein–Ligand Affinity Prediction via Jensen–Shannon Divergence of Molecular Dynamics Simulation Trajectories

biorxiv https://doi.org/10.1101/2025.02.17.638772

本文提出了一种基于Jensen-Shannon散度的蛋白质-配体结合亲和力预测方法,创新点在于通过引入JS散度减少了计算成本,并利用AutoDock Vina的粗估结果确定PC1与ΔG的相关性符号。该方法在BRD4、PTP1B和JNK1数据集上进行了验证,结果显示在200ns的模拟时间内保持了与400ns相当的准确性,且计算时间显著减少。实验表明,该方法在减少计算成本的同时,仍能有效预测蛋白质-配体结合亲和力。


3. Concept-Driven Deep Learning for Enhanced Protein-Specific Molecular Generation

arxiv https://arxiv.org/abs/2503.08160

本文提出了一种基于概念驱动的深度学习框架,用于生成特定蛋白质的分子,创新点在于通过整合蛋白质亚口袋和分子臂的概念,结合扩散模型生成分子骨架,提高了合成可行性和结合亲和力。该方法在PDBbind2020和Crossdocked数据集上进行了训练和测试,结果显示生成的分子在药物相似性和合成可行性上分别提高了4%和6%。实验表明,该方法在分子生成中具有较高的解释性和实用性。


4. Integrated Computational and Experimental Insights Into MEK1/2 Inhibitors: Structural Validation, Docking, ADMET, Molecular Dynamics, and Anticancer Evaluation

Chemistry & Biodiversity https://doi.org/10.1002/cbdv.202402907

本研究通过整合计算和实验方法,深入探讨了MEK1/2抑制剂的结构验证、分子对接、ADMET分析、分子动力学模拟及抗癌活性评估,创新性地揭示了RO5126766作为高效MEK1/2抑制剂的潜力。研究采用分子对接、分子动力学模拟、DFT计算和ADMET预测等计算方法,结合体外抗癌实验,验证了RO5126766与MEK1/2的高结合亲和力和稳定性,并在MCF-7、MDA-MB-231和A549细胞系中表现出显著的抗癌活性(IC50值分别为12.87±98.36 nM、15.08±94.36 nM和60.89±70.58 nM)。实验数据来自Protein Data Bank(PDB ID: 1S9J和1S9I)和PubChem数据库,结果表明RO5126766具有高胃肠道吸收和低血脑屏障通透性,适合作为靶向抗癌药物。综上所述,本研究通过多学科交叉方法,成功验证了RO5126766作为MEK1/2抑制剂的临床潜力,为癌症治疗提供了新的候选药物。


5. Multidependency Graph Convolutional Networks and Contrastive Learning for Drug Repositioning

Journal of Chemical Information and Modeling https://doi.org/10.1021/acs.jcim.4c02424

本文提出了一种基于多依赖图卷积网络(MDGCN)和对比学习的药物重定位方法,创新性地通过构建多依赖图并结合跨视图和跨层对比学习,有效解决了现有方法在处理节点特定信息和数据稀疏性方面的不足。MDGCN利用药物和疾病的相似性矩阵以及药物-疾病关系矩阵构建多依赖图,并通过多层图卷积网络传播节点特定信息,同时引入对比学习策略增强节点嵌入的一致性。实验在四个基准数据集(Fdata、Cdata、LRSSL、Ldata)和一个多关系数据集(DB-KEGG)上进行,结果表明MDGCN在药物-疾病关联预测中优于七种先进方法,尤其在AUPRC和AUROC指标上表现突出。MDGCN通过整合多依赖图和对比学习,显著提升了药物重定位任务的性能。


6. Enhancing Unconditional Molecule Generation via Online Knowledge Distillation of Scaffolds

Molecules https://doi.org/10.3390/molecules30061262

本文提出了一种基于在线知识蒸馏的框架(OMG),通过结合GPT模型和Transformer模型,将分子骨架信息融入无条件分子生成任务中,从而提高了生成分子的有效性和新颖性。该方法通过互学习和对抗蒸馏策略,使GPT模型在生成SMILES字符串时能够学习到骨架结构信息,同时避免引入偏差。实验在MOSES和GuacaMol两个公开数据集上进行,结果表明OMG框架在有效性和新颖性方面均优于现有方法,生成的分子在化学性质和生物活性上表现出良好的平衡。该研究为药物发现中的分子生成提供了新的思路,展示了在探索新药物候选分子方面的潜力。


7. Protein-ligand interaction prediction based on heterogeneity maps and data enhancement

Journal of Biomolecular Structure and Dynamics https://doi.org/10.1080/07391102.2025.2475229

本文提出了一种基于异构图和数据增强的蛋白质-配体相互作用预测模型HGEF-Net,创新地结合了异构图表示和对比学习策略,以解决现有模型在稀疏和不平衡数据集上性能不佳的问题。方法上,HGEF-Net通过异构图信息学习模块深入分析分子子图和子结构,利用多级对比学习进行数据增强,并通过异质注意力融合模块有效整合分子内和分子间特征。实验在BindingDB和Davis数据集上进行,结果表明HGEF-Net在AUC、AUPRC、Precision和Recall等指标上均优于现有模型,特别是在Davis数据集上,数据增强模块显著提升了各项性能。该研究为药物发现中的蛋白质-配体相互作用预测提供了更高效和鲁棒的解决方案。


8. A Reinforcement Learning-Driven Transformer GAN for Molecular Generation

arxiv https://arxiv.org/abs/2503.12796v1

本文提出了一种基于Transformer和强化学习的生成对抗网络RL-MolGAN,用于生成具有特定化学性质的分子,创新点在于首次采用先解码后编码的Transformer结构,并结合强化学习和蒙特卡洛树搜索优化分子生成。方法上,RL-MolGAN通过Transformer解码器生成SMILES字符串,编码器作为判别器,并通过RL和MCTS增强生成分子的化学性质。实验在QM9和ZINC数据集上进行,验证了模型在生成高质量分子结构方面的有效性。总结来说,RL-MolGAN为分子生成提供了一种新颖且高效的框架。


9. Scalable Runtime Architecture for Data-driven, Hybrid HPC and ML Workflow Applications

arxiv https://arxiv.org/abs/2503.13343v1

本文介绍了一种可扩展的运行时架构,用于支持混合HPC和ML工作流应用,创新点在于通过服务化执行扩展了RADICAL-Pilot,实现了分布式ML能力和高效的资源管理。方法上,该架构通过服务接口支持本地和远程平台的HPC/ML耦合,并设计了通用服务接口以执行异构计算任务。实验在LUCID项目的三个代表性工作流中进行,验证了架构在并发执行ML模型时的低开销和高效性。总结来说,该架构为AI-out-HPC混合工作流提供了可扩展的解决方案。


10. SMPR: A structure-enhanced multimodal drug-disease prediction model for drug repositioning and cold start

arxiv https://arxiv.org/abs/2503.13322

本文提出了一种结构增强的多模态药物-疾病关系预测模型SMPR,用于药物重定位和冷启动问题,创新点在于通过Mol2VEC方法生成药物嵌入表示,并结合异构图神经网络学习疾病嵌入表示。方法上,SMPR利用药物SMILES结构和异构图神经网络分别生成药物和疾病的嵌入表示,并构建药物-疾病关系矩阵。实验在Fdataset、Cdataset和KEGG等数据集上进行,验证了模型在重定位和冷启动任务中的高AUC和ACUPR表现。总结来说,SMPR为药物重定位和冷启动提供了一种有效的多模态预测方法。


11. SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models

arxiv https://arxiv.org/abs/2503.12602

本文提出了一种基于Llama3大语言模型(LLMs)的SynLlama工具,用于生成可合成的分子及其类似物,创新点在于通过微调LLMs生成包含常见构建块和有机反应模板的完整合成路径,显著减少了数据需求并扩展了可合成化学空间。方法上,SynLlama通过监督微调(SFT)策略,使用SMILES和SMARTS格式的化学反应数据,训练模型生成合成路径。实验使用了Enamine构建块和ChEMBL数据集,结果显示SynLlama在合成路径规划、类似物生成和命中扩展任务中表现优异,尤其是在未训练的外部构建块上也能有效泛化。总结而言,SynLlama为药物发现提供了一种高效且数据需求较低的工具,显著提升了分子合成的可行性和多样性。


12. PERC: a suite of software tools for the curation of cryoEM data with application to simulation, modelling and machine learning

arxiv https://arxiv.org/abs/2503.13329

本文介绍了一套名为PERC的开源Python软件工具集,旨在简化冷冻电镜(cryoEM)数据的整理和应用,支持模拟、建模和机器学习。PERC包含三个主要工具:profet用于从PDB和AlphaFold数据库下载蛋白质结构,EMPIARreader支持从EMPIAR档案中懒加载数据集,CAKED则用于将数据加载到PyTorch中以进行机器学习训练。实验部分展示了如何使用这些工具从PDB和AlphaFold下载蛋白质结构,从EMPIAR加载冷冻电镜图像数据集,并通过CAKED进行数据处理和模型训练。这套工具显著降低了数据整理的负担,提升了冷冻电镜数据的可访问性和处理效率,为结构生物学研究提供了强有力的支持。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. A foundation model for protein-ligand affinity prediction through jointly optimizing virtual screening and hit-to-lead optimization
  • 2. Protein–Ligand Affinity Prediction via Jensen–Shannon Divergence of Molecular Dynamics Simulation Trajectories
  • 3. Concept-Driven Deep Learning for Enhanced Protein-Specific Molecular Generation
  • 4. Integrated Computational and Experimental Insights Into MEK1/2 Inhibitors: Structural Validation, Docking, ADMET, Molecular Dynamics, and Anticancer Evaluation
  • 5. Multidependency Graph Convolutional Networks and Contrastive Learning for Drug Repositioning
  • 6. Enhancing Unconditional Molecule Generation via Online Knowledge Distillation of Scaffolds
  • 7. Protein-ligand interaction prediction based on heterogeneity maps and data enhancement
  • 8. A Reinforcement Learning-Driven Transformer GAN for Molecular Generation
  • 9. Scalable Runtime Architecture for Data-driven, Hybrid HPC and ML Workflow Applications
  • 10. SMPR: A structure-enhanced multimodal drug-disease prediction model for drug repositioning and cold start
  • 11. SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models
  • 12. PERC: a suite of software tools for the curation of cryoEM data with application to simulation, modelling and machine learning
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档