首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | LigUnity作为一种多功能基础模型,能够显著提高药物发现流程中的效率和准确性

AI+Drug 文献速递 | LigUnity作为一种多功能基础模型,能够显著提高药物发现流程中的效率和准确性

作者头像
用户1151118
发布2026-01-08 12:41:34
发布2026-01-08 12:41:34
240
举报

1. A foundation model for protein-ligand affinity prediction through jointly optimizing virtual screening and hit-to-lead optimization

期刊:bioRxiv

链接:https://www.biorxiv.org/content/10.1101/2025.02.17.638554v1

简介:本文提出了一种名为LigUnity的基础模型,通过联合优化虚拟筛选和先导化合物优化来预测蛋白质-配体结合亲和力,创新性地结合了对比学习和列表排序方法。LigUnity利用对比学习区分活性与非活性配体,并通过列表排序学习配体与蛋白质口袋的精细相互作用,从而在虚拟筛选和先导化合物优化任务中表现出色。实验在DUD-E、DEKOIS 2.0、LIT-PCBA等基准数据集上进行,结果显示LigUnity在虚拟筛选中优于24种竞争方法,并在先导化合物优化中表现出色,特别是在FEP基准测试中表现出强大的泛化能力。LigUnity作为一种多功能基础模型,能够显著提高药物发现流程中的效率和准确性。

2. From part to whole: AI-driven progress in fragment-based drug discovery

期刊:Current Opinion in Structural Biology

链接:https://doi.org/10.1016/j.sbi.2025.102995

简介:本文综述了人工智能在基于片段的药物发现(FBDD)中的应用,创新点在于利用深度学习、强化学习等AI技术优化片段生长、合并和连接策略,显著提高了分子设计的准确性和效率。研究方法包括使用变分自编码器(VAE)、强化学习(RL)和SE(3)-等变模型等AI模型,结合片段热点图和蛋白质-配体相互作用信息,生成具有高结合亲和力和药物相似性的分子。实验部分详细介绍了多个模型(如STRIFE、MRGVAE、ReBADD-SE等)在不同数据集(如ZINC15、ChEMBL、PDBBind等)上的训练和测试结果,展示了这些方法在化学空间探索和分子优化中的有效性。总结指出,AI驱动的FBDD方法在降低成本和加快药物发现进程方面具有巨大潜力,但仍需解决数据质量和模型解释性等挑战。

3. AI-driven de-novo design and development of non-toxic DYRK1A inhibitors

期刊:ChemRxiv

链接:https://chemrxiv.org/engage/chemrxiv/article-details/67b74f386dde43c908b9a627

简介:本文通过整合多种人工智能方法,成功设计并开发了无毒性的DYRK1A抑制剂,创新性地结合了预测模型和生成算法,提出了一种双靶点药物发现框架。研究方法包括使用定量构效关系(QSAR)模型预测化合物亲和力,以及通过定向消息传递神经网络(DMPNN)评估毒性,生成阶段则采用分层图生成模型设计潜在抑制剂,并通过分子对接、合成和实验验证。实验使用了ChEMBL数据库中的DYRK1A抑制剂数据集和Tox21毒性数据集,最终筛选出具有纳摩尔级抑制活性的化合物,并验证了其抗氧化和抗炎特性。该研究展示了AI在药物设计中的强大潜力,为开发新型DYRK1A抑制剂提供了有效途径。

4. CGsmiles: A Versatile Line Notation for Molecular Representations Across Multiple Resolutions

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2025-vhbnq

简介:本文提出了一种名为CGsmiles的多分辨率分子表示方法,创新性地解决了粗粒化(CG)模型中原子分组映射的标准化问题。该方法基于SMILES和BigSMILES的语法,能够在一个字符串中编码分子图和粒子属性,并支持不同分辨率之间的无缝转换。通过构建包含407个Martini力场分子的基准数据集,作者展示了CGsmiles在描述复杂CG模型中的关键特性,并利用CGsmiles索引数据训练了两个机器学习模型,用于预测分配系数,结果表明多分辨率图神经网络(GNN)优于随机森林模型。CGsmiles不仅简化了CG模型的映射和索引,还为高分子和随机聚合物的表示提供了灵活性,未来有望在CG模拟和机器学习应用中发挥重要作用。

5. Scaffold Hopping with Generative Reinforcement Learning

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2024-gd3j4-v2

简介:本文提出了一种名为RuSH(Reinforcement Learning for Unconstrained Scaffold Hopping)的新方法,通过无约束的分子生成和强化学习来优化药物设计中的骨架跃迁,创新点在于其能够生成具有高三维和药效团相似性但低骨架相似性的分子。该方法结合了全分子生成和专门设计的评分函数,利用REINVENT框架进行强化学习,并通过ScaffoldFinder算法识别分子中的骨架和装饰部分。实验在四个蛋白质靶点上进行,使用了ChEMBL数据集,结果表明RuSH在生成已知骨架跃迁类似物和设计新骨架跃迁候选分子方面表现出色,相比现有方法在分子质量和多样性上具有优势。总结来说,RuSH通过无约束生成和强化学习显著提升了骨架跃迁的效率和多样性。

6. Exploring BERT for Reaction Yield Prediction: Evaluating the Impact of Tokenization, Molecular Representation, and Pre-training Data Augmentation

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2025-nq3xn

简介:本文系统评估了BERT模型在预测Buchwald-Hartwig和Suzuki-Miyaura反应产率中的表现,创新性地探讨了分子表示、分词方法和预训练数据增强对模型性能的影响。研究采用多种分子表示(如SMILES、DeepSMILES、SELFIES等)和分词方法(如BPE、WordPiece、SentencePiece等),并通过公开的高通量实验(HTE)数据集进行模型训练和验证。实验结果表明,BPE和SentencePiece分词方法表现最佳,而WordPiece与SELFIES或基于指纹的表示结合时效果较差;预训练数据量小于10万时即可达到与百万级数据相当的性能,且结合真实和人工生成的预训练数据效果最优。总结而言,本文为开发稳健的机器学习模型提供了有价值的见解,特别是在合成化学中的产率预测领域。

7. AutoSIM: Redesigning and automating umbrella sampling for biomolecular conformational transitions

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2025-752xn

简介:本文提出了一种名为AutoSIM的自动化算法,用于改进和自动化生物分子构象转变的伞形采样(Umbrella Sampling, US)方法,解决了传统US在反应坐标选择、采样长度、偏差放置和终止标准等方面的挑战。AutoSIM通过非平衡分子动力学轨迹自动发现反应坐标,并基于统计和采样洞察优化US方案,确保采样均衡和偏差参数的客观选择。实验验证了AutoSIM在丙氨酸二肽、泛素和HIV-1蛋白酶上的有效性,结果表明AutoSIM生成的自由能面(FES)与无偏差模拟结果一致,且计算效率显著提高。总结来说,AutoSIM为生物分子构象转变的自由能面计算提供了一种高效且可靠的工具。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档