首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | Mol-AIR通过自适应内在奖励机制,显著提升了分子生成的效率和效果,为药物发现提供了新的工具

AI+Drug 文献速递 | Mol-AIR通过自适应内在奖励机制,显著提升了分子生成的效率和效果,为药物发现提供了新的工具

作者头像
用户1151118
发布2026-01-08 11:16:26
发布2026-01-08 11:16:26
180
举报

1. Mol-AIR: Molecular Reinforcement Learning with Adaptive Intrinsic Rewards for Goal-Directed Molecular Generation

期刊:Journal of Chemical Information and Modeling

链接:https://doi.org/10.1021/acs.jcim.4c01669

简介:本文提出了一种名为Mol-AIR的分子生成框架,通过结合历史基于和学习基于的内在奖励机制,有效提升了目标导向分子生成的探索能力。该方法利用随机蒸馏网络(RND)和计数策略,实现了对化学空间的高效探索,并在多个基准测试中表现出色,包括penalized LogP、QED和celecoxib相似性等目标属性。实验使用了Guacamol基准数据集和Therapeutics Data Commons(TDC)库中的GSK3B、JNK3等分子属性进行评估,结果显示Mol-AIR在生成具有目标属性的分子方面优于现有方法。总结来说,Mol-AIR通过自适应内在奖励机制,显著提升了分子生成的效率和效果,为药物发现提供了新的工具。

2. Towards More Accurate Full-Atom Antibody Co-Design

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.19391

简介:本文提出了一种名为Igformer的新型端到端抗体共设计框架,通过创新的抗体-抗原结合界面建模,显著提升了抗体设计的准确性。该方法结合了个性化传播和全局注意力机制,能够全面捕捉局部化学相互作用和全局构象依赖关系。实验在Structural Antibody Database (SAbDab)和RAbD基准数据集上进行,结果显示Igformer在CDR设计和抗原-抗体复合物结构预测任务中均优于现有方法,氨基酸恢复率提高了2.02%,RMSD降低了11.84%。该研究为计算抗体设计提供了新的方向,有望加速药物发现和治疗开发。

3. One Set to Rule Them All: How to Obtain General Chemical Conditions via Bayesian Optimization over Curried Functions

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.18966

简介:本文提出了一种通过贝叶斯优化(BO)在化学反应条件优化中寻找通用参数的方法,创新点在于将问题形式化为对柯里化函数的优化,并系统评估了不同优化策略的有效性。方法上,作者通过将通用性优化问题转化为柯里化函数的优化,并比较了多种优化算法,包括顺序和联合优化策略。实验使用了四个真实世界的化学反应数据集(Pd催化的碳-杂原子偶联、N,S-缩醛形成、硼化反应和脱氧氟化反应),结果表明,顺序优化策略在寻找通用最优解方面表现良好,且简单的探索性策略与复杂策略效果相当。总结来说,该方法为化学实验室中的通用性优化提供了有效的工具,特别是在反应条件优化中具有广泛的应用潜力。

4. SE(3)-Equivariant Ternary Complex Prediction Towards Target Protein Degradation

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.18875

简介:本文提出了一种名为DeepTernary的深度学习框架,用于预测由PROTACs和MGDs诱导的三元复合物结构,创新点在于首次将深度学习应用于PROTAC结构预测,并提出了SE(3)-等变图神经网络和基于查询的Pocket Points Decoder。方法上,DeepTernary通过编码器-解码器架构直接预测三元结构,利用SE(3)-等变图神经网络捕捉三元相互作用。实验使用了名为TernaryDB的大规模三元复合物数据集,包含22,303个复合物,结果显示DeepTernary在PROTAC和MGD基准测试中均达到了最先进的准确性和速度,预测的埋藏表面积与实验获得的降解效力相关指标高度相关。总结而言,DeepTernary展示了在加速TPD开发中的潜力,特别是在处理传统上难以靶向的蛋白质方面。

5. Chemical knowledge-informed framework for privacy-aware retrosynthesis learning

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.19119

简介:本文提出了一种基于化学知识的隐私保护逆合成学习框架(CKIF),通过分布式训练和化学知识引导的模型聚合,解决了传统集中式训练中的数据隐私问题。CKIF方法通过迭代的本地学习和模型参数交换,利用分子指纹相似性计算自适应权重,实现了个性化模型的训练。实验在USPTO-50K、USPTO-MIT和USPTO 1k TPL数据集上进行,结果表明CKIF在多个评价指标上显著优于本地训练和集中训练的模型,特别是在USPTO-50K数据集上比FedAvg提升了约20%的性能。该框架不仅保护了数据隐私,还通过分布式计算提高了效率,为隐私保护的逆合成研究提供了新的方向。

6. Enhancing Hepatopathy Clinical Trial Efficiency: A Secure, Large Language Model-Powered Pre-Screening Pipeline

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.18531

简介:本文提出了一种基于大语言模型的患者预筛选管道,通过结合临床专家知识和两种策略(拟人化专家思维链和预设立场代理协作),显著提高了肝病临床试验的筛选效率和准确性。方法上,该管道将复杂的筛选标准分解为一系列问题,并采用两种策略进行语义问答,最终在本地部署的开源大语言模型上实现高效处理。实验使用了广西中医药大学第一附属医院的16,000份匿名入院记录,通过随机选取的4,000份记录进行评估,结果显示在肝细胞癌和肝硬化试验中分别达到了0.878和0.843的精度,且每项任务平均耗时仅0.44秒。该管道在资源有限的环境中表现出色,为临床试验的预筛选提供了高效且安全的解决方案。

7. Revisiting Convolution Architecture in the Realm of DNA Foundation Models

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.18538

简介:本文重新评估了卷积神经网络(CNN)在DNA基础模型中的有效性,提出了名为ConvNova的CNN方法,通过扩张卷积、门控卷积和双分支框架设计,显著提升了性能。该方法在多个基础模型基准测试中,超过一半的任务上表现优于最新的Transformer和状态空间模型(SSM)方法,尤其是在组蛋白相关任务中平均超过次优方法5.8%。实验在NT基准、基因组基准和染色质图谱预测等数据集上进行,结果显示ConvNova在参数更少、计算更快的情况下,取得了当前最先进的性能。研究表明,CNN在DNA建模中仍具有强大的竞争力,值得重新关注。

8. An Equivariant Pretrained Transformer for Unified 3D Molecular Representation Learning

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2402.12714

简介:该论文提出了一种名为“等变预训练变换器(EPT)”的全原子基础模型,首次实现了跨小分子、蛋白质及其复合物的统一3D分子表示学习,创新性地引入了块级去噪预训练策略。该方法基于E(3)等变变换器架构,能够处理原子级信息并整合块级特征,通过随机平移和旋转扰动块级结构进行预训练。实验使用了包含589万条目的多领域3D分子数据集,涵盖GEOM、PCQM4Mv2、PDB和PDBBind等数据集,并在配体结合亲和力预测、蛋白质性质预测和分子性质预测等下游任务中取得了显著优于现有方法的表现,特别是在抗COVID-19药物筛选中表现突出。该研究为分子科学中的统一建模提供了强有力的工具,展示了其在药物发现等领域的广泛应用潜力。

9. Fast and Accurate Antibody Sequence Design via Structure Retrieval

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.19395

简介:本文提出了一种名为IgSeek的新型抗体序列设计框架,通过从天然抗体数据库中检索相似结构来推断互补决定区(CDR)序列,解决了现有蛋白质逆折叠方法在超可变结构上易产生幻觉的问题。该方法采用多通道等变图神经网络生成高质量的CDR骨架结构几何表示,并通过结构相似的CDR序列对齐和结构保守序列模版提高推断准确性。实验在SAbDab和STCRDab数据集上进行,结果表明IgSeek在结构检索效率和序列恢复准确性上均优于现有最先进方法。IgSeek为治疗性蛋白质设计提供了一种新的基于检索的视角,显著提升了抗体序列设计的效率和准确性。

10. Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design

期刊:arXiv

链接:https://doi.org/10.48550/arXiv.2502.14944

简介:本文提出了一种在推理时通过奖励引导的迭代优化框架,用于扩散模型中的蛋白质和DNA设计,创新点在于通过逐步噪声注入和去噪过程,逐步纠正奖励优化中的错误。方法上,作者采用了一种迭代优化算法,每轮迭代包括部分噪声注入和奖励引导的去噪步骤。实验部分,作者在蛋白质和DNA设计任务中验证了该方法的有效性,使用了UniRef数据库和Enformer架构的数据集,结果表明该方法在优化复杂奖励函数方面优于现有的单次生成方法。总结来说,该框架通过迭代优化显著提升了扩散模型在生物序列设计中的性能。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档