首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | 非等变 3D 分子生成新突破:旋转对齐让模型性能媲美 SOTA 且更高效

AI+Drug 文献速递 | 非等变 3D 分子生成新突破:旋转对齐让模型性能媲美 SOTA 且更高效

作者头像
用户1151118
发布2026-01-08 12:51:45
发布2026-01-08 12:51:45
180
举报

1. Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment

期刊: arxiv 链接: https://arxiv.org/abs/2506.10186v1 代码: https://github.com/skeletondyh/RADM

简介: 本文提出了一种高效可扩展的非等变三维分子生成方法,旨在突破现有等变扩散模型在三维分子生成任务中面临的效率和架构复杂性问题。作者通过学习每个分子的自适应SO(3)旋转变换,将输入数据对齐至一个统一的潜在空间,从而在该空间内训练非等变扩散模型。该对齐过程采用一个图神经网络生成旋转矩阵,并与非等变自编码器联合优化,使模型在无监督条件下学习最有利于生成建模的表示形式。

该方法被称为RADM(Rotationally Aligned Diffusion Model),采用非等变的GNN或Transformer作为扩散模型的去噪网络,不仅避免了昂贵的等变架构,还大幅提升了训练和采样效率。实验在标准数据集QM9和大规模GEOM-Drugs上进行,结果表明RADM在分子稳定性和生成有效性方面显著优于现有非等变模型,并在多个指标上逼近甚至超过最先进的等变模型GeoLDM和EDM。此外,RADM在采样速度和可扩展性方面具有明显优势,尤其是在大模型配置(如DiT-B)下更为突出。该研究表明,在适当的旋转对齐机制辅助下,非等变扩散模型也能在三维分子生成任务中取得与等变模型相当的表现,打破了长期以来对等变性的依赖假设。


2. Equivariant Neural Diffusion For Molecule Generation

期刊: arxiv 链接: https://arxiv.org/abs/2506.10532v1

简介: 本文提出了 Equivariant Neural Diffusion(END),一种用于三维分子生成的新型扩散模型,其核心创新在于引入了可学习的前向过程,同时保持对欧几里得变换(如旋转、平移、反射)的等变性。与以往方法固定前向过程不同,END 使用时间和数据依赖的神经变换来学习该过程,从而增强生成模型的表达能力。该模型基于神经流扩散模型(Neural Flow Diffusion Models, NFDM)理论,结合等变性扩散模型(Equivariant Diffusion Models, EDM)的结构,确保生成分布对刚体变换不变。

在实验方面,作者在两个主流数据集(QM9 和 GEOM-DRUGS)上进行了详尽评估。结果表明,在无条件生成任务中,END 在稳定性、有效性、原子类型匹配和构象质量(如应变能)等方面,均优于或媲美现有最先进方法。同时,在组成和子结构条件下的生成任务中,END 展现出更强的可控性和更高的结构匹配度。例如,在生成给定组成的化合物时,END 达到了超过90%的匹配率,显著优于传统基线方法。

总的来看,END 在保持物理等变性的基础上,通过学习更灵活的前向过程,不仅提升了三维分子生成的质量,还提高了采样效率,是当前扩散模型在分子建模领域的重要进展。


3. Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?

期刊: arXiv 链接: https://arxiv.org/abs/2506.10912v1 代码: https://github.com/DeepYoke/ToxiMol-Benchmark

简介: 本论文提出并系统定义了“分子毒性修复”任务,作为评估通用多模态大语言模型(MLLMs)在结构级分子解毒能力上的首个基准。为此,作者开发了ToxiMol基准数据集,涵盖11个主要任务和560个具有代表性的有毒分子,涉及约30种毒性机制,并引入机制感知的提示生成流程。该任务要求模型基于有毒分子的SMILES字符串、二维结构图像以及自然语言修复目标,生成结构有效且低毒性的替代分子。

为实现高效评估,论文设计了自动化多维评估框架ToxiEval,结合毒性预测、合成可行性、药物相似性与结构相似度,全面衡量修复是否成功。作者评估了近30个主流的闭源与开源MLLMs,并进行了多轮消融实验,探索模型规模、候选数目、失败原因等因素对性能的影响。

实验表明,当前MLLMs在毒性修复任务上的整体成功率仍较低,但已展现出初步的毒性理解能力、语义遵循能力以及结构感知编辑潜力。在不同任务中,模型在Tox21等分类任务上的表现优于如LD50、DILI等机制复杂的任务。此外,研究指出毒性瓶颈仍是修复失败的主要原因,而药物相似性则是次要限制因素。

综上,本研究通过构建新颖的评估任务、标准化数据集与自动化评估机制,填补了分子解毒领域MLLM应用的研究空白,为通用模型在科学智能方向的扩展提供了重要基准和方向。


4. CustomKinFragLib: Filtering the Kinase-Focused Fragmentation Library

期刊: ChemRxiv 链接: https://doi.org/10.26434/chemrxiv-2025-3gz92 代码: https://github.com/volkamerlab/KinFragLib

简介: 本论文介绍了CustomKinFragLib,这是一个用于筛选和优化激酶靶向片段库的过滤流程,旨在提升片段的药物相容性和合成可行性。该方法基于已有的KinFragLib库,后者通过分析KLIFS数据库中的激酶-配体晶体结构,从六个功能子口袋中提取片段,支持子口袋导向的组合以生成潜在激酶抑制剂。然而,原始片段库包含9131个片段,其组合空间过于庞大,不具可行性。

为解决这一问题,CustomKinFragLib引入了多步过滤机制,包括去除冗余或不可合成片段、剔除包含不良子结构的片段(如PAINS和Brenk子结构)、筛选药物相似性指标(如Rule-of-Three和QED评分)、评估合成可行性(通过SYBA评分、Enamine商业构建模块的子结构匹配和ASKCOS的逆合成分析)。这些过滤步骤将片段数量从原始的9131大幅减少至523个,同时保留了良好的结构多样性。

实验部分表明,CustomKinFragLib在不显著牺牲化学空间多样性的前提下,有效筛除了不适合的片段。作者使用Tanimoto距离和Murcko骨架的Shannon熵来评估多样性,并通过t-SNE可视化展示了片段分布在过滤前后的变化。此外,该工具的参数可灵活配置,支持用户根据研究需求调整过滤强度。

CustomKinFragLib提供了一个实用、可扩展的框架,用于从大规模片段库中提取可合成、药物相容性高的子集,助力激酶抑制剂的结构设计与优化。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment
  • 2. Equivariant Neural Diffusion For Molecule Generation
  • 3. Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?
  • 4. CustomKinFragLib: Filtering the Kinase-Focused Fragmentation Library
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档