Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >直接分子构象生成

直接分子构象生成

作者头像
DrugAI
发布于 2022-11-28 10:04:42
发布于 2022-11-28 10:04:42
1.1K0
举报
文章被收录于专栏:DrugAIDrugAI

3D分子构象生成指的是给定2D分子图,生成对应的稳定3D分子构象,即生成每一个原子的坐标。相对于传统的基于实验或者数值计算的方法,基于机器学习的方法具有计算速度快、计算效果好的优势。在本篇论文中,作者提出一种基于深度学习的分子构象直接生成的方法,论文发表在Transactions of Machine Learning Research 2022。

方法

基于机器学习的分子构象生成已经存在不少探索工作。其中,很多工作基于某一中间量(键长、原子间距离的梯度、二面角等)来生成坐标,但可能会违反某些潜在的规则(如三角不等式)。所以,在本篇论文中,作者设计了一种方案(direct molecular conformation generation, 简记为DMCG)可以直接从2D分子图生成3D分子构象而不借助中间变量。

直接生成3D分子构象存在两个挑战:一是保持生成构象坐标的旋转平移不变性,二是对称原子的坐标的置换不变性。以图一中的分子为例进行说明。(1)如果任意旋转或者平移整个分子构象的坐标,分子构象应该具有不变性。在损失函数中,应体现为旋转平移后的构象和标准构象的误差应保持一致。(2)图一中的分子右侧的嘧啶(由原子12~17组成)应该沿着11-12的碳硫键具有对称性。也就是,如果将原子13、17的坐标对调,同时也对调原子14、16的坐标,分子构象应该保持不变。我们将一个分子中所有对称部分的置换操作记做。对图一来说,

, 其中

对于其余原子

图一:分子图例

为了保持这两种不变性,作者提出了一个新的损失函数:

其中R是真实的分子构象,

是预测的构象,

是任意一种旋转平移变换操作,

是分子图中所有对称部分的置换操作。关于求解

, 作者提出了如下策略:首先对于任意分子,计算它的

。这一步可以根据图同构算法得到。之后,对于任意

, 最优平移旋转操作

可通过求解一个矩阵的特征值和特征向量得到。这个矩阵中的元素与R

相关。根据这两步即可实现

的求解。具体细节在论文第2.1节。

另外,由于一个分子存在多个稳定的3D构象,作者采用VAE的训练框架实现一个分子到多个构象的映射。

除此之外,作者提出一种新的图神经网络结构,如图二所示。网络的每一层包含四个模块,它们工作方式如下:(1)对于每一个化学键,利用它两个端点的原子特征去更新该化学键的特征;(2)对于任意原子,利用和它相邻的化学键去更新原子的特征;(3)利用刚刚更新的原子和化学键特征去更新分子的一个整体表达(4)根据每个原子特征,预测它的坐标。分子的构象逐层优化,最终实现从一个初始随机噪声,得到一个真实分子构象。

图二:网络结构示意图

实验结果

实验结果见下图。从图可见,该文提出的方法在各项指标上都取得了目前最优的结果。

另外作者还将DMCG用在了分子对接(docking)的实验中。分子对接的第一步是获得配体小分子的3D构象,之后将其送入分子对接软件进行后续分析。通常人们会选择RDkit产生初始构象。这里,作者将构象生成这一步替换为采用深度学习工具,包括GeoMol, ConfGF, GeoDiff以及作者提出的DMCG。实验结果如图三所示。DMCG的初始构象能够获得更好的结合能,并且相对于真实的配体构象,DMCG的方法RMSD最小。同时我们也观察到,基于深度学习的方案效果,要好于基于RDKit的构象生成。

图三:分子对接实验。

拓展:2D & 3D 联合预训练

DMCG侧重于从2D分子图生成3D构象。基于DMCG的模型架构和训练方案,作者提出基于2D & 3D的联合预训练。该工作发表于KDD2022。训练目标如图四所示,是三个损失函数的加和。图四(a)展示的重构被掩码的原子属性(例如原子属性、电荷数等)和原子坐标。具体来说,给定一个2D的原子图和每个原子坐标,随机遮盖掉一部分原子和坐标,训练目标是重构被遮盖掉的部分。图四(b)展示的是给定2D分子图,重构它的3D构象。这部分采用的是DMCG的方案。图四(c)展示的是给定3D构象,恢复原子类型的属性。作者在PCQM4M-v2的数据集上进行预训练,训练预料约3.38M个 2D/3D数据对。预训练的网络结构和DMCG网络结构保持一致。

图四:损失函数流程图。

作者在分子属性预测,和2D到3D构象生成任务上进行了实验,都取得了令人满意的结果。

表2:分子属性预测任务。

在表2中,作者展示了若干分子属性预测任务的结果。表2(a)和2(b)展示的是在moleculeNet和OGB-molpcba上预测的结果。这两个数据集都是只有2D图信息,没有3D信息。表2(c)展示的是在一个毒性预测数据集上我们算法的效果,该数据集中的分子具备3D信息。

在2D分子图到3D构象生成的任务上,作者和未经过预训练的版本进行了对比。经过预训练后,在3D构象生成的任务上也取得了显著提升。

表3:分子构象生成任务。

参考资料

论文和代码

[1] Direct molecular conformation generation, TMLR22, https://openreview.net/forum?id=lCPOHiztuw,

https://github.com/DirectMolecularConfGen/DMCG

[2] Unified 2D and 3D Pre-Training of Molecular Representations, KDD22, https://arxiv.org/abs/2207.08806,

https://github.com/teslacool/UnifiedMolPretrain

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
北京大学 | 联合篡改定位和版权保护的多功能图像水印
本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ,联合篡改定位和版权保护的多功能图像水印研究。
CV君
2023/12/19
4580
北京大学 | 联合篡改定位和版权保护的多功能图像水印
Nerf技术在三维重建中起到什么作用?
NeRF的核心思想是将三维场景建模成一个连续的函数,这个函数可以接收三维空间中的一点以及观察这个点的相机的方向,然后输出该点的颜色和不透明度。这样,通过学习这个函数,我们就可以得到整个三维场景的信息,从而可以渲染出从任何角度观察这个场景的结果。
一点人工一点智能
2024/04/02
6240
Nerf技术在三维重建中起到什么作用?
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
是否还在担心大规模场景训练和压缩耗时太长、显存开销太大?是否还在苦恼重建出的建筑物和道路表面破碎不堪?是否还在困扰如何定量衡量大规模场景几何重建的精确程度?
机器之心
2025/02/06
1830
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室(EVOL Lab)负责人赵健、清华大学智能产业研究院(AIR)助理教授赵昊等。
机器之心
2024/05/22
4230
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
文章:How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey
点云PCL博主
2024/06/21
1.7K0
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
今年 4 月,Meta 发布「分割一切(SAM)」AI 模型,这项成果不仅成为很多 CV 研究者心中的年度论文,更是在 ICCV 2023 上斩获最佳论文提名 。
机器之心
2023/12/12
6160
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
基于NeRF的方法在处理大型场景时,渲染时间长且渲染效果差。而现有基于3D高斯的方法由于训练内存大、优化时间长和外观变化剧烈,难以扩展到大型场景。
用户1324186
2024/04/12
1.6K0
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注!
马上科普尚尚
2024/07/17
3710
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
从2D图像中进行3D重建和建模近年来受到了极大的关注,这要归功于具有3D重建能力的真实感视图合成方法的最新进展。从技术角度来看,这是一个跨计算机视觉、计算机图形学和摄影测量学的交叉研究领域。
AIGC 先锋科技
2024/07/08
9370
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
新视角合成是计算机视觉和图形学领域中一项长期存在并且富有挑战的任务。过去两年,NeRF及其衍生工作的提出将该任务提升到了新的高度。然而,基于NeRF的方法的训练和渲染需要大量的成本才能达到理想的效果,比如稠密的输入视角和耗时的训练与渲染。尽管后续的一些稀疏视角NeRF的工作以及InstantNGP的提出在一定程度上解决了部分缺陷,但NeRF方法始终没有做到实时和高质量的高分辨率渲染。
用户1324186
2024/04/12
9990
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
机器之心
2024/06/17
2470
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
文章:TCLC-GS: Tightly Coupled LiDAR-Camera Gaussian Splatting for Surrounding Autonomous Driving Scenes
点云PCL博主
2024/06/08
3520
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作(比如 DreamFusion [1] )提出了分数蒸馏采样 (Score Distillation Sampling),通过优化 3D 场景的神经表达参数,使其在各个视角下渲染的 2D 图片符合大规模预训练的文生图模型分布。然而,尽管这一类方法在单个物体上取得了不错的效果,我们还是很难对具有复杂关节的细粒度人体进行精确建模。
机器之心
2023/12/12
6960
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
神经辐射场(NeRF)及三维高斯泼溅(3D Gaussian Splatting,3DGS)虽能构建静态数字孪生,却无法模拟真实世界的动态,不仅限制了虚拟现实和混合现实的真实感,也是智能训练与Real2Sim2Real范式突破的关键瓶颈。
新智元
2025/04/10
1910
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
本研究旨在解决准确分割3D高斯分水(3D-GS) FROM 2D Mask 的挑战。传统方法通常依靠迭代梯度下降为每个高斯分配唯一的标签,导致长久的优化和次优解。
未来先知
2024/12/30
2420
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
从稀疏输入合成新视图对于辐射场来说是一个挑战。神经辐射场(NeRF)的最新进展在仅使用少量输入视图就能重建出高度逼真的外观和准确的几何信息方面取得了卓越成果。然而,大部分基于稀疏视图的NeRF实现速度较慢,内存消耗也较大,导致时间和计算成本很高,限制了它们的实际应用。
用户1324186
2024/05/31
1.5K0
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
在自主驾驶、机器人导航、AR/VR等前沿应用中,Simultaneous Localization and Mapping (SLAM) 是核心技术之一。
新智元
2025/03/27
680
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
Github:https://github.com/SkyworkAI/Gamba
AI进修生
2024/12/02
7430
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
HiFi4G 架构如图 1 所示,(a) 首先使用非刚性跟踪建立了一个粗变形图,并跟踪运动进行高斯优化。(b) HiFi4G 使用 NeuS2 初始化第一帧高斯,并构建细粒度高斯图以增强时间一致性。然后,我们利用 ED 图来扭曲 4D 高斯,对高斯图应用
用户1324186
2024/01/24
5630
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
文章:VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
点云PCL博主
2025/02/19
3130
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
推荐阅读
北京大学 | 联合篡改定位和版权保护的多功能图像水印
4580
Nerf技术在三维重建中起到什么作用?
6240
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
1830
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
4230
NeRFs和3D高斯溅射技术如何重塑SLAM:综述
1.7K0
分割一切「3D高斯」版来了:几毫秒完成3D分割、千倍加速
6160
CVPR 2024 | VastGaussian:用于大型场景重建的3D高斯
1.6K0
【源头活水】CityGaussian:VR/AR时代的城市重建新标杆
3710
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
9370
FSGS: 基于 Gaussian Splatting 的实时 Few-shot 视角合成
9990
高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
2470
TCLC-GS:用于自动驾驶场景的紧耦合激光雷达-相机高斯溅射技术
3520
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
6960
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控
1910
FlashSplat: 以最佳方式求解 2D 到 3D 高斯展开分割 !
2420
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
1.5K0
纯RGB输入,解决户外场景SLAM!误差降低至9.8%,港科广开源 | ICRA 2025
680
Gamba:仅需0.05秒让一张图片生成高质量3D模型!(新加坡国立大学&天工AI开源)
7430
HiFi4G: 通过紧凑高斯进行高保真人体性能渲染
5630
VINGS-Mono:大规模场景中的视觉-惯性高斯溅射单目SLAM
3130
相关推荐
北京大学 | 联合篡改定位和版权保护的多功能图像水印
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档