Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >超量化合物库筛选策略–P3

超量化合物库筛选策略–P3

作者头像
DrugScience
发布于 2022-05-17 05:22:57
发布于 2022-05-17 05:22:57
48301
代码可运行
举报
文章被收录于专栏:DrugScienceDrugScience
运行总次数:1
代码可运行

上期回顾:

超量化合物库筛选策略–P1

超量化合物库筛选策略–P2

具体步骤:

3. 获取反应库文件并进行分析

  • 这里使用了ORD,开源化合反应物库
  • 同时需要安装相关的包ord-schema
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ git clone git@github.com:open-reaction-database/ord-schema.git
$ pip install -r requirements.txt
$ conda install -c rdkit rdkit
$ python setup.py install

这里选取部分予以展示

4. 这里选取了其中的一个反应库用于分析

  • 数据来源:Coley, C. W. et al. A graph-convolutional neural network model for the prediction of chemical reactivity. Chemical Science 10, 370–377 (2019). doi: 10.1039/c8sc04228d
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# import everything
import ord_schema
from ord_schema import message_helpers, validations
from ord_schema.proto import dataset_pb2
import math
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import wget
from rdkit import Chem
from rdkit.Chem import AllChem
from glob import glob
# 提取化合反应库,并处理反应库
# 这个路径需要注意一下
pb_path = './ord-data/data/48/ord_dataset-488402f6ec0d441ca2f7d6fabea7c220.pb'
data = message_helpers.load_message(pb_path, dataset_pb2.Dataset)
data_l = list(data.reactions)
reactions_l = [i.identifiers[0].value for i in data_l]
# 获取一些合成反应,1+1=2,SMART格式,同时去一下重
reactant_l_2 = list(set([i for i in reactions_l if i.split('>')[0].count('.') == 2]))
reaction_smarts_uni_mols = [AllChem.ReactionFromSmarts(i) for i in reactant_l_2]

参考

[1] Kearnes S M , Maser M R , Wleklinski M , et al. The Open Reaction Database[J]. 2021.

[2] Coley, C. W. et al. A graph-convolutional neural network model for the prediction of chemical reactivity. Chemical Science 10, 370–377 (2019). doi: 10.1039/c8sc04228d

[3] https://github.com/open-reaction-database/ord-schema

[4] https://github.com/open-reaction-database/ord-data

[5] https://www.daylight.com/dayhtml/doc/theory/theory.smarts.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugSci 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
超量化合物库筛选策略–P5(初步终结篇)
我也应该搞个什么,‘百亿级别的化合物筛选策略’来搞搞噱头hhh,不过其实也就是一个探索超量级别化学空间的方法,星辰大海哪有10的60次方多。
DrugScience
2022/07/27
7410
超量化合物库筛选策略–P5(初步终结篇)
超量化合物库筛选策略–P4
注:对于SMARTS不是很熟悉,所以,我在怀疑某些SMARTS写错了,从其余地方进行查找,更新了反应物的SMARTS,放在这里。
DrugScience
2022/05/17
4860
超量化合物库筛选策略–P4
超量化合物库筛选策略–P2
[2] Grygorenko O O , Radchenko D S , Dziuba I , et al. Generating Multibillion Chemical Space of Readily Accessible Screening Compounds[J]. iScience, 2020, 23(11):101681.
DrugScience
2022/05/17
4620
超量化合物库筛选策略–P2
RDKit | 基于RDKit和SMARTS的化学反应处理
SMILES (Simplified Molecular Input Line Entry System)是一种分子描述语言,由Daylight C.I.S.的创始人 Dr. David Weininger 博士发明。它简单,易于理解,且广泛使用的分子描述方法。
DrugOne
2021/02/01
4.4K0
基于机器学习的化合物活性预测模型
利用化合物的结构与活性数据,基于RDKit和Python3的机器学习活性预测模型小示例。
DrugOne
2021/01/28
1.6K0
超量化合物库筛选策略–P1
好久不见,已变成年羹尧。这篇文章好久之前就注意到了,去年的刷了一波屏。组合化学和分子对接的交叉,看起来效果还是不错的。
DrugScience
2022/05/17
5710
超量化合物库筛选策略–P1
RDKit | 通过评估合成难度筛选化合物
无论如何获得先导化合物,评估候选先导化合物的合成难度都很重要。无论该化合物在计算机上的应用前景如何,实际上并未对其进行合成和评估。
DrugOne
2021/02/01
1.5K0
RDKit | 化合物库的相似性分析
实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。
DrugOne
2021/01/29
1.5K0
RDKit:化合物亚结构(Substructure)搜索
当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要的手段。
DrugOne
2021/01/28
1.9K0
蛋白质与高通量药物筛选化合物库 | MedChemExpress
天然蛋白质具有特定的三维空间立体结构。一生二,二生三,三生空间结构,构成蛋白质肽链的氨基酸线性序列 (一级结构) 包含了形成复杂三维结构所需要的全部信息。理论来说,已知蛋白质氨基酸序列组成,就能轻松获得蛋白质三维结构,但现实远没有那么简单。目前已知氨基酸序列的蛋白质分子约有 2.1 亿个,但截至今天 RCSB PDB (www.rcsb.org) 上收录的被实验解析的蛋白质三维结构仅有 18,1295 个,不到蛋白质总数的 0.1%。究其根本,通过 X 射线衍射、核磁共振或冷冻电镜等方法获得蛋白质三维结构,哪个不耗时费力、需要大量资金投入?另,计算机预测蛋白质结构有诸多限制,SWISS-MODEL 要求序列同源性 > 30%,I-TASSER 要求序列能穿到现有结构,ROBETTA 要求氨基酸序列 < 200。天下苦“蛋白质三维结构”久矣!直到 AlphaFold2 横空出世。
MedChemExpress
2023/03/02
5720
蛋白质与高通量药物筛选化合物库 | MedChemExpress
RDKit | 基于Ward方法对化合物进行分层聚类
通过使用Ward方法进行聚类从化合物库中选择各种化合物,Ward方法是分层聚类方法之一。
DrugOne
2021/01/29
1.8K0
RDKit | 基于Ward方法对化合物进行分层聚类
AI药物研发公司Relay Therapeutics近年来发表的学术文章回顾
Relay Therapeutics是著名的AI药物研发公司,本文整理了其在2020-2022年期间发表的13篇AI药物研发相关学术文章的主要内容。
智药邦
2023/02/15
6390
AI药物研发公司Relay Therapeutics近年来发表的学术文章回顾
RDKit | 基于Murcko骨架聚类化合物库
一种方法是使用合适的指纹技术将化合物矢量化并评估他们之间的距离。这种方法经常被使用,但是对于人类很难直观地理解化合物之间的距离。
DrugOne
2021/02/01
2.7K0
Rdkit学习-No.4-化合物库的设计-基于BRICS
BRICS provides another method for fragmenting molecules along synthetically accessible bonds
DrugScience
2021/02/04
1.2K0
DGL | 基于深度图学习框架DGL的分子图生成
Deep Graph Library (DGL) 是一个在图上做深度学习的框架。在0.3.1版本中,DGL支持了基于PyTorch的化学模型库。如何生成分子图是我感兴趣的。
DrugOne
2021/01/28
1.8K0
SARS-CoV-2小蛋白抑制剂从头设计--P1.设计策略一
上一步完成超量化合物库的初步框架之后,下面可能有时间收集一下化学反应与反应性片段构建更为复杂和理性的筛选策略,等后续时间。
DrugScience
2022/09/19
8330
SARS-CoV-2小蛋白抑制剂从头设计--P1.设计策略一
JCIM|基于相对结合自由能建模的主动学习指导先导化合物优化
2023年1月4日,来自美国卡内基梅隆大学的研究者在Journal of Chemical Information and Modeling上发表文章“Active Learning Guided Drug Design Lead Optimization Based on Relative Binding Free Energy Modeling”。
智药邦
2023/02/28
5930
JCIM|基于相对结合自由能建模的主动学习指导先导化合物优化
图神经网络在生化医疗方面的相关应用
在生化领域,药物分子化合物、蛋白质等经常被作为研究对象。以分子为例,它是一个天然的图结构,可以将分子中的原子看作节点,将化学键看作边,研究分子的化学性质就可以看成给一个图分类或者回归问题。事实上,在机器学习图分类问题的标准数据集中,生化分子占据了非常大的比例:对于化合物来说,MUTAG 数据集旨在分类它们是否为芳香剂,Tox21 数据集分类不同的毒性,NCI-1 分类对癌症的阻碍作用。对于这类问题,我们一般通过学习整个分子图的表示得到所谓的“分子指纹”,然后用它做各种性质的预测。
博文视点Broadview
2021/04/28
8390
图神经网络在生化医疗方面的相关应用
Sci Data | 非肽类大环化合物渗透性数据库
2025年1月3日,瑞典乌普萨拉大学Jan Kihlberg课题组在Scientific Data发表了题为A membrane permeability database for nonpeptidic macrocycles的论文。乌普萨拉大学化学系Vasanthanathan Poongavanam副教授 (Docent) 和Jan Kihlberg教授为论文共同通讯作者,硕士研究生冯秋实为论文第一作者,Danjo De Chavez博士为参与作者。
智药邦
2025/01/07
1250
Sci Data | 非肽类大环化合物渗透性数据库
JCIM|药物发现的超大型化合物数据集概述
2022年4月14日,美国国家癌症研究所 (NCI) 计算机辅助药物设计研究课题组的Wendy等人在JCIM杂志上发表综述,整理了当前用于药物研发的超大型数据库以及检索技术的情况。
智药邦
2022/06/08
1.4K0
JCIM|药物发现的超大型化合物数据集概述
推荐阅读
相关推荐
超量化合物库筛选策略–P5(初步终结篇)
更多 >
交个朋友
加入前端学习入门群
前端基础系统教学 经验分享避坑指南
加入腾讯云技术交流站
前端技术前沿探索 云开发实战案例分享
加入云开发企业交流群
企业云开发实战交流 探讨技术架构优化
换一批
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验