Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用Rdkit对SDF文件进行分割

使用Rdkit对SDF文件进行分割

作者头像
DrugScience
发布于 2021-08-12 03:41:42
发布于 2021-08-12 03:41:42
2.1K02
代码可运行
举报
文章被收录于专栏:DrugScienceDrugScience
运行总次数:2
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import rdkit
from rdkit import Chem
suppl = Chem.SDMolSupplier('enamine_3d.sdf')
count = len(suppl)
2102303
# out_sdf输出为sdf文件
def out_sdf(lig_list,filename):
    writer = Chem.SDWriter(filename)
    for i in lig_list:
        writer.write(i)
    writer.close()
    return
# 将SDF分割为10000为单位的小块
cut = 10000
for i in range(len(suppl)):
    tmp = []
    while len(tmp) < cut:
        try:
            tmp.append(next(suppl))
        except StopIteration:
            break
  out_sdf(tmp,str(i)+'.sdf'
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 FindKey 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于Pytorch和RDKit建立QSAR模型
python qsar_pytorch.py solubility.train.sdf solubility.test.sdf
DrugAI
2021/01/28
1.5K0
Rdkit学习-No.1-安装与使用
RDkit的安装与使用 简介 RDkit著名的开源化学信息学工具之一,基于BSD协议,核心数据结构与算法由C++编写。支持Python2与Python3,支持KNIME,支持机器学习方面的分子描述符的产生。 安装 1:Conda模式 官方建议使用Conda进行安装与管理,Conda可以使用清华的源进行下载,安装完成后,再次更换其安装源,同样更换为清华的源。换源的教程参考 安装命令: conda install rdkit 2:Pycharm模式 Pycharm并不能直接安装RDkit,当使用上一步Conda
DrugScience
2021/02/04
1.9K0
DGL & RDKit | 基于Attentive FP的分子性质线性模型
2019年8月13日JMC(Journal of Medicinal Chemistry)刊登了一篇文章“Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism”,介绍了一种基于注意力机制的图神经网络模型(Attentive FP)。该模型可以用于分子表征,在多个药物发现相关的数据集上的预测表现达到当前最优,并且该模型所学到的内容具有可解释性。
DrugAI
2021/02/01
2.4K0
RDKit:运用RDKit计算USRCAT(形状相似性)
USRCAT是基于形状的方法,它的工作速度非常快。代码是免费提供的,如果要使用代码,用户需要安装它。
DrugAI
2021/01/28
1.2K0
开源化学信息学库 :ScaffoldGraph
ScaffoldGraph是一个开放源代码化学信息库,使用RDKit和NetworkX构建,用于生成和分析骨架网络和支架树。
DrugAI
2021/02/01
7470
DGL & RDKit | 基于Attentive FP可视化训练模型原子权重
DGL开发人员提供了用于可视化训练模型原子权重的代码。使用Attentive FP构建模型后,可以可视化给定分子的原子权重,意味着每个原子对目标值的贡献量。
DrugAI
2021/02/01
1.2K0
RDKit | 基于Murcko骨架聚类化合物库
一种方法是使用合适的指纹技术将化合物矢量化并评估他们之间的距离。这种方法经常被使用,但是对于人类很难直观地理解化合物之间的距离。
DrugAI
2021/02/01
2.7K0
DGL & RDKit | 基于GCN的多任务分类模型
纽约大学、纽约大学上海分校、AWS上海研究院以及AWS MXNet Science Team共同开源了一个面向图神经网络及图机器学习的全新框架,命名为Deep Graph Library(DGL)。
DrugAI
2021/02/01
2.2K1
RDKit:化合物骨架分析
新药研发是一项耗时长且耗资巨大的工程,据资料显示由安全性问题与药物代谢动力学性质不良引起新化学实体成药失败的比例高达60%,且这一比例还在逐年升高。代谢稳定性是影响药代动力学性质的主要因素之一,它一般用来描述化合物代谢的速度和程度,也是决定药物小分子生物利用度的一个重要因素。骨架修饰是改变代谢途径、提高代谢稳定性的重要化学结构改造策略之一,通过骨架修饰进行先导化合物优化,能够显著提高先导化合物的代谢稳定性。
DrugAI
2021/02/01
1.7K0
基于RDKit探索DrugBank(demo)
https://russodanielp.github.io/exploring-drugbank-using-rdkit.html
DrugAI
2021/01/28
8550
RDKit | 基于RDKit和SMARTS的化学反应处理
SMILES (Simplified Molecular Input Line Entry System)是一种分子描述语言,由Daylight C.I.S.的创始人 Dr. David Weininger 博士发明。它简单,易于理解,且广泛使用的分子描述方法。
DrugAI
2021/02/01
4.2K0
RDKit | 基于Ward方法对化合物进行分层聚类
通过使用Ward方法进行聚类从化合物库中选择各种化合物,Ward方法是分层聚类方法之一。
DrugAI
2021/01/29
1.8K0
RDKit | 基于Ward方法对化合物进行分层聚类
Python 分割合并大文件
有时候,我们需要把一个大文件发送给别人,但是限于传输通道的限制,比如邮箱附件大小的限制,或者网络状况不太好,需要将大文件分割成小文件,分多次发送,接收端再对这些小文件进行合并。今天就来分享一下用 Python 分割合并大文件的方法。
somenzz
2022/10/25
1.1K0
Python 分割合并大文件
针对滑动拼图验证码的python&selenium解法
笔者遇到的这种拼图验证码实际上是多个小碎片经过重新组合成的一张整体,首先要在网站上抓取这种小碎片图片并下载到本地
我去热饭
2022/05/18
1.1K0
RDKit | 化合物库的相似性分析
实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。
DrugAI
2021/01/29
1.4K0
【程序源代码】Log4J 日志分割
“ 关键字:通过log4j实现日志文件按照日期和文件大小进行自动分割保存,实现日志备份和日志文件合理管理。”
程序源代码
2020/04/26
1.4K0
超量化合物库筛选策略–P4
注:对于SMARTS不是很熟悉,所以,我在怀疑某些SMARTS写错了,从其余地方进行查找,更新了反应物的SMARTS,放在这里。
DrugScience
2022/05/17
4700
超量化合物库筛选策略–P4
DGL-LifeSci:面向化学和生物领域的 GNN 算法库
尝试使用新的DGL--LifeSci并建立Attentive FP模型并可视化其预测结果。
DrugAI
2021/02/01
2.9K0
RDKit:化合物亚结构(Substructure)搜索
当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要的手段。
DrugAI
2021/01/28
1.8K0
Python算法基础
定义:算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。
用户7678152
2020/08/26
1.5K0
相关推荐
基于Pytorch和RDKit建立QSAR模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验