首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用biopython对PDB文件中的残基进行重新编号

可以通过以下步骤实现:

  1. 导入所需的模块和库:from Bio import PDB
  2. 创建一个PDB解析器对象:parser = PDB.PDBParser()
  3. 使用解析器读取PDB文件:structure = parser.get_structure("PDB_ID", "path/to/pdb/file.pdb")其中,"PDB_ID"是PDB文件的标识符,可以自定义,"path/to/pdb/file.pdb"是PDB文件的路径。
  4. 获取PDB文件中的链和残基信息:chains = structure.get_chains() for chain in chains: residues = chain.get_residues() for residue in residues: # 在这里进行重新编号的操作
  5. 进行残基重新编号的操作,可以根据需要使用不同的方法。以下是一个示例,将残基按照顺序重新编号:new_residue_number = 1 for chain in chains: residues = chain.get_residues() for residue in residues: residue.id = (' ', new_residue_number, ' ') new_residue_number += 1
  6. 保存修改后的PDB文件:io = PDB.PDBIO() io.set_structure(structure) io.save("path/to/new/pdb/file.pdb")其中,"path/to/new/pdb/file.pdb"是保存修改后的PDB文件的路径。

以上是使用biopython对PDB文件中的残基进行重新编号的基本步骤。biopython是一个强大的生物信息学工具库,可以用于处理PDB文件中的各种生物分子结构信息。在云计算领域中,可以将biopython应用于生物信息学、药物研发、蛋白质结构预测等方面的任务。

腾讯云相关产品和产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Nucleic Acids Res. | AlphaFold DB:大规模扩展蛋白质序列空间的结构覆盖范围

    今天向大家介绍DeepMind团队发表在Nucleic Acids Research上的一篇Breakthrough文章“AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models”。作者在文章中介绍了一种名为AlphaFold DB的蛋白质数据库(https://alphafold.ebi.ac.uk),它是一个可公开访问的高精度蛋白质结构预测数据库。在 DeepMind提出的AlphaFold v2.0模型的支持下,它使已知蛋白质序列空间的结构覆盖范围实现了前所未有的扩展。该数据库提供了可编程访问及交互式可视化功能,包括预测的原子坐标、每个残基和成对模型置信度的估计,以及预测的对齐误差。AlphaFold DB的初始版本包含21种模型生物蛋白质组中的360,000多个预测结构,很快将扩展到涵盖UniRef90数据集中的大部分代表性序列(超过1亿个)。

    02

    AlphaFold3及其与AlphaFold2相比的改进

    蛋白质结构预测是生物化学中最重要的挑战之一。高精度的蛋白质结构对于药物发现至关重要。蛋白质结构预测始于20世纪50年代,随着计算方法和对蛋白质结构的认识不断增长。最初主要采用基于物理的方法和理论模型。当时的计算能力有限,这些模型往往难以成功地预测大多数蛋白质的结构。蛋白质结构模型的下一个发展阶段是同源建模,出现在20世纪70年代。这些模型依赖于同源序列具有相似结构的原理。通过将目标序列与已知结构的模板序列进行多序列比对,首次成功地确定了以前未解决的序列的结构。然而,这些模型的分辨率仍然有限。20世纪80年代出现了从头开始的方法,带来了下一个分辨率提升。这些方法应用了基于物理的技术和优化算法。结合计算技术的进步,这导致了蛋白质结构预测的显著改进。为了对所有这些新方法进行基准测试,从90年代初开始了蛋白质结构预测技术评估的关键阶段(CASP)系列活动。近年来,机器学习和深度学习技术已经越来越多地集成到蛋白质结构预测方法中,尤其是自2007年以来使用长短期记忆(LSTM)以来。

    01

    Nat. Commun. | Metal3D: 一种用于准确预测蛋白质中金属离子位置的通用深度学习框架

    今天为大家介绍的是来自Ursula Rothlisberger研究团队的一篇关于金属离子位置预测的论文。金属离子是许多蛋白质的重要辅因子,在酶设计、蛋白质相互作用设计等许多应用中发挥关键作用,它们在生物体中丰富存在,并通过强烈的相互作用与蛋白质结合,并具有良好的催化特性。然而,生物相关金属(如锌)的复杂电子结构限制了金属蛋白质的计算设计。在这项工作中,作者开发了两个工具——基于3D卷积神经网络的Metal3D和仅基于几何标准的Metal1D,以改进蛋白质结构中锌离子的位置预测。与其他当前可用的工具进行比较显示,Metal3D是迄今为止最准确的锌离子位置预测器,其预测结果与实验位置相差在0.70 ± 0.64 Å范围内。Metal3D为每个预测位置输出置信度指标,并可用于在蛋白质数据库中具有较少同源物的蛋白质上工作。Metal3D可以预测全局锌密度,用于计算预测结构的注释,还可以预测每个残基的锌密度,用于蛋白质设计工作流程中。Metal3D目前是针对锌进行训练的,但通过修改训练数据,该框架可以轻松扩展到其他金属。

    02

    Research | 构建基于Transformer的集成框架实现蛋白相互作用位点准确预测

    本文介绍来自浙江大学药学院朱峰教授课题组发表在国际综合性学术期刊Research上的最新工作。该研究提出了一种基于Transformer和门控卷积残差神经网络的集成框架EnsemPPIS,仅需要蛋白质的序列信息即可准确识别潜在的蛋白质-蛋白质相互作用(PPI)位点。所构建的模型不仅有效提取残基所处的全局和局部序列环境特征,还利用Transformer算法的自注意力机制从蛋白质序列上学习残基相互作用信息,进而使用集成学习策略将多种特征进行有机整合,在多个基准数据集上实现了卓越的预测性能,并展示出广泛的适用性,能够应用于全蛋白质组范围内的PPI位点预测。此外,模型的可解释性分析证明了该模型具备从蛋白质序列中捕捉局部结构内残基相互作用信息的能力。EnsemPPIS有望加深人们对生理病理机制的理解,助力蛋白质功能研究,推动靶向药物,尤其是蛋白类药物的研发。

    05

    Nat.Commun.| 使用图卷积网络的基于结构的蛋白质功能预测

    今天给大家介绍的是Vladimir Gligorijević等人在nature communication上发表的文章《Structure-based protein function prediction using graph convolutional networks》。序列数据库中蛋白质数量的快速增加及其功能的多样性对自动功能预测的计算方法提出了挑战。作者提出了DeepFRI,一个利用从蛋白质语言模型和蛋白质结构中提取的序列特征来预测蛋白质功能的图卷积网络。它的性能优于当前领先的方法和基于序列的卷积神经网络,并可扩展到当前序列存储库的规模。使用同源性模型增强实验结构的训练集允许作者显著扩展预测函数的数量。DeepFRI具有显著的去噪能力,当实验结构被蛋白质模型取代时,性能只有轻微的下降。类激活图允许以前所未有的分辨率进行功能预测,允许在残基级别上进行特定位点的注释。作者通过注释来自PDB和SWISS-MODEL的结构,展示了此方法的实用性和高性能。

    04

    Nat. Mach. Intell. | 使用多尺度深度生成模型进行特定状态的蛋白质-配体复合体结构预测

    今天为大家介绍的是来自Animashree Anandkumar团队的一篇论文。由蛋白和小分子构成的结合复合物是普遍存在的,对生命至关重要。尽管近年来蛋白质结构预测技术有了显著进展,现有算法仍未能系统地预测配体结构及其对蛋白质折叠的调控效应。为了解决这一差异,作者提出了一种名为NeuralPLexer的计算方法,能够仅通过蛋白质序列和配体分子图直接预测蛋白质-配体复合物结构。NeuralPLexer采用深度生成模型,按原子分辨率抽样结合复合物的三维结构及其构象变化。该生成模型基于扩散过程,整合了基本的生物物理限制和多尺度几何深度学习系统,以层次化方式迭代抽样残基级接触图和所有重原子坐标。与所有现有方法相比,NeuralPLexer在蛋白质-配体盲对接(blind protein-ligand docking)和柔性结合位点结构复原(flexible binding-site structure recovery)的基准测试上实现了最先进的性能。此外,由于其在采样配体自由态和配体结合态集合方面的特异性,NeuralPLexer在全局蛋白质结构预测准确性上一致超过AlphaFold2,无论是在具有大构象变化的代表性结构对还是在最近确定的配体结合蛋白上。NeuralPLexer的预测与酶工程和药物发现中重要靶标的结构测定实验相一致,显示出其在加速设计功能性蛋白质和小分子药物的潜力,有望在蛋白组学规模上实现。

    01
    领券