首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何在Python中描述蛋白质序列的疏水性?

在Python中描述蛋白质序列的疏水性可以使用氨基酸的疏水性指数来表示。疏水性指数是一种用于衡量氨基酸在蛋白质中的疏水性程度的数值。常用的疏水性指数是Kyte-Doolittle指数,它将氨基酸分为疏水性和亲水性两类。

在Python中,可以使用字典来存储氨基酸的疏水性指数。例如:

代码语言:txt
复制
hydrophobicity_index = {
    'A': 1.8,
    'R': -4.5,
    'N': -3.5,
    'D': -3.5,
    'C': 2.5,
    'Q': -3.5,
    'E': -3.5,
    'G': -0.4,
    'H': -3.2,
    'I': 4.5,
    'L': 3.8,
    'K': -3.9,
    'M': 1.9,
    'F': 2.8,
    'P': -1.6,
    'S': -0.8,
    'T': -0.7,
    'W': -0.9,
    'Y': -1.3,
    'V': 4.2
}

其中,键是氨基酸的缩写,值是对应的疏水性指数。

要计算蛋白质序列的疏水性,可以遍历序列中的每个氨基酸,查找对应的疏水性指数,并将其累加。例如:

代码语言:txt
复制
protein_sequence = 'ARNDCEQGHILKMFPSTWYV'
hydrophobicity_score = sum(hydrophobicity_index[aa] for aa in protein_sequence)
print("蛋白质序列的疏水性得分为:", hydrophobicity_score)

这样就可以得到蛋白质序列的疏水性得分。

蛋白质的疏水性在生物学研究中具有重要的意义,可以用于预测蛋白质的结构和功能。在药物设计和蛋白质工程中,疏水性也是一个重要的考虑因素。

腾讯云相关产品和产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

生化小课 | 疏水氨基酸远离水的包装有利于蛋白质折叠

在仔细研究弱相互作用对蛋白质稳定性的贡献时,我们发现疏水效应通常占主导地位。纯水含有一个由H2O分子组成的氢键网络。没有其他分子具有水的氢键势能,并且水溶液中其他分子的存在会破坏水的氢键。当水包围疏水性分子时,氢键的最佳排列会在分子周围形成高度结构化的水壳或溶剂化层(solvation layer)(见图 2-7)。溶剂化层中水分子有序度的增加与水熵的不利降低相关。然而,当非极性基团聚集在一起时,溶剂化层的范围会减小,因为每个基团不再将其整个表面呈现给溶液。结果是熵的有利增加。如第2章所述,熵的增加是水溶液中疏水基团缔合的主要热力学驱动力。因此,疏水性氨基酸侧链往往聚集在蛋白质的内部,远离水(想象一下水中的油滴)。因此,大多数蛋白质的氨基酸序列包含大量疏水性氨基酸侧链(尤其是 Leu、Ile、Val、Phe 和 Trp)。这些蛋白质的位置使得它们在蛋白质折叠时聚集在一起,形成疏水性蛋白质核心。

03
  • JCIM | 组合分子动力学模拟和深度学习预测小分子迁移自由能

    准确预测小分子的配分和疏水性在药物发现过程中至关重要。细胞和整个人体内有许多异质的化学环境。例如,药物必须能够穿过疏水性的细胞膜才能到达细胞内的靶点,而疏水性是药物与蛋白质结合的重要驱动力。原子分子动力学(Molecular Dynamics,MD)模拟常用于计算小分子与蛋白质结合、穿过脂质膜和溶解的自由能,但计算成本很高。机器学习(Machine Learning, ML)和经验方法也被用于整个药物发现,但依赖于实验数据,限制了适用性的领域。研究人员提出了原子MD模拟计算15,000个小分子从水转移到环己烷的自由能。数据集被用来训练预测迁移自由能的ML模型。结果表明,空间图神经网络模型达到了最高的精度,紧随其后的是三维卷积神经网络,而基于化学指纹的浅层学习的精度明显较低。

    06

    生化小课 | 极性基团为蛋白质折叠提供氢键和离子对

    疏水效应对于稳定构象显然很重要;结构化蛋白质的内部通常是密集的疏水性氨基酸侧链核心。同样重要的是,蛋白质内部的任何极性或带电基团都具有适合氢键或离子相互作用的伙伴。一个氢键似乎对天然结构的稳定性贡献不大,但蛋白质疏水核心中没有伙伴的氢键基团的存在可能会非常不稳定,以至于含有这些基团的构象通常在热力学上是站不住脚的。由几个这样的基团与周围溶液中的伙伴组合所产生的有利的自由能变化可能大于折叠和展开状态之间的自由能差异。此外,蛋白质中基团之间的氢键在优化氢键的重复二级结构中协同形成(一个基团的形成使下一个基团的形成更有可能),如下所述。通过这种方式,氢键通常在指导蛋白质折叠过程中起重要作用。

    02

    ICML 2024 | SurfPro:基于连续表面的功能性蛋白质设计

    今天为大家介绍的是来自Wengong Jin团队的一篇论文。如何设计具有特定功能的蛋白质?作者受到了化学直觉的启发,即几何结构和生化特性都对蛋白质的功能至关重要。因此本文提出了一种新方法SurfPro,能够在给定目标表面及其相关生化特性的情况下生成功能性蛋白质。SurfPro包含一个分层编码器,逐步建模蛋白质表面的几何形状和生化特性,以及一个自回归解码器来生成氨基酸序列。作者在标准逆折叠(inverse folding)的基准测试CATH 4.2和两个功能性蛋白质设计任务(蛋白质结合体设计和酶设计)上对SurfPro进行了评估。SurfPro在各项测试中均优于之前的最先进的逆折叠方法,在CATH 4.2上的序列恢复率达到了57.78%,并且在蛋白质-蛋白质结合和酶-底物相互作用评分方面表现出更高的成功率。

    01

    生化小课 | 镰状细胞性贫血是一种血红蛋白分子疾病(含 蛋白质与配体的可逆结合:氧结合蛋白质 小结)

    遗传性人类疾病镰状细胞性贫血惊人地证明了氨基酸序列在决定球状蛋白的二级、三级和四级结构及其生物功能方面的重要性。已知人类中有近500种血红蛋白的遗传变异;除少数外,其余都相当罕见。大多数变异由单个氨基酸残基的差异组成。对血红蛋白结构和功能的影响通常很小,但有时也会非常大。每一种血红蛋白变异都是基因改变的产物。变异基因被称为等位基因。因为人类通常每个基因有两个拷贝,所以一个个体可能有一个等位基因的两个拷贝(因此该基因是纯合的)或两个不同等位基因各有一个拷贝(从而是杂合的)。

    01

    J. Chem. Inf. Model. | 基于序列和基于结构的蛋白质-配体相互作用机器学习方法

    开发新药既昂贵又耗时。准确预测药物和靶标之间的相互作用可能会改变药物的发现方式。基于机器学习的蛋白质-配体相互作用预测已经显示出巨大的潜力。本文重点对基于序列和基于结构的蛋白质-配体相互作用机器学习方法进行了总结。因此,本文首先概述了该领域应用的数据集,以及用于表示蛋白质和配体的各种方法。然后,利用基于序列和基于结构的分类标准对经典机器学习模型和深度学习模型进行分类和总结,用于蛋白质-配体相互作用的研究。此外,还提出了这些模型的评价方法和可解释性。此外,深入探讨了蛋白质-配体相互作用模型在药物研究中的各种应用。最后,讨论了该领域目前面临的挑战和未来的发展方向。

    01

    Nat. Commun. | 相互作用引导药物设计的三维分子生成框架

    今天为大家介绍的是来自韩国科学技术院的一篇利用相互作用引导进行3D 分子生成的论文。深度生成模型具有加速药物设计的强大潜力。然而,由于数据有限,现有的生成模型常常面临泛化方面的挑战,导致设计创新性较差,并且与看不见的目标蛋白之间往往存在不利的相互作用。为了解决这些问题,作者提出了一种相互作用感知的 3D 分子生成框架,该框架能够在目标结合口袋内进行相互作用引导的药物设计。通过利用蛋白质-配体相互作用的通用模式作为先验知识,作者的模型可以利用有限的实验数据实现高度的通用性。通过分析生成的未见靶标配体的结合姿势稳定性、亲和力、几何图案、多样性和新颖性,对其性能进行了全面评估。此外,潜在突变选择性抑制剂的有效设计证明了提出的方法对基于结构的药物设计的适用性。

    01

    CELL SYST|多目标神经网络框架预测化合物-蛋白相互作用和亲和力

    这次给大家介绍清华大学交叉信息研究院的曾坚阳教授课题组在Cell Systems上发表的论文“MONN: A Multi-objective Neural Network for Predicting Compound-Protein Interactions and Affinities”。分析化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)在药物研发过程中起着至关重要的作用,迅速准确地预测作用位点和其间的亲和力有利于高效的药物研发。基于此问题,曾坚阳教授课题组引入深度学习,提出了一种预测化合物-蛋白相互作用和亲和力的多目标神经网络-MONN。作者在方法中引入了(i)捕获全局特征的超级节点、(ii)预测亲和力的GRU模块(Gate Recurrent Unit,门循环单元模型)、(iii)预测化合物-蛋白结合位点和判断其间的亲和力指标的多目标共享特征结构,使得其模型具有比现有模型更好的特征可解释性,有效捕捉了化合物与蛋白质的内在特征与联系,实现精确判断分子间的相互作用和亲和力。

    02
    领券