对于蛋白质而言,由于编码的氨基酸一个也就那些,所以总会碰到相似的氨基酸组合到一起然后发挥类似功能的这种情况。所以我们经常把那些序列和结构相似的一类蛋白质称为:蛋白家族。对于单一蛋白功能检索的数据库有很多,例如:gene、uniprot这类的。但是有时候我们需要知道一类蛋白家族的功能的话。那该怎么办的呢?所以今天就给大家推荐一个经典的蛋白家族检索数据库:pfam[http://pfam.xfam.org/]。
对于这个数据库而言,数据库提供了多种输入方式,我们可以: 1)输入序列来进行比对查看具体是哪个蛋白家族的;2)可以输入蛋白相关的结果:结构域; 3) 也可以通过检测词来检索符合要求的蛋白家族信息;4)同时可以基于物种来见来查找某一物种的所有蛋白家族信息。
这里我们想要使用和凋亡相关的有哪些蛋白,所以我们就在关键词检索里面输入:apoptosis
由于我们这里是进行了关键词的检索,所以会出来很多相似的结果。如果靶定到一个具体的结构域上的话,那就可以直接到结果界面了。
在关键词检索完之后,我们会得到一个和这个关键词相关的表格。在这个表格当中,可以看到每一个相关家族在数据库当中都包括哪些信息。
我们以Bcl-2家族来进行结果说明。
在总的结果的界面,我们首先看到的是这个蛋白家族的基本信息,这些基本的介绍主要来自于维基百科。这里我们能看到这个蛋白家族基本的构造、功能、家族相关结构域以及可能相关的基因。
由于这里能查找的一系列具有相似功能的蛋白家族,但是一个蛋白不可能只有一个结构域的情况。所以这个部分就汇总了包含bcl-2的所有的蛋白结构域情况。
在进行基因研究的时候,我们经常要比较各个物种之间蛋白序列的保守型情况。这种比较的方式基本上是通过进化树的方式来进行实现的。所以数据库也进行了简单的进化树构建。当然这个只是基本的查看。想要构建好看的进化树数据库也提供的原始数据下载的地方。点击下载,然后用别的软件进行美化即可。
蛋白与蛋白不是单独发挥作用的。所以我们经常也需要查看这些蛋白家族是和哪些蛋白有相互作用关系的。在这个部分,数据库就提供了可能相互所有的其他蛋白
以上都是基本的汇总,有时候我们想要知道到底哪些蛋白具有这个结构域。这个时候就可以在在结构当中查看了。这里提供了蛋白的PDB ID号。如果想要基因 名的话。就得转换一下了。
以上就是这个数据库的基本内容了。主要还是通过检索某一个特定结构域来获得相关的蛋白家族的信息。如果有研究蛋白家族的同学可以尝试的使用一下这个数据库。算是一个很老派很经典的数据库了。