相近功能基因的检索方法
在做数据分析的时候很多老师经常需要搜索某一类功能的基因,有两种思路可以实现这一目标。第一种是直接序列比对,认为序列相似即具有相似的功能;第二种是利用这一类基因共有的蛋白保守结构域搜索,如果含有相同的蛋白保守结构域,就认为他们具有相似的功能。
在使用第二种方法的时候往往要用到蛋白保守结构域的隐马尔科夫模型文件,这个文件可以在pfam数据库得到。今天小编就跟大家分享如何在pfam数据库下载该文件。
获取蛋白保守结构域在pfam的索取号
下图即为pfam数据库的主页,首先需要获取蛋白保守结构域在pfam数据库中的索取号(格式一般为"PF"+阿拉伯数字)。常用的获取方式有两种:第一种是从文献中查找;第二种是从NCBI获取。本文主要展示从NCBI获取蛋白保守结构域在pfam数据库的索取号。
如下图所示,从NCBI查找一个含有所需要的蛋白保守结构域的蛋白:在红框所示选择蛋白、输入名称+物种然后搜索。
如下图所示会出现很多相关的蛋白信息,选择一条点击进去。
跳转至蛋白信息的主页(下图),点击右上方的Identify Conserve Domain 就会跳转之这个蛋白的保守结构域的主页 。
蛋白保守结构域的主页(下图),红色框标注的地方是domain list(就是这个蛋白含有那些蛋白保守结构域) 。点击想要获取pfam数据库的索取号的蛋白保守结构域的条目,例如NB-ARC会跳转到它的主页。
下图就显示了NB-ARC在pfam数据库的登记号,不过是以pfam开头,后面跟数字,想要在pfam数据库使用这个登记号,将pfam改为大写的PF后面数字不变。
下载蛋白保守结构域的hmm文件
进入pfam数据库主页,输入上一步获取的索取号。
点击 Go 进入到蛋白保守结构域的主页,点击右侧的Curation&model;
Curation&model 页面的最下方有 download 按钮, 点击 download 会弹出下载窗口,然后就可以下载了。
你有没有get到?快去数据库试试吧!
科技服务事业部 文案
领取专属 10元无门槛券
私享最新 技术干货