15
大家听到Jackson Lab可能首先想到的是基因敲除小鼠,确实如此,不过Jackson Lab的网站上还提供了其他“便民服务”内容,即大量的信息检索数据库,有助于我们从零开始研究一个新基因。当然,构建此数据库,也并非是单纯的全心全意为人民服务,而是充分利用了“供给侧改革”的原理,随着研究者对某一基因的研究深入,使用基因敲除小鼠也是顺理成章的“消费升级”。
对于一个未知生命科学领域的探索,比较实验组与对照组之间的差异,转录组和蛋白质组技术无疑是提供初始研究思路,发现潜在研究对象最有效、最快捷的方法之一。但是,蛋白质组或转录组给出差异表达基因与蛋白如何进行后续的研究?Jackson Lab网站的数据库给出了一个相对便捷的检索方式。
下文以转录组研究得到的差异表达基因NR4A1为例,浅析如何进一步研究一个陌生的基因。
MGI数据库的界面简单易用,输入基因的名称并回车,就可实现快速检索。
如下图所示,我们可以查到NR4A1这个基因或基因产物的全名与其他名称、其染色体定位(Location &Maps),以及其他物种中的同源基因。以NR4A1为例,其在人类的同源基因也称为NR4A1,同时,数据库中还有8种其他脊椎动物的NR4A1同源基因的信息(Homology)。在“Human diseases”一栏,我们可知该基因的突变与一种人类疾病相关,记载该突变的文献2篇。
在"Mutations,alleles,and Phenotypes"一栏,可以看到有86篇文献记录了NR4A1基因突变表现出的不同表型,引入突变的手段包括随机插入突变、化合物诱导等。突变影响的器官系统在下图中为标蓝的类别,即心血管系统、造血系统、免疫系统等。
数据库中也给出了基因本体(Gene Ontology,GO)分析的结果,不过,转录组分析的结果也通常会进行GO分析。
MGI数据库中还有一项较为有用的信息则是NR4A1基因表达于哪些组织(下图中标蓝的组织)。如果做转录组研究时所提供的样本并非下列表达NR4A1的组织,但又检测到NR4A1基因存在差异表达,则有必要验证转录组结果的可信性。
其他信息还包括:NR4A1的多态性位点、NR4A1蛋白包含的蛋白质结构域等。“References”一栏包括了涉及NR4A1基因的所有文献,与Pubmed的检索不同,MGI中的文献包括了同一基因不同名称的文献检索结果,如NR4A1也称Gfrp、GFRP1、Hbr1、Hbr-1、Hmr、N10、NGFI-B、NP10、Nur77、TIS1、TR3。
NR4A1多态性位点如下图所示。
点开MGI提供的蛋白质结构域信息的链接,可以查出该结构域可能与哪些蛋白或结构域相互作用,并非特定蛋白与蛋白的相互作用信息。
如果需要查找特定蛋白相互作用的信息,Jackson Lab的网站上也提供了数据库,MouseLine的一项Protein-Protein Interactions功能,网址:
http://www.mouseline.org/mouseline/template.do?name=Gene_Interactions&scope=global
结果如下图所示,给出了从前的研究者免疫共沉淀的结果,证明了NR4A1可与下列蛋白或直接或间接形成复合物。
类似的查看蛋白质相互作用信息的网站还有Unified Human Interactome(http://www.unihi.org/)以及STRING(http://stringdb.org/cgi/input.pl),这两个网站的结果优于Mouseline的地方是直观的相互作用可视图。
研究一个基因时,必不可少的是该基因参与的信号通路,以及上下游的调控基因。如何查找NR4A1参与的信号通路在MGI中并没有很简便易用的工具,建议使用KEGG在线检索,网址 https://www.kegg.jp/kegg/kegg3a.html
搜索后出现如下通路,可点击通路代码查看具体通路图。
了解基因表达的组织,初步了解基因的不同组织内的潜在功能,建立好大致的通路框架,相互作用的蛋白质,可以自己初步勾勒出某一相对陌生的基因的功能与调控通路,后续则是常规的“套路”,对该基因或者上下游的相关基因knockdown,knockout,conditional knockout,tissue specific knockout,overexpression,inhibitor treatment,agonist treatment……
领取专属 10元无门槛券
私享最新 技术干货