很早之前,小编出过一份“干货!如何查找某个lncRNA的大小及核酸序列”,用来介绍lncRNA的序列查找,但由于公司lncRNA芯片产品和芯片注释的更新,新版中收录的lncRNA有比较大的更新。但是,新版芯片中收录于主流数据库的lncRNA的查找方式于旧版类似,都是到相应数据库直接查询即可。所以呢,这次以Clariom D Mouse芯片为例,为大家演示如何查询非主流数据库中lncRNA信息!
小鼠的lncRNA信息主要源自8个数据库左右,常见的数据库有ENSEMBLE、GenBank、NONCODE、RefSeq、UCSC,其它非主流的数据库有Havana transcript、Luo lincRNA、MGI/Jackson Lab等。如下图所示:
针对常见的数据库:ENSEMBLE、GenBank、NONCODE、RefSeq、UCSC,收录在这些数据库中的lncRNA序列查找很便利,找到对应的数据库,输入名称查找即可!而针对非主流的数据库,比如Havana transcript、Luo lincRNA、MGI/Jackson Lab,由于这些数据库没有官方网站,且是lncRNA研究早年间汇集的一部分数据,且大部分也已经并入常见数据库中,但由于名称的不统一,往往难以查询。
1. Havana transcript主要以OTT形式命名,可在Ensemble数据中查找。
2. Luo lincRNA数据库中大部分信息可到NONCODE数据库中查找。
3. MGI/Jackson Lab收录信息大部分可在NCBI中查找。
今天主要针对Luo lincRNA数据库来做介绍......................,因为很多客户往往会找不到相应信息,今天就为大家做个演示。
下图为截取的部分Luo lincRNA的信心,可以发现源自该数据的lncRNA,均以KnowTID_0000xxxx的形式命名。这类lncRNA难以通过常规方法查找序列,最近小编发现了一种方法,给客户作参考!我们以第一条lncRNA信息(KnowTID_00002976)为例展示如何查询这类lncRNA的序列信息。
1.首先在差异lncRNA列表中找到该lncRNA的探针信息,探针集号为TC1500001682.mm.1。
2.进入赛默飞官网(https://www.thermofisher.com/cn/zh/home.html)网址,进入,点击应用与技术——微阵列分析,点击进入下一界面,然后向下拉,点击“访问NetAffx分析中心”;
3.进入到NetAffx分析中心,然后点击Register进行注册,然后按照个人情况填写注册信息,完成注册。
4.登录后,点击“NetAffy”下拉框,选择“NetAffy analysis center”,在选择Exon/Gene,再点击NetAffy Query,
5.下面开始查询该lncRNA的探针集,在搜索框内输入TC1500001682.mm.1,选择芯片类型Clariom D Mouse,再选择Transcript Clusters,点击submit。
得到如下一条信息:
7.打开NONCODE数据库,分别输入NONMMUT023866和NONMMUT023865,跳转下一页后拉至最后,得到如下信息:
这时候有人会问,为什么不直接用KnowTID_00002976直接去搜,这么麻烦干什么!这是因为NONCODE这个网站的搜索框功能中包括部分KnowTID类名称,有些没包括。因此,看到KnowTID类命名的lncRNA先到NONCODE数据库中去搜,能搜到更好,要是搜不到可以采用以上方法!
北京中康博生物科技有限公司(beijing Cnkingbio Biotechnology Co.LTD)是北方乃至全国最大的Affymetrix检测中心之一,公司以数据分析为特色,整合Affymetrix基因芯片、Illumina二代测序、个性化生物信息分析三项核心服务。立足生命科学,为临床与基础研究领域的科学工作者提供分子生物学高端技术服务。
领取专属 10元无门槛券
私享最新 技术干货