虽然我一直讲解的GEO数据挖掘,都是基于mRNA这样的表达芯片,但实际上miRNA,lncRNA,甚至circRNA芯片也是大同小异的分析流程。
所以,如果你确实是第一次接触circRNA芯片数据,完全不用担心, 你只需要把它看作是你不知道基因名字的mRNA芯片,最后得到的各种各样的分析结果,只不过是以circRNA的ID来表示而已。比如:
是不是很眼熟啦!不会害怕了吧!
下面我们看看一篇真实的circRNA芯片文献吧,发表在Cancer Cell International,时间是 November 2019 ,标题是 A 3-circular RNA signature as a noninvasive biomarker for diagnosis of colorectal cancer,值得一提的是,作者并没有上传其芯片数据哦。
毕竟高通量技术成本不非,测序也好,芯片也罢,一下子对成百上千病人队列都做经济上有压力,所以通常是少数几个病人得到结果后,进一步筛选10个左右的靶基因进行后续大规模人群实验验证说明我们高通量数据分析结果的可靠性。
表达芯片是目前应用最广泛的高通量技术啦,虽然大家接触的都是mRNA这样的表达芯片,但实际上miRNA,lncRNA,甚至circRNA芯片也接连成为科研热点。但是数据分析流程是没有区别的。都是走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:
仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。
本文对于cirRNA芯片的表达矩阵分析也不例外,就是差异分析后的火山图及热图如下:
通常是描述一下所采用的芯片,然后分析方法,这个文章里面的并不是最佳分析方法。其实你看上面的火山图就看得出来,典型的半边天火山图呀,详见:惊!画出来的火山图居然缺半边?
里面提到的两个数据库非常值得大家学习。(PS:如果你有这两个数据库的介绍心得需要分享,欢迎投稿到我们生信技能树哈)我这里摘抄 doi:10.3969/j.issn.1004-5619.2018.01.014 文献里面的关于circRNA 常用数据库主要介绍
这个步骤本质上也是数据库查询,而且已经被广泛咀嚼过的TCGA数据库挖掘套路,这里就不展开讨论了。
资料来源于 Arraystar中国区唯一代理服务商 – 康成生物的介绍
环状RNA(circRNA)是一类由特殊剪接机制形成的、具有闭合环状结构、大量存在于真核转录组中的非编码RNA;也是目前生命科学和医学领域的研究热点分子。circRNA分子的组织特异性、疾病特异性、时序特异性及高稳定性等特征,使得circRNA作为临床疾病的biomarker具有明显的优势。近来研究显示,环状RNA在不同物种中起到miRNA海绵的作用,称之为竞争性内源RNA(ceRNA),即能竞争性结合miRNA。而与疾病关联性miRNA的相互作用说明环状RNA对疾病的调控起着非常重要的作用。此外,一些内含子类型的环状RNA(ciRNA)会促进宿主基因的转录。
实际上,你把上面的circRNA换成其它类型的RNA,就是一样的
1. 第一款用于circRNA检测的商业化芯片
针对circRNA设计,所有circRNA来源于该领域的标志性研究文献,所有circRNA都经过了严谨的实验验证。
2. 剪接位点特异性的探针
能准确、可靠地检测circRNA,即便在相应线型RNA存在的情况下也能特异性检测circRNA。
3. 详细的circRNA注释
所有circRNA均经过生物信息学分析,预测其结合的microRNAs,并在实验报告中明确这些注释信息(如下图所示)。根据这些信息,客户可以很方便的从miRNA海绵的角度研究circRNA的作用机制和生物功能。
4. 性能保证
灵敏度高,重复性佳,线性检测范围达5个数量级。并设计有各类严谨的质控探针,确保芯片实验质量。
Arraystar公司在全球首款circRNA芯片基础上迅即升级版本为V2.0。其circRNA来源融合了环状RNA研究的最新顶尖文献,所有cicrRNA都经过了严谨的实验验证,以便于对不同生理及病理条件下的circRNA进行系统的研究。同时我们对所有差异表达的circRNA用高匹配值的miRNA靶标位点进行了标注,这将有利于对circRNA作为天然miRNA海绵功能的进行研究。
Arraystar公司circRNA芯片产品列表