相信很多小伙伴在看miRNA相关的paper中都看到过如下图所示的miRNA成熟体序列和靶基因的序列比对结果。
miRWalk2.0是miRWalk数据库的改进版本。 miRWalk2.0可以提供最全面的预测和实验验证的miRNA-mRNA相互作用,可以极大地帮助研究者对miRNA进行研究。miRWalk2.0不仅记录了基因完整序列中的miRNA结合位点,还可以将这些信息与12个现有miRNA-mRNA相互作用数据库:DIANA-microTv4.0,DIANA-microT-CDS, miRanda-rel2010,mirBridge,miRDB4.0,miRmap,miRNAMap,doRiNA即PicTar2,PITA,RNA22v2,RNAhybrid2.1和Targetscan6.2)构建基于promoter (4 prediction datasets), cds (5 prediction datasets), 5’- (5 prediction datasets) and 3’-UTR (13 prediction datasets) 。它还记录了通过自动文本挖掘搜索收集的实验验证的miRNA-mRNA相互作用信息,同时也有来自有资源(miRTarBase,PhenomiR,miR2Disease和HMDD)。
对于miRNA靶基因的预测而言,目前有很多数据库都可以做。这些数据库的区别基本上在于纳入的数据量以及预测的算法不同。预测的结果总是有一些不同的,所以也就导致各个数据库的结果可能不是很一样。我们在做miRNA调控基因预测的时候,经常需要寻找很多个数据库来预测,进而取交集来说明结果的稳定性。今天就给大家介绍一个收集了多个数据库来预测miRNA调控的数据库:miRNANet (https://www.mirnet.ca/miRNet/home.xhtml)。
对于miRNA而言。其功能的预测基本都是通过其影响的基因来进行来讲总结的。随着关于miRNA的研究过多,目前也有了关于miRNA功能注释的数据库也越来越多。这样的话,基于这样的数据库来进行功能预测了。今天就给大家介绍一个可以做miRNA功能预测的数据库:miEAA(https://ccb-compute2.cs.uni-saarland.de/mieaa2/)
对于mRNA数据,我们经常通过GO和KEGG富集分析来进行功能分析,对于miRNA数据而言,我们可以通过miRNA对应的mRNA来研究miRNA相关功能。 miRpath是一个在线网站,集成了miRNA靶基因数据库, 只需要输入感兴趣的miRNA Id, 就可以从靶基因数据库中获取miRNA对应的靶基因,然后进行GO和KEGG富集分析,网址如下
miRactDB为癌症和基因组学界提供了独特的资源,可以在正常和癌症患者不同样品数据中分别进行筛选,确定优先级并合理化其miRNA与基因相互作用的候选对象。而且可能存在一小部分但至关重要的miRNA,可深刻影响各种癌症的标志性过程。相信这个数据库会给正在进行miRNA与基因作用研究和生物信息分析研究者带来巨大的帮助。
mRNA可以翻译成各种功能的蛋白,其中有一类研究调控蛋白研究的非常火热,即转录因子transcription factor, 简称TF,TF参与调控转录起始过程,是研究转录调控必不可少的一环。miRNA可以与mRNA结合,发挥转录后调控功能, 二者都是生物体内调控网络中的重要组成部分。
前几天有小伙伴问关于 miRNA 的数据库,由于 miRNA 相关的数据库太多了,要是分开介绍的话估计要好久好久。幸好,有人已经把 miRNA 相关的数据库整理好了,我们只需要基于自己的目的进行查找就可以找到相对应的数据库,然后进行使用就行了。这个数据库就是: 4miRs (https://tools4mirs.org/)。
在SNP研究领域,通过GWAS或者eQTL等手段,发现了大量与疾病或者某种复杂性状相关的SNP位点,而这些SNP的具体功能还需要进一步分析和挖掘。有科学家发现,SNP位点可以通过影响miRNA,从而引起疾病的发生与发展,所以研究miRNA相关的SNP位点是非常有意义的。
miRTarBase数据库是一个专门收集有实验证据支持的microRNA-mRNA靶向关系(MTI, MicroRNA-Target Interactions)的数据库。自miRTarBase数据库于2011年首次亮相以来,miRNA与靶基因相关信息的数据库不断更新。该数据库已经收录了超过8,500篇关于miRNA-靶标相互作用的实验支持文章。随着新发布的CLIP-seq数据集的增加,新miRTarBase中的MTI集合超过500,000。作者通过改进NLP(自然语言)技术,搜集到更多靶向关系对以及他们的网络功能和注释信息。数据库网址:http://mirtarbase.mbc.nctu.edu.tw/index.html
miRbase 是由曼彻斯特大学的研究人员开发的一个在线的miRNA数据库,该数据库中收录了来自200多个物种,接近4万个miRNA的信息,是最全面的miRNA数据库,网址如下
miRNA具有重要的转录后调控功能,在疾病的发生与发展中扮演着重要角色。miRCacner是一个肿瘤相关的miRNA数据库,通过收集和整理文献,给出肿瘤相关的miRNA以及对应的表达趋势,网址如下
在昨天LnCeVar数据库介绍当中,我们提到了两个基于实验方法查询 miRNA 功能的数据库,正好今天介绍的这个是基于实验收集的 lncRNA 功能的数据库,所以就合在一起介绍了。
该数据库包含了349个miRNA, 163种疾病,3273个miRNA与疾病之间的关联信息。
miRNA的研究起步很早,miRNA与疾病相关的文献和数据库也相对成熟,而circRNA作为最近兴起的一种RNA, 可以作为miRNA sponger与miRNA结合, 发挥转录后调控功能。
我们经常从GEO数据库中做miRNA数据挖掘的时候,会遇到一个很头疼的问题。就是miRNA芯片数据比较老,当时的对miRNA注释可能还没有分-3p和-5p。对这个概念还不太熟悉的小伙伴可以先去下面的视频。
这里我们可以发现,miRNA的前体可能对应多个成熟的miRNA,比如hsa-let-7a-1,有两个对应的成熟体,MIMAT0000062(hsa-let-7a-5p)和MIMAT0004481(hsa-let-7a-3p)。这里的值是对所有成熟体miRNA求和的结果。
在ceRNA调控网络中,miRNA起到了桥梁的作用,通过和各种RNA分子结合,从而介导该调控机制的发生。starBase数据库提供了miRNA和各种RNA分子的相互作用信息,并在此基础上构建了ceRNA网络,网址如下
miRDB通过MirTarget这个软件预测了人,小鼠等多个物种的miRNA靶基因信息,并将其整理成了数据库,网址如下
百味科研芝士的小伙伴们大家好啊!好久不见甚是想念,点赞在看养成习惯。我是你们的老朋友小木舟~今天给大家分享来自《Epigenomics》,IF= 4.173,国人占比:4.80% 的一篇文章。文章的题目是:新型mRNA-miRNA-lncRNA竞争内源性RNA网络的鉴定与乳腺癌的预后相关。简单的说就是乳腺癌的ceRNA网络构建。
去年在生信技能树分享了一些关于Shiny app开发,AWS部署Shiny app,以及绑定域名的经验,详见:Shiny app开发, AWS上部署Shiny app,绑定域名。
HMDD是一个手工收集整理的miRNA与疾病相关联的数据库,最新版本为V3.0,网址如下
ceRNA是近年来研究的非常火热的一种调控机制,指的是不同RNA分子竞争性的结合miRNA, 通过这种竞争关系来调控不同RNA的表达,这里的RNA分子可以是mRNA, lncRNA, 甚至是pseudogene。
点击Add dataset ,粘贴我们的基因。我们也可以导入数据集(基因集),可以是我们差异分析获得的差异表达基因【参考文章:TCGA数据库:GDCRNATools包下载数据、处理数据以及差异分析,一文就会TCGA数据库基因表达差异分析】。这里我们以limma包和edgeR包差异的分析结果为例。
miRNA靶基因预测是研究miRNA功能机制必经的一个环节,现有的相关软件和数据库非常多,然而不同软件的算法各有优劣,在不同数据库之间的交叉检索费时费力,所以需要一个整合多个数据库和软件资源的集成型数据库,mirDIP就是在这样的驱动下产生,集成了30个来源数据库中human相关的靶基因信息,网址如下
今天为大家介绍的是来自Qinghua Cui团队的一篇数据集论文。微小RNA(miRNA)是一类重要的小型非编码RNA,在几乎所有生物过程中具有关键的分子功能,因此在疾病诊断和治疗中发挥着重要作用。人类微小RNA疾病数据库(HMDD)是与miRNA相关的医学领域的生物医学研究人员的重要综合资源。在这里,作者介绍了HMDD v4.0,该版本从文献中整理了53530个miRNA与疾病相关的条目。与五年前发布的HMDD v3.0相比,HMDD v4.0包含了1.5倍多的条目。此外,还整理了一些新的分类,包括与疾病相关的外泌体miRNA、涉及人类疾病的病毒编码miRNA,以及包含miRNA-circRNA相互作用。作者还整理了与疾病相关的性别差异miRNA。
本文介绍了microRNA的生物信息学数据库,包括microRNA的预测、实验和临床等数据库。其中,mirbase是第一个microRNA数据库,已发展成为最大的小RNA数据库,包括了10000多个microRNA。其它数据库如targetscan、microrna.org、miRTarBase、miRanda等也是比较常用的microRNA数据库。这些数据库可以帮助研究人员更好地了解microRNA的生物学功能,预测靶基因,并指导药物设计和疾病治疗等。
lncRNA(long non coding RNA)发挥功能的方式,目前研究最多的还是ceRNA 的功能。经典的ceRNA调控网络是通过 lncRNA-miRNA-mRNA 来构建的。这个研究思路,相对来说已经很成熟了,如果要在这个方面研究的话,其实再加一些变化可能更好一些,毕竟成熟的思路就代表创新性少一些,而如果要加变化的话,由于 ceRNA 调控的原始还是序列的结合,所以最直接能加的还是看基因组变异对于ceRNA 调控的影响。所以这次给大家推荐一个基因组变异对于ceRNA调控影响的数据库:LnCeVar
前面我们在介绍TCGA数据库数据挖掘的时候,课程中使用了人了所有miRNA的ID号。
哺乳动物中的miRNA通过结合转录本序列的3’UTR区,从而发挥转录后调控作用。TargetScan是一个专门分析哺乳动物miRNA靶基因的软件,并且根据已有的分析结果整理成了数据库,网址如下
miRWalk是一个综合性的miRNA靶基因数据库,收录了人,小鼠等多个物种的miRNA靶基因信息,和mirDIP类似,也是一个整合型数据库,整合了来自miRDB, TargetScan, miRTarBase等数据库中的信息,网址如下
ENCORI (The Encyclopedia of RNA Interactomes,http://starbase.sysu.edu.cn/index.php) 听起来好像有点陌生,但是我相信他的前身很多人应该都听过,很可能还用过,starbase。提起这个数据库,小编还是很引以为傲的,他是由中山大学开发的一个专门针对RNA相互作用的综合型数据库。2014年v2.0发表在核酸研究上,到现在引用已经上千了。目前这个数据已经更新到v3.0了。
TarBase是一个有实验证据支持的miRNA靶基因数据库,目前最新版本为v8, 经历了长达10年左右的收集与整理,网址如下
lncRNASNP数据库收集整理了人和小鼠中位于lncRNA基因上的SNP位点信息,通过以下两种思路将lncRNA与SNP结合起来
本发明涉及转录组测序领域,具体涉及一种在miRBase数据库中无本物种参考miRNA数据的miRNA测序的数据分析方法。
关于miRNA的基础知识可参考文章:医学科研实验基础知识笔记(十一):非编码RNA。
该研究使用的是 CapitalBio 平台 (CapitalBio 公司) 芯片,非常清晰的研究思路;
今天为大家介绍的是来自Hui Liu团队的一篇关于预测miRNA和药物关系的论文。许多研究已经确认microRNA(miRNA)在肿瘤细胞对抗癌药物的敏感性中起到调节作用。miRNA作为一种有前景的治疗靶点,正在逐渐受到关注,以克服药物抵抗。然而,对于miRNA与药物敏感性之间的关联的计算预测受到了有限的关注。在这项工作中,作者提出了一种基于异构网络的表示学习方法来预测miRNA药物敏感性关联(DGNNMDA)。通过整合miRNA相似性网络、药物相似性网络和实验证实的miRNA药物敏感性关联,构建了一个miRNA-药物异构网络。接下来,作者开发了一个双通道异构图神经网络模型,在同质和异质节点之间执行特征传播,以便使方法可以学习miRNA和药物节点的表达表示。
最近在看植物长链非编码RNA的论文,其中一个分析步骤是鉴定lncRNA中可能是属于miRNA前体的序列
miRNA可以与多找RNA分子进行结合,从而在ceRNA调控网络中发挥重要作用。ceRNA作为一种细胞内源性的调控机制,当miRNA的结合发生异常时,其调控功能也随着收到影响,从而可能导致疾病的发生。
但是不少粉丝表示不明白这些东西是做什么的,现在就给一个示例,文章是发表于2017的纯粹生物信息学数据挖掘的:Identification of miRNA‐mRNA crosstalk in laryngeal squamous cell carcinoma,其实你把癌症替换成为TCGA的另外33种癌症,都是类似的分析策略,类似的写作思路。
miRNA的研究起步很早,最早发现的miRNA是线虫中的let-7 和lin-4,随着越来越多的miRNA被发现,为了方便学术交流,有科学家提出了一套统一的命名规范,对应的文献如下
oncomirdb通过文献检索的方式,从pubmed的多篇文献中收集整理出了肿瘤相关的miRNA信息,对应的文章发表在bioinformatics上,链接如下
预测miRNA结合位点的工具很多,以TargetScan为代表的工具,利用结合位点的保守性进行预测,对于大部分保守的结合位点而言其准确性较好,然而还是有部分miRNA结合位点是非常规的,在物种间并不保守,对于这部分位点的预测,就需要在算法上进行改进。
不过,哪怕是对人类来说,kegg注释的也仅仅是蛋白编码基因,但是如果你了解人类gtf文件,就应该是知道,里面有6万左右的基因,如果我们的差异分析,定位到了 lncRNA,假基因,miRNA的基因,其实就不能直接进行功能数据库注释。
lncRNA可以作为miRNA sponge与miRNA发生相互作用,通过竞争性的结合miRNA, 可以调控其他基因的表达量, 发挥ceRNA的调控功能。
miRTarBase是一个手工收集的,经过实验验证过的miRNA靶基因数据库,网址如下
数据库中已验证的miRNA-疾病关联严重不足,使用传统的生物学实验方法识别新的miRNA-疾病关联成本高且具有一定的盲目性。
TargetScan是一款预测miRNA结合位点的软件,对于哺乳动物中miRNA结合位点预测的效果非常好。为了更加方便的进行miRNA的研究,针对人类中的miRNA, miRcode的开发者预测了miRNA与多种类型的RNA的相互作用,比如mRNA, lncRNA等,并将结果整理成了数据库,方便大家的使用与学习,网址如下
今天我们比较一下另外的一个miRNAtap包,与multiMiR的结果的一致性,以及两个数据库的差异!首先安装miRNAtap包,代码如下:
领取专属 10元无门槛券
手把手带您无忧上云