Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Cytoscape插件5:DisGeNET(2)应用实例

Cytoscape插件5:DisGeNET(2)应用实例

作者头像
Y大宽
发布于 2018-09-10 04:02:28
发布于 2018-09-10 04:02:28
2.7K0
举报
文章被收录于专栏:Y大宽Y大宽

1.在CTD里,哪些基因被注释到哮喘病相关

广泛的定义为“对于一个给定的基因集来说,哪些基因和某疾病相关?” 哮喘病是一个严重的慢性疾病,有时会威胁生命,这种病肺部发生病变。哮喘的病因很复杂包括遗传和环境因素。对化学物的过敏对哮喘关系很大,但机制不明。因此,对毒理学家来说,因为化学物质引起的哮喘的关键生理过程对毒理学家很重要。

为了回答这个问题,我们限制搜索条件为comparative toxicogenomic database,human data(CTD-hman)。CTD是一个数据库,关注于基因,化学物质和疾病之间的相互作用。选择source,选择gene disease网络,搜索框定义asthma限制条件,这会产生78个nodes的网络,102条关系(78个nodes中,1个disease,77个genes)。边的颜色依赖关系类型。我们可以看到,

image.png

有一条关系的颜色是粉色,其余灰色。粉色的这条关系类型是治疗,其余是标记物。 我们还想看看是不是还有其他基因在文献中有记载,而在curated中没有记录。于是我们执行了befree source。这个命令能检索基于文本挖掘的注释。结果是一个网络,1089个基因(10990个nodes,5343个边) 现在我们建立一个网络,包含所有的asthma相关疾病。为了获取和asthma相关的CTDhuman基因疾病网络,我们执行和之前一样的命令但是限定一个模式,选择CTD-human为source,关系类型和疾病类型any。但是限定asthma为所索茨,产生网络,现在这个网络有110个nodes(12个疾病,98个基因),136个边。注意,有3个哮喘相关疾病共享3个基因,TBX21是唯一一个和三种i并相关的基因。作者问,你可能找到网络中得分最高的GDA吗? 为了想看看,是否在文献中和动物模型source中有其他疾病和TBX21相关,执行ALLset搜索,并且限定基因TBX21,这个命令也会获取源于uniprot,clinvar,GAD,MGD的注释。结果产生的网络,有61个疾病注释到TBX21(62个nodes,110个edges).

image.png

如果我们想看看TBX21和asthma之间的关系,我们会发现这两个node之间有23个边。并且这些边属于不同的类型(biomarker和genetic variation),因此,颜色不同。 再进一步,我们还可以发现每个gene-disease之间关系的证据,通过检查边属性浏览。 这个例子显示了文献搜索的价值,因为curated database现在并没有完全覆盖文献中的gene-disease关系。

2.病人中观察到的并发症,是否反应了这种疾病的共同遗传根源?

这个问题可以归结为,疾病x和y有共同的遗传根源?这个问题可以公式化“疾病x和疾病y之间的共有基因是什么?”

一个病人可能有好几个疾病,这种情况成为并发症。并发症可以考虑两种疾病之间的共同发病遗传原因。慢性梗阻型呼吸道疾病和糖尿病是并发症的一个例子。通过命令disease projection网络我们可以回答这个问题:两种疾病有共同的遗传起因。

首先,我们命令disease projection (curated),搜索框输入“obstructive然后从下拉菜单选择chronic obstructive airway disease,,不限制疾病类型。这个网络437nodes,436个边。然后,我们在在使用cytoscape的搜索框搜索“diabetes”,我们立即看到两个疾病联系在一起了(三个糖尿病node)。一旦我们知道至少在两种疾病中有一个基因共享,我们就可以产生CURATED

Gene disease network并产生包含疾病和他们的相关基因的sub网络。(ucco注:上面这个步骤是验证这两种疾病有没有共有基因,一旦完成,主要的工作还是下面的。)步骤如下

Gene disease network,source选择curated,

为了达到这个目的,我们先利用cytoscape自己的功能,选择代表慢性阻塞性呼吸疾病的nodes和他们的相关基因,select,nodes,first neighbous of selected nodes,然后,执行第二轮和上面一样的工作。然后我们产生子网络,包含上面选择的nodes和边,file.,new,network,from selected nodes all edges.关系类型和疾病种类选择any,create network。在生存的大网络中,在cytoscape的搜索框中输入Chronic Obstructive Airway Disease或者在下面的table面板找寻这个病,找到后右击选中,然后以这些选中节点进行扩增,

image.png

重复,以上一步的节点进行第二次扩增。接着我们就可以产生sub-network了。具体file-new-network-from selected nodes,all edges。得到600个nodes和1638个edges的网络。在这个网络中,可以在table面板中查找,可以在cytoscape的搜索框中输入obstructive diabetes,会发现3个糖尿病亚类型和慢性阻塞这个疾病,见下图

image.png

选中4个node后,selet-nodes-first neighbours of selected node。以圆形显示图,如下

image.png

我们 看到上图中蓝色的9个nodes或基因和两种疾病有关。支持这样的假说:这些基因的功能改变可以导致同一个病人身上两种疾病的发生! 有趣的是,我们还可以看出,NOS3和TNF是仅有的在慢性阻塞呼吸疾病和三种类型糖尿病中同时出现的2个基因。 在DisGeNET中,NOS3这个基因和485中疾病有关系,比如高血压,阿尔兹海默症,不能勃起是排名最靠前的三个。 上面的功能也可以分别产生各种疾病的网络,然后进行merge。

3.和翻译后修饰有关的疾病有哪些

这种类型的案例可以作为药物发现的兴趣点。发现的疾病相关基因可以被药物靶向,比如有磷酸化修饰干涉.

首先,产生网络,all gene disease network,限制关系类型为posttranslational modification,不限制疾病class。产生的网络有621个nodes(157个disease nodes),个edges。使用边的属性浏览可以查看每个 基因疾病的支持证据。 提个问题:前10个疾病相关的翻译后修饰共有的疾病类型

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.09.09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Cytoscape插件5:DisGeNET(1)
为了产生不同类型的网络,DisGeNET的控制面板提供了可以调整的参数。包含三个标签:gene disease network, disease projects, gene projections.默认的是gene disease network,这种模式下,不同的GDA(gene disease assosiations)网络可以通过选择不同的data来产生。Assosiation类型和/或disease classes由下拉菜单产生。GDA网络可以通过cut-off过滤。另外,GDA网络可以围绕一个特殊的疾病或基因建立,需要通过search boxes。其中一些功能也可以用来产生疾病project和gene project网络。
Y大宽
2018/09/10
2.4K0
Cytoscape插件5:DisGeNET(1)
动物实验 | 模式生物——大鼠| MedChemExpress
多年来,老鼠已被用于许多实验研究,相比于小鼠,大鼠因其体型较大,容易操作 (如芯片植入),生理学特征也易于观察,具有一定的适应性和攻击性,逐渐成为研究人类多种疾病的重要模式动物。值得注意的是,大鼠的基因组中有 90% 的基因与小鼠以及人类的基因相匹配。大鼠染色体上存在的 27.5 亿个碱基对也与人类染色体上的 29 亿个碱基对相当接近。几乎全部已知的与人类疾病有关基因都可以在大鼠身上中找到,使人们能够更好地了解遗传学、疾病、药物作用等相关机制,为人类疾病的探索提供了巨大的帮助[1]。
MedChemExpress
2023/03/28
3800
动物实验 | 模式生物——大鼠| MedChemExpress
​cytoscape的十大插件之六-GENEMANIA
五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧,课程已经结束啦。文末有录播回放学习方式,以及配套授课资料!
生信技能树
2021/05/27
8.7K1
​cytoscape的十大插件之六-GENEMANIA
从零开始搭建医药领域知识图谱实现智能问答与分析服务(含码源):含Neo4j基于垂直网站数据的医药知识图谱构建、医药知识图谱的自动问答等
关于知识图谱概念性的介绍就不在此赘述。目前知识图谱在各个领域全面开花,如教育、医疗、司法、金融等。本项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱。
汀丶人工智能
2023/07/25
1.7K1
从零开始搭建医药领域知识图谱实现智能问答与分析服务(含码源):含Neo4j基于垂直网站数据的医药知识图谱构建、医药知识图谱的自动问答等
​cytoscape的十大插件之二--MCODE插件
Identification of differentially expressed and methylated genes associated with rheumatoid arthritis based on network: Autoimmunity: Vol 53, No 6 (tandfonline.com)
生信技能树
2021/04/29
21.1K1
​cytoscape的十大插件之二--MCODE插件
RcisTarget转录因子分析学习
RcisTarget 是一个用于基因调控网络构建和转录因子分析的R包。它可以从一组基因中识别潜在的转录因子(Transcription Factors, TFs)调控网络,并通过 motif 分析 推测转录因子的作用机制。该包主要被应用于转录调控研究,特别是基因共表达网络或差异表达基因集的上游调控因素预测。
凑齐六个字吧
2024/12/04
4550
RcisTarget转录因子分析学习
有些差异本来就是不应该很明显
比如其中一个学员就反馈了一个看起来是难题的表达量芯片:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE98793
生信技能树
2024/12/30
1230
有些差异本来就是不应该很明显
Cytoscape中文教程(1)
写在前面,这个教程真的有点长,是我早期翻译的,如果你完全不懂Cytoscape,那么你读这些,应该会做出非常漂亮的各种基于cytoscape及插件的图,因为这个教程真的很白。 原文地址
Y大宽
2018/09/10
11.4K0
Cytoscape中文教程(1)
Cytoscape插件3:Enrichment Map(1)
早期的基因列表解释依赖于选择一系列高得分的基因,然后建立相当主观奇怪的关系。富集分析是一个自动的,基于严格的统计学的方法来分析和解释很大的基因列表,使用的是先验知识。富集分析来评估输入的基因列表在一个已知功能基因集的上调或下调情况。如果一个基因列表中的基因在这个已知功能集中出现的基因数目显著很多,这很可能预示这,这个生物学过程在作者研究的状况下扮演着重要角色。这个分析可以被其他已知的功能基因集重复,这个功能基因集可能数以千计。 过去几年中,有超过60种富集分析方法和工具出现。他们的主要区别在于 -(a)已知功能基因集的数据库不一样 -(b)用来评估富集的统计学方法不一样。 在接下来的几个部分,我们简要review 基因富集已经存在的几种方法,主要考虑到两个方法。 大多数的富集工具都是来自于GO解释,因为它们对大多数生物来说容易获取,并且覆盖的基因数很多,另外,还有其他一些功能基因集存在,除了GO也还有其他一些工具。功能基因集可以基于他们参与的代谢过程或信号通路来进行定义(比如KEGG,Reactome),也可以由基因表达谱调节的目标基因定义(比如mircoRNA,转录因子),也可以由蛋白质特征定义(比如结构域,染色体位置,与某种疾病的联系,刺激因子,或基因扰动等)。多个来源的功能基因集被一些像MSigDB或WhichGenes收集。不是所有的生物被功能基因集覆盖了,并且很多工具值支持特定的生物。 决定富集的统计学方法要么是基于阈值要么是基于全分布。基于阈值的方法需要用户输入排名靠前的不连续的基因列表,这需要设定一个基于统计学的基因得分阈值。基于超几何分布的Fisher‘s精确单尾检验是阐释这个问题的第一个方法,并且会继续成为这种类型最常使用的方法。这些方法对自然非连续分布列表很有用,但是当对连续的基因得分评判时就有缺点了。尤其,结果如果对阈值的选择不稳定,并且,以二进位的方式对待基因得分有很多信息确实(这里说的二进位指的是要么选中,要么不被选中)。另一方面,基于基因全分布的方法没有门槛threshold-free,因为他们检测基因集靠的是比较他们的得分分布vs背景分布。因为这个原因,他们经常被认为是优于threshold-dependent方法,尤其和一个连续的基因集得分。GSEA(Gene-Set Enrichment Analysis),它的基因排序rank源于差异表达或其他统计学,是最流行的技术之一,虽然也有其他的全分布检验模型被提出。
Y大宽
2018/09/10
3.4K0
Cytoscape插件3:Enrichment Map(1)
AI在医疗领域的又一应用,通过分析CT影片预测死亡的来临
✎ 编 | 王艺 编者按: 这个创新项目将彻底改变医学——在疾病症状显示之前发现它。 当前人工智能在医疗方面的应用主要集中在肿瘤的筛查以及基因测序方面,然而,基因测序在预测慢性和与年龄相关疾病如心脏病、癌症和糖尿病等方面不太有用。但因这些疾病死亡的患者比其他任何原因更多。根据研究,造成以上疾病的可观察特征有70-90%是非遗传性的。因为在这些疾病中,生活方式和环境发挥重要作用,因此遗传学在这些疾病的预测方面,只能给我们提供有限的信息。 最近发表在Scientific Reports期刊上的一项研究可以使我们
用户1737318
2018/07/20
4280
Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码
生信菜鸟团
2025/01/16
5880
Cell | 健康与疾病中 53,026 名成人的血浆蛋白质组图谱 | 提供结果数据和源代码
Nature:有史以来“最逼真”糖尿病血管病变模型的建立
文章详情:科研猫 糖尿病影响着全球数亿人的健康,其可引发多种严重并发症,如失明、肾衰竭、心脏病发作、中风和截肢,究其原因是血管病变所致,如血管基底膜的扩张和血管细胞的丢失。糖尿病还会损害内皮细胞的功能,扰乱内皮细胞与周皮细胞的通讯。
用户6317549
2019/09/24
3.5K0
Nature:有史以来“最逼真”糖尿病血管病变模型的建立
Cytoscape插件4:iRegulon
对所有生物过程来说,基因表达的精确调控对基因表达是非常重要的。序列特异性的转录因子结合在DNA 识别区域(cis调控元件),并且因此控制目标基因的转录起始速率,通过与其他比如co-factors的相互作用,染色体修饰和转录工厂等。人基因组编码大概1800个序列特异性转录因子,其中每一个都调控几百个目标基因。因为,TF 在基因表达中扮演重要角色,他们经常被认为是细胞过程的真正调控者。因此,这些TF的靶基因(target genes)的mapping和characterization对TF调控的生理过程可以提供
Y大宽
2018/09/10
3.4K0
Cytoscape插件4:iRegulon
Nucleic. Acids. Res. | HMDD4.0 人类miRNA与疾病关联的数据
今天为大家介绍的是来自Qinghua Cui团队的一篇数据集论文。微小RNA(miRNA)是一类重要的小型非编码RNA,在几乎所有生物过程中具有关键的分子功能,因此在疾病诊断和治疗中发挥着重要作用。人类微小RNA疾病数据库(HMDD)是与miRNA相关的医学领域的生物医学研究人员的重要综合资源。在这里,作者介绍了HMDD v4.0,该版本从文献中整理了53530个miRNA与疾病相关的条目。与五年前发布的HMDD v3.0相比,HMDD v4.0包含了1.5倍多的条目。此外,还整理了一些新的分类,包括与疾病相关的外泌体miRNA、涉及人类疾病的病毒编码miRNA,以及包含miRNA-circRNA相互作用。作者还整理了与疾病相关的性别差异miRNA。
DrugOne
2023/10/31
6210
Nucleic. Acids. Res. | HMDD4.0 人类miRNA与疾病关联的数据
基因检测和健康保险,慢病管理上下游的掘金者
作者: 张远 孙骋 转自:钛媒体 摘要: App是慢病管理最快捷的入口,因为慢病患者的用户黏度高、日活跃度高,流量有很强的变现渠道。 前一阵沸沸扬扬的百度卖吧风波让“病友群体”这一互联网上不容小觑的人群走入人们的视线。当贴吧中空降的“三无吧主”身份越来越可疑、社区内的资源信息越来越真假难辨时,开辟在贴吧之外新的根据地就成了病友们的当务之急。 令人欣慰的是,糖尿病这样的“大众病”、慢性病病友们已经形成了多个交流圈。在App Store里搜索糖尿病,你可以发现几十个糖尿病社区。在其中,病友们不仅可以交流病情、求
大数据文摘
2018/05/22
7370
MCE | 为什么肥胖经常被“针对”?
近年来,肥胖问题受到越来越多的关注,肥胖不只影响美丽身材,过度肥胖还可能导致肥胖症,这是很多疾病的高风险因素。所以肥胖是一种病?肥胖的标准是什么?
MedChemExpress
2023/03/16
2710
MCE | 为什么肥胖经常被“针对”?
PLOS BIOLOGY | COVID-2019的网络医学与临床真实世界大数据研究
今天给大家介绍的是发表在Plos Biology的一篇文章,“A network medicine approach to investigation and population-based validation of disease manifestations and drug repurposing for COVID-19“。由严重急性呼吸系统综合征2型冠状病毒(SARS-CoV-2)引起的2019年全球冠状病毒病(COVID-19)大流行造成了前所未有的社会和经济后果。疾病的共病导致COVID-19的发病和死亡风险显著增加,但其潜在机制仍不清楚,目前也还没有被批准的治疗方法。本研究旨在利用网络医学方法以及临床和多组学观察,确定SARS-CoV-2的发病机制、疾病表现和COVID-19的治疗方法。本研究提供了一个综合网络医学平台,用于预测与COVID-19相关的疾病表现,并识别了褪黑素可能作为潜在预防和治疗COVID-19的药物。
DrugOne
2021/02/02
3140
PLOS BIOLOGY | COVID-2019的网络医学与临床真实世界大数据研究
差异共表达网络-Co-expression networks
第一步,基于每对基因间的相关性或相互信息定义每2个基因之间的个体关系。这些关系描述了所有样本中基因对表达模式之间的相似性。不同的相关性方法已经被用了构建网络,包括皮尔逊或斯皮尔曼相关系数。可选择的,最小绝对误差回归或贝叶斯方法也可以用来构建共表达网络。后2个有个附加优势,因为他们可以用来鉴定随机联系,这已经在其他地方描述。对于其它相似性方法的讨论,请参考参考文献30。很多这种相似性矩阵也可以用了构建PPI网络,已经用癌症数据进行比较了,ref31。 第二步,共表达相关性用了构建网络,每个node代表一个gene,每条边代表共表达关系的强度。下面fig1。 第三步,使用其中一种可行的聚类方法鉴定modules(共表达基因groups)。共表达分析的聚类用来把所有样本中相似genes归组,产生共表达基因group而不是仅仅共表达基因对。这种聚类方法在选择的时候需要考虑,因为这会严重影响结果,和分析的意义。许多聚类方法是可行的,包括k-means聚类和等级聚类,这在ref33中。Modules然后可以被功能富集分析解释,这是一种鉴定排序在一个genes list中overrepresented功能范畴的方法。
Y大宽
2018/09/10
4.9K0
差异共表达网络-Co-expression networks
“精准医学研究”重点专项阶段性成果大揭秘
自从2016年科技部公布了国家重点研发计划 “精准医学研究”重点专项,陆续有97(2016年第一批批准61个,2017年第二批批准36个)个项目获得支持。
生信技能树
2018/12/07
1.9K0
“精准医学研究”重点专项阶段性成果大揭秘
花二十万做的大队列转录组告诉你不能这样设计课题啊!
比如学员就反馈了2020的一个美国纽约的哥伦比亚大学的阿兹海默症研究文章:《T Cell Responses to Neural Autoantigens Are Similar in Alzheimer’s Disease Patients and Age-Matched Healthy Control》, 对应的数据集是GSE153104,可以看到研究者关注的应该是Alzheimer’s disease (AD),和healthy controls (HC).的转录水平的变化,而且还具体到了不同的细胞亚群:
生信技能树
2024/11/21
1120
花二十万做的大队列转录组告诉你不能这样设计课题啊!
推荐阅读
相关推荐
Cytoscape插件5:DisGeNET(1)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档