ICGC国际癌症基因组联盟,有亚洲、澳大利亚、欧洲、北美和南美17个行政区的89个项目,包括25,000个肿瘤基因组。...数据库的在线使用比较简单,根据提示输入想要查询的内容即可 ? TP53依然是突变频率最高的基因。 ? 与TCGA不同的是,ICGC里面有多个国家的人群的数据 ?...ICGC可以做在线富集分析,队列比较分析,集合分析和利用OncoGrid展示数据。 ? 不同疾病或地域之间共有或特有的突变位点。 R语言学习 - 韦恩图 ? 搜索基因后的详情页 ?...COSMIC又一个癌症突变数据库 ? ? ? ? 主状图展示突变位点在不同疾病中的分布,R语言学习 - 柱状图 ? ? ? ? 还有突变位点的蛋白结构,研究Docking ? ? ? ? ? ?...换个风格,人蛋白表达数据库,不同人体组织的蛋白质组和转录组数据。 ? ? ? ? ? ? ? ?
另外呢,由于最近ICGC提的也比较多,所以这里也就做一下简单的介绍。 需要明确的是,这几个数据库属于原始数据储存数据库。我们在这里得到的都是相对原始的数据库,需要具备一定的数据分析能力。...ICGC ICGC (https://dcc.icgc.org/), 全称International Cancer Genome Consortium(国际癌症基因组联盟)。...这个数据库和TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。 ?...ICGC是一个储存原始数据的地方,我们只需要检索相对应的关键词就可以得到具体的信息了。我们可以检索疾病、基因名称或者突变信息都可以。...这个数据库和TCGA和ICGC不同的是。TCGA和ICGC更多的还是肿瘤相关的数据,而GTEx收集的是正常人身上的组织来进行的测序,所以GTEx数据库包括的就只是正常人的数据。
ICGC全称如下 International Cancer Genome Consortium 称之为国际肿瘤基因组协会,成立于2007年,第一个提议是构建约25000肿瘤的基因组图谱,称之为the 25K...ICGC的网址如下 https://icgc.org/ 所有的肿瘤基因组数据通过Data Portal进行查看,分析和下载,网址如下 https://dcc.icgc.org/ ?...Enrichment Analysis 对特定的基因,进行富集分析, 支持reactome, Go等数据库,结果示意如下 ? 2....和TCGA类似, ICGC中中丰富的肿瘤基因组学数据,也是一个可以进行深入分析与挖掘的宝藏。
现有91个队列的1098个公共数据集包括 TCGA, ICGC, TARGET, GTEx, CCLE等都进行了标准化处理。因此不同的数据集之间可以组合比较。...另外 Xena 提供了ICGC Data Portal的Chrome扩展,可以在ICGC的界面加入XENA的Heatmap展示,不过没有测试成功。...这次测试Xena插件时,去ICGC的官网又看了下,网站又更新了。好在变化不是特别大,之前ICGC数据库的使用和TCGA数据库在线使用都还可以用。...数据库的使用主要靠自己去多操作,仔细读,多看文档,不要想着一下就可以找到想要的内容,尤其是刚接触时,就当看小说,多浏览几页,就知道都有什么了。...在熟悉了几个基本操作,几种常见的数据类型和展示方式之后,数据库再怎么改版也一样操作了。 XENA提供的这个视频对熟悉XENA的使用提供了很多帮助,剩下的就看你要解决什么问题了。 ? ?
以下数据库按照综合性肿瘤数据库、肿瘤基因组数据库、肿瘤转录组数据库进行分类,供大家选用。...综合性肿瘤数据库 TCGA(cancergenome.nih.gov/)即是综合性肿瘤数据库,关注与癌症的发生和发展相关的分子突变图谱。 小编这里给大家介绍一下其他的数据库。 1....ICGC 网址:https://dcc.icgc.org/ ICGC全称是International Cancer Genome Consortium (国际癌症基因组联合体)。...ICGC的主要目标是在全球范围内具有临床和社会重要性的50种不同癌症类型和/或亚型的肿瘤中生成全面的基因组异常(体细胞突变,基因异常表达,表观遗传修饰)目录数据,尽可能快地向整个研究团体提供数据,并且以最小的限制...ICGC促进了成员之间的沟通,并为广大科研人员提供了一个平台,达成治疗和预防这些疾病的最大化目标。 ?
那次培训内容比较杂,还有关于TCGA、ICGC、ProteinAtlas等数据库的使用, 前面已经分享过,链接如下: UCSC XENA - 集大成者(TCGA, ICGC) ICGC数据库使用 TCGA...数据库在线使用 下面步入正题,这套流程从ChIP-实验、测序注意事项、测序深度,到分析整体流程,再到每一步如序列比对,富集效率评估、热图、峰图可视化,deeptools2使用、peak calling和
如何利用ICGC数据库来寻找一个突变相关课题 昨天我们介绍了ICGC来浏览PCAWG数据的基本功能。昨天的那样介绍,稍微有一些零散,所以我们可以假设一个例子来使用ICGC数据库分析一下看一看。...这里我们以食管癌举例: 1.1 查看食管癌当中插入突变的结果 在ICGC的数据库的筛选栏当中,我们在 Donors中的样本类型当中选择食管,在Mutations中的突变类型选择插入。...ICGC提供了交叉分析的入口。我们可以在Data Analysis当中使用Set Operations来进行交叉分析。在这里我们选择Select就可以选择数据集进行交叉了。 ?
数据介绍 从ICGC和TCGA中获得239例PAAD患者的归一化基因表达和临床随访数据,以及103例患者的RNA-seq数据。...图 3 03 PAAD潜在免疫亚型的鉴定 由于免疫分型可用于反映肿瘤及其微环境中的免疫状态,从而帮助确定适合接种疫苗的患者,作者分析了来自 ICGC 数据库的 239 个 PAAD 样本中 1997...结果还发现,ICGC 队列中 ICP 的总体表达水平高于 TCGA 队列。...在本研究中,ICGC 和 TCGA 队列在不同免疫亚型中的 CA199 和 CA125 表达水平存在显著差异。...在 ICGC 队列中显示出相似的免疫细胞评分,但是亚型之间的免疫细胞组成存在显著差异(图 8b)。
下面是11月学员的投稿 最近批量下载了ICGC数据库资料,数据库长这样: 下载的数据长这样,存放在我的/bioinformatics/ICGC/SpecimenCentric文件下: (base)mk...@mk:/bioinformatics/ICGC/SpecimenCentric$ ls 发现每个文件名的前缀奇怪的的命名,每个文件最前面多了 sp%2F字符。
文章利用TGCA数据库中肝细胞癌患者的转录组数据,分析并确定了患者的缺氧和免疫相关的特征并建立了预测模型,预测病人的预后状况。...方法:本文分析TCGA数据库的肝细胞癌患者的转录组数据,使用ssGSEAhe t-SNE算法评估免疫和低氧状态。...此外,使用Cox回归分析和LASSO算法鉴定预后相关的基因,随后用于建立缺氧和免疫相关的基因特征,同时使用ICGC队列进行外部验证。...数据的获取和整理 本文从TCGA数据库中检索了肝细胞癌(HCC)的转录组数据,包括374位患者和50位健康人群的样本。 2....最后,作者进行单因素和多因素分析,结果表明风险打分可以作为预测TCGA和ICGC HCC预后的独立因素(表1和表2)。 ?
fn=%2FPCAWG%2Fconsensus_cnv%2Fconsensus.20170119.somatic.cna.icgc.public.tar.gz download?...fn=%2FPCAWG%2Fconsensus_snv_indel%2Ffinal_consensus_passonly.snv_mnv_indel.icgc.public.maf.gz download...fn=%2FPCAWG%2Fconsensus_sv%2Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz download?...Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz...Ffinal_consensus_sv_bedpe_passonly.icgc.public.tgz Ffinal_consensus_sv_bedpe_passonly.tcga.public.tgz
基于两簇间表达模式和突变频率的差异,本研究从MsigDB和KEGG数据库中为ssGSEA筛选出致癌通路相关基因,发现在组间仅受体酪氨酸激酶(RTK)-RAS通路存在显著差异(图5G)。...使用应用于 TCGA-LIHC 队列的公式计算 ICGC-LIRI-JP 队列患者的 TCscore,以验证 GSTTKs 特征的预后能力。...TCGA-LIHC 队列(训练集)和 ICGC-LIRI-JP 队列(测试集)中的 AUC 值分别为 0.724和0.729(图 6A、B)。...单因素和多因素 cox 回归分析表明,TCscore 是 TCGA-LIHC(图 6D) 和 ICGC-LIRI-JP(图 6F)中 HCC 患者的独立预后因素。...本研究还利用GDSC数据库的药物信息计算HCC常用化疗药物的半最大抑制浓度(IC50)值,结果发现,高TCscore组索拉非尼的IC50值高于低TCscore组(图6I),而其他四种药物(阿霉素、长春碱
所谓的泛癌分析 我们都知道在TCGA数据库当中,包括了33种所有实体肿瘤的测序的结果(如果不知道的话,可以看我们今天的第二条推送哦!)。...在这个文献里面介绍了五个可以用来分析PCAWG的在线数据库。利用这五个数据库我们就可以来自己分析PCAWG的数据了。 ? 在这篇文章里面,同时也对这五个数据库的功能进行了一下简单的汇总。...的表格看出 在数据检索方面,ICGC和UCSC XENA可以满足所有的检索方式 在数据可视化方面,每个数据库的功能则各有不同。...在数据分析方面,PCAWG Scout可以进行所有其他数据库进行的分析 在数据下载方面,尤其是最原始的BAM数据的下载ICGC数据库是可以的,别的都不行。 ?...明天开始我们就开始一个一个介绍这几个数据库的使用吧!
写在前面 关于PCAWG在线数据库的介绍,之前我们介绍了ICGC和UCSC XENA这两个数据库。其中ICGC主要是可以用来分析突变在泛癌当中的结果。...而UCSC XENA则是一个综合性的数据库,可以用来分析几乎所有的涉及到TCGA的数据。由于分析的内容比较多,所以也就导致操作会相对来说复杂很多。...今天介绍的这个数据库就是专门用来查询基因表达情况的数据库。这个数据库就是:Expression Atlas (https://www.ebi.ac.uk/gxa/home)。...Expression atlas 看数据库的名字就知道。这个数据库就是用来分析基因表达情况的。而其中PCAWG数据只是这个数据库的一部分。...这里我们就先简单介绍一下数据库的时候,在进一步的说明PCAWG在这个数据库如何使用。 Expression atlas数据库,包含了65个物种在内的3900+的高通量测序的结果。
on a Six-Gene Signature Predicts Overall Survival in Patients With Hepatocellular Carcinoma”,作者借助GEO、ICGC...等公共数据库,通过生物信息学的方法筛选出6个可用于预测肝细胞癌(HCC)患者OS的基因,并构建列线图对不同数据集的样本进行预测,验证筛选基因的预后价值。...通过比较这两组中6个基因的表达情况以及生存情况,作者发现高评分组中6个基因高表达且具有不良预后(图4左) 为了进一步验证预测效果,作者从ICGC数据库中选取243个HCC样本,计算风险评分并分组,比较6...相同方法的验证应用于ICGC数据集中(见图5B和图5D) ?...(图6C)同样的分析也应用于ICGC数据集中。 单因素Cox分析表明,风险评分和病理分期与OS相关(P <0.05;图6B)。多元Cox回归分析显示,风险评分,既往恶性程度和病理分期与OS相关。
数据库地址: http://www.innovebioinfo.com/Database/CoMutDB/Home.php ---- 体细胞突变是肿瘤发生中最重要的因素之一,也是大多数癌症测序工作的重点...CoMutDB 包含从三个大型联盟(TCGA、ICGC 和 DepMap)挖掘的体细胞共突变数据。...顶部的三个栏使用不同的颜色来区分源数据联盟(TCGA、ICGC 和 DepMap)。在热图中,每个细胞的颜色强度与具有统计学意义的表型相关共突变对的数量成正比。...CoMutDB 是第一个致力于管理和描述癌症突变共现情况的数据库。
数据介绍 首先我们通过这篇文章的流程图可以得到作者使用的数据来源: Fig.1 经过筛选以后使用了如下数据: GEO数据库:GSE102238,GSE21501,GSE28735,GSE57495,...GSE62452, GSE71729, GSE78229, GSE85916 TCGA:PDAC表达谱数据集 cBioPortal:PDAC表达谱数据集 ICGC:ICGC-AU and ICGC-CA...Fig.5 03 利用GSEA来识别调节免疫细胞的潜在靶点 为了识别可能参与免疫微环境调节的基因,作者将TCGA数据库中的个体分为两组,即免疫评分≤0.4组(N=96)和免疫评分>0.4组(N=26),
ICGC是官网 https://dcc.icgc.org/pcawg 写清楚了两千多个病人的WGS数据来源于哪些项目哪些癌症! ?...exploration, visualization, and discover 有介绍这4个工具:https://www.biorxiv.org/content/10.1101/163907v5 分别是: The ICGC...Data Portal, :https://dcc.icgc.org/pcawg UCSC Xena, :https://xenabrowser.net/datapages/?
数据介绍 从KEGG数据库收集凝血途径,包括hsa04610(补体和凝血级联)和hsa04611(血小板活化),共300个基因作为凝血相关基因。...从GEO,TCGA和ICGC收集肝细胞癌的基因表达谱和相应的临床数据集。...04 识别hub基因 作者使用STRING数据库构建了200个节点和6742条边组成的凝血基因PPI网络(图5A)。采用度数和最大邻域分量(MNC)两种拓扑算法,从PPI网络中鉴定hub基因。...此外,多个队列(TCGA、ICGC 和 GSE76427)的校准图表明,列线图的性能与理想模型相似(图9E)。...首先,在KEGG数据库中检索了血小板和凝血关键词,在hsa04610(补体和凝血级联)和hsa04610(血小板活化)中收集凝血相关基因。
TCPA数据库挖掘视频(TCPA蛋白质数据库/RPPA)...这个时候,我们通常有以下几种验证方法:1)对于有条件的实验室,可以通过自己做实验进行验证;2)通过GEO数据库验证,GEO缺点是很多数据没有临床随访信息;3)通过Arrayexpress、ICGC、CGGA...、CCLE、SRA、CPTAC等其他数据库进行验证,这些我们都有相应的课程。...今天生信自学网给大家一个新的数据库---TCPA数据库,它是TCGA的蛋白质组数据库,可以结合TCGA的临床数据进行分析。...TCPA数据库通过整合来自TCGA和几个独立的肿瘤研究项目的RPPA芯片数据,提供了一个肿瘤蛋白质谱数据中心。
领取专属 10元无门槛券
手把手带您无忧上云