前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用TCGAbiolinks进行生存分析

使用TCGAbiolinks进行生存分析

作者头像
生信修炼手册
发布于 2019-12-19 08:25:54
发布于 2019-12-19 08:25:54
1.5K0
举报
文章被收录于专栏:生信修炼手册生信修炼手册

TCGAbiolinks不仅提供了数据的下载功能,还提供了各种各样的下游分析功能,生存分析是TCGA数据最经典的应用场景之一,通过TCGAbiolinks可以轻松实现生存分析。

在进行生存分析之前,首先要得到患者的临床数据。在之前的文章中介绍了通过GDC来下载临床数据的方法,在GDC中临床数据有两种形式

  1. XML 每个样本的所有临床信息以XML的格式进行存储,该文件中包含的临床信息是最为全面的
  2. TSV/JSON 将需要下载的数据添加到GDCcart之后,可以选择下载tsv或者json格式的临床信息,这种方式得到的信息只是XML中信息的一个子集,缺点就是不够完整,但是对于生存分析而言却是足够了,而且该文件中患者的生存信息比XML文件更新的快。

这两种临床信息的下载方式如下

1. TSV/JSON

结果示意如下

2. XML

结果示意如下

此外,还提供了从GDC Legacy Archive数据库下载临床信息的功能,用法如下

在进行生存分析时,更推荐使用TSV/JSON格式的生存信息,更新的更加及时,具体用法如下

结果如下所示

通过TCGAbiolinks可以方便的提取TCGA中的临床信息进行生存分析。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-06-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
使用TCGAbiolinks下载TCGA的数据
TCGAbiolinks是一个分析处理TCGA数据的R包,通过GDC API来查询和下载TCGA的数据,同时提供了差异分析,生存分析,富集分析等常见的分析功能,网址如下
生信修炼手册
2019/12/19
1.5K0
如何使用TCGAbiolinks下载TCGA数据并整理
一般来讲,我们想要使用TCGA数据,大概有三种方法,一是直接从GDC官网或官方下载工具gdc-client下载文件后自行处理,二是使用数据库如UCSC Xena或Firehouse,三是使用TCGAbiolinks R包自动下载并处理。
叶子Tenney
2023/03/24
8.2K11
如何使用TCGAbiolinks下载TCGA数据并整理
手把手学习TCGA数据库:SNP突变分析第三期
各位科研芝士的朋友好,前两期我们讲解了SNP的基础知识和数据库使用,今天我们继续聊SNP数据的下载
百味科研芝士
2019/06/17
4.3K0
手把手学习TCGA数据库:SNP突变分析第三期
TCGA的28篇教程-所以癌症的突变全景图
有了MAF格式的突变数据,比如TCGA里面的乳腺癌的1000个左右的样本的突变信息,就很容易走maftool这个包,进行绘图,代码如下:
生信技能树
2018/09/21
5.6K1
TCGA的28篇教程-所以癌症的突变全景图
使用GDC下载TCGA肿瘤患者的临床信息
在GDC中,临床信息的下载和普通文件是类似的,在Repository中,数据类型选择Clinical, 示意如下
生信修炼手册
2019/12/20
2K0
TCGA数据挖掘(一):TCGAbiolinks包介绍
肿瘤基因组图谱(TCGA)计划是由美国National Cancer Institute(NCI)和National Human Genome Research Institute(NHGRI)于2006年联合启动的项目,研究的癌症类型从最开始的多形性成胶质细胞瘤(GBM)到现在为止共有39种,涉及29种癌症器官,1万多个肿瘤样本,27万多份文件,当然其项目也将于2017年接近尾声。
DoubleHelix
2019/08/27
5.1K0
TCGA数据挖掘(一):TCGAbiolinks包介绍
TCGA数据库介绍以及下载方式小结
美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。TCGA 使命:提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力TCGA 目标:完成一套完整的与所有癌症基因组改变相关的“图谱”。
用户1359560
2019/05/14
5.1K0
TCGA数据库介绍以及下载方式小结
使用GDC在线查看TCGA数据
GDC是Genomic Data Commons的缩写,是由美国国家癌症研究所NCI建立的一套癌症数据共享系统,整合包括TCGA在内的多个癌症数据库中的信息,提供了癌症数据的统一存储,管理,展示,将数据与世界范围内的癌症基因组学研究者共享,网址如下
生信修炼手册
2019/12/20
2.3K0
使用GDC在线查看TCGA数据
可能是最适合初学者的TCGA官网下载和表达矩阵整理教程
从打开网址开始教你一步一步的下载TCGA的数据,图文并茂,真的是详细的不能再详细了!
医学和生信笔记
2022/11/15
1.7K0
可能是最适合初学者的TCGA官网下载和表达矩阵整理教程
手把手教你用R语言下载TCGA数据库:TCGAbiolinks
各位科研芝士的朋友,大家好,TCGA这块大蛋糕,不同的人总会用不同的工具来切分这个蛋糕,今天我们继续分享关于TCGA数据下载的专题,今天我们继续聊聊TCGA的江湖,在TCGA的武林里,总有一个出类拔萃的佼佼者神包——TCGAbiolinks。
微点
2019/05/07
14K0
新版TCGAbiolinks包学习:富集分析和生存分析
TCGAbiolinks是一个大而全的R包,常见的分析都能做,比如差异分析、富集分析、生存分析等等。上次学习了差异分析,今天学习下富集分析和生存分析。
医学和生信笔记
2022/11/15
9660
新版TCGAbiolinks包学习:富集分析和生存分析
TCGAbiolinks包下载TCGA数据进行表达差异分析-乳腺癌案例
TCGAbiolinks -一个用于TCGA数据综合分析的R/BioConductor软件包,能够通过GDC Application Programming Interface (API)访问 National Cancer Institute (NCI) Genomic Data Commons (GDC) ,来搜索、下载和准备相关数据,以便在R中进行分析。
DoubleHelix
2019/08/07
17.3K1
TCGAbiolinks包下载TCGA数据进行表达差异分析-乳腺癌案例
玩转 TCGA 数据库 (一)
癌症基因组图谱计划(The Cancer Genome Atlas , TCGA),对超过 20,000 份涵盖 33 种癌症类型(https://www.cancer.gov/ccg/research/genome-sequencing/tcga/studied-cancers)的原发癌及配对正常样本进行了分子特征分析。,是一个由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)联合发起的大规模研究项目。TCGA的主要目标是通过全面分析不同类型癌症的基因组变化,来提高对癌症的理解并推动诊断、治疗和预防的进步。TCGA现在的数据均收录在 GDC (Genomic Data Commons) 中,可以通过网页 GDC Data Portal (https://portal.gdc.cancer.gov/)获得TCGA数据。
生信菜鸟团
2025/05/06
5240
玩转 TCGA 数据库 (一)
TCGA数据下载—TCGAbiolinks包参数详解
最近才开始使用TCGAbiolinks这个包从TCGA数据库官网下载数据,发现很多参数不知道去哪里找,所以就查找资料总结了一下。以下载肝脏肝细胞癌(LIHC)的count值为例,下载数据最主要的一个函数是GDCquery()。我们在R里运行:
生信技能树
2019/05/13
9.2K1
必会的TCGA数据挖掘工具之TCGAbiolinks
TCGA数据库作为癌症研究的首选公共数据库,整合了各种癌症的多组学数据,今天小编给大家带来的正是一个功能强大的TCGA数据分析工具--TCGAbiolinks!
作图丫
2022/03/29
1.7K0
必会的TCGA数据挖掘工具之TCGAbiolinks
TCGAbiolinks数据下载
笔者认为,这些功能的好处在于能够比较方便的用简单几行代码做一些固定的分析,恰恰这也是它的缺点,这样的话包的灵活性就大打折扣了,不能够很好的整合用户的其它分析流程。考虑到这一点,我可能不会过多的使用它的其它分析功能
微点
2019/10/30
1.3K0
TCGA数据库R包集大成者TCGAbiolinks
主要是因为GDC官网虽然权威,但是太复杂了,不利于初学者。而且GDC官网是针对TCGA数据库的每个癌症的每个病人的不同数据分开存放,每次都是批量下载后,整理合并的。但是我们前面的在线接口,去cbioportal或者FireBrowse都是以癌症为单位下载不同数据集。包括后面分享的:
生信技能树
2022/07/26
1K0
TCGA数据库R包集大成者TCGAbiolinks
TCGA的28篇教程-整理GDC下载的xml格式的临床资料
GDC给出了一系列的用户友好的选择框,你只需要根据条条框框来选择就可以下载到自己想要的数据,而不需要去几百个文件夹里面漫无目的的查找了。 https://gdc-portal.nci.nih.gov/legacy-archive/search/f 根据自定义搜索过滤条件拿到了 mainfest 文件就可以使用下面代码下载:
生信技能树
2018/08/16
3.6K1
TCGA的28篇教程-整理GDC下载的xml格式的临床资料
R tips:使用TCGAbiolinks包下载TCGA数据
TCGA数据下载就易用性来说,RTCGA包应该更好用,且由于是已经下载好的数据,使用比较稳定。但是也由于是下载好的数据,不能保证数据都是全新的。TCGAbiolinks包是实时调用GDC的API,所以可以获取最新的数据。
生信菜鸟团
2022/02/17
3.6K0
R tips:使用TCGAbiolinks包下载TCGA数据
新版TCGAbiolinks包学习:批量下载数据
TCGAbiolinks不仅是数据下载,它能访问、下载全部的TCGA数据(除了受限制的),用它下载的数据是最新最全的!这和直接去GDC官网,使用网页下载的方式是一样的。
医学和生信笔记
2022/11/15
2.2K0
推荐阅读
相关推荐
使用TCGAbiolinks下载TCGA的数据
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档