上期初步介绍了TARGET数据库,今天继续。
TARGET为选定的儿科癌症生成了大规模基因组数据,并提供了访问权限,其目的在于发现儿童癌症的治疗靶点,并将这些发现转化为临床应用。
下面我们就来简单介绍一下TARGET数据库的数据类型,下载方法等。
数据类型
Genome-Scale Characterization
通过芯片以及测序的检测得到癌症以及癌旁的数据,从而分析其基因结构和表达的变异。不同类型的数据可以单独分析,也可以多组学分析来构建更为全面的基因组图谱。
Sequencing
使用第二代和第三代测序技术,对癌症和配对癌旁样本进行测序,分析儿童癌症中 mutations, gene fusions以及其它的一些变异。此外,在ALL和NBL项目中使用了靶向测序。
Open vs Controlled Access
由于TARGET对于患者的隐私有严格的保护,因此,数据分为两类: open or controlled access。这两种数据都可通过 TARGET Data MatrixOpens来访问。
Open Access Data
这种类型的数据是经过验证和解析的数据,无法识别单个患者,但此类数据可以用于分析。研究者可以通过点击TARGET Data MatrixOpens中任何标有“Open”的链接来访问这些数据。
Controlled Access Data
这类数据包含特定的患者/肿瘤信息以及原始数据,此类数据可用于进行复杂的生物信息学分析。但此类数据只有获得DUC才能进行访问和下载。
下载介绍
The Data Matrix (https://ocg.cancer.gov/programs/target/data-matrix)可以链接到TARGET的open and controlled access 数据。用户可以通过点击相应的文本链接来获取特定的数据。下载示例如下:
领取专属 10元无门槛券
私享最新 技术干货