在什么时候需要详细了解TCGA样本barcode含义呢?比如如何将 TCGA数据库中基因表达矩阵与样本临床数据进行合并,来了解一下样本barcode ID的构成吧。
TCGA样本ID主要由以下几部分组成,详细见官网链接:https://docs.gdc.cancer.gov/Encyclopedia/pages/TCGA_Barcode/
TSS:Tissue source site,组织来源机构编码,这里的2表示来自安德森癌症中心的胶质母细胞瘤(脑肿瘤)样本,TSS编号对应的组织部分可参考:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/tissue-source-site-codes
Participant:Study participant,研究参与者,0001表示 来自安德森癌症中心的第一位胶质母细胞瘤研究参与者
Sample:Sample type,样本类型,1表示实体瘤,肿瘤类型(Tumor types)编号从01到09,正常组织类型(Normal types)编号从10到19,对照样本(Control samples)编号从20到29。请查看编码表报告以获取完整的样本代码列表:https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes。
sample-type-codes
Vial:Order of sample in a sequence of samples
Portion:Order of portion in a sequence of 100 - 120 mg sample portions,样本的一部分,一份组织一般会分割为100-120mg一份。
Plate:Order of plate in a sequence of 96-well plates,在一系列96孔板中的顺序,4个字母表示,值大表示制板越晚
Analyte:Molecular type of analyte for analysis,分子类型,D表示为DNA样本,不同的分子类型如下:
https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/portion-analyte-codes
上面不同部分组成的barcode关联如下:
上面图片的底部:你就可以看到,一个病人,可能取到多个样本,封装到不同的容器vial中,一个容器中的样本会被分成100-120mg的不同的分装portion,然后提取不同的分子类型如DNA、RNA等,点到不同的96孔板中,送到不同的测序中心进行测序,得到不同的组学数据或者相同组学数据。
什么用药信息barcode,检查barcode,手术barcode,化疗barcode等