可以在 genefu 这个R包里面找到PAM50数据集 library(genefu) data(pam50) pam50$centroids.map 简单查看如下: probe...# KNTC2 --> NDC80 # ORC6L --> ORC6 Origin Recognition Complex Subunit 6 需要用代码进行修改回来 pam50genes=pam50
前 · 言 第二单元第八讲:乳腺癌领域之PAM50分类 什么是PAM50 首次接触这个名词肯定很蒙,因为它是乳腺癌领域的分类名词,需要看许多资料才能了解,我也一样,看了一些推文、英文资料、文章,才做了一些总结...PAM50的意思是Prediction Analysis of Microarray 50 ,可以看到是芯片时代的产物了,它是2009年由Parker提出的,原文在:https://ascopubs.org.../man/,使用PAM50是因为它的引用量很高,认可度较高 开始用包 # 加载数据 rm(list = ls()) options(stringsAsFactors = F) load(file...看一下pam50,它是一个列表 > str(pam50) List of 7 $ method.cor : chr "spearman" $ method.centroids: chr...然后取出基因名,存储在centroids中: pam50genes=pam50$centroids.map[c(1,3)] # 发现有的基因已经不是标准的symbol了,PAM50是2009年的基因名,
' R/*R R/PAM50Classify.R: pam50.aux pam50 R/PAM50Filtrate.R: genefu::pam50$centroids.map...::pam50$centroids R/PAM50Report.R: row.names(pam50exprs)pam50$centroids.map$EntrezGene...也就是说 pbcmc其实是想使用 genefu 包的内置数据pam50这个变量,我看了看,这个变量是存在的: library("genefu") data(pam50) 存在,但是它没办法被这样调用...genefu 这个包写的不规范,或者说作者有自己的考虑,并不想把pam50这个数据export给大家,所以需要 data(pam50) 的方式调取。...我猜想,大概率上是genefu 这个包在某个版本经过了一次更新,把pam50这个数据不再export给大家了。
目前看来,最出名的分类就是PAM50,其文章是:J Clin Oncol. 2009 Mar 10; 27(8): 1160–1167....PAM50相关的数据集 走我们的GEO教程(视频+代码 https://github.com/jmzeng1314/GEO ) 可以处理这个 GSE10886. 数据集。...比如:BMC Medical Genomics 2012 https://doi.org/10.1186/1755-8794-5-44 比较了PAM50和IHC结果的一致性。...的分类可以作为机器学习预测指标 通常我们有了转录组表达量信息,就可以使用PAM50分类器来判断乳腺癌的亚型。...但假设我们同时也有病人的其它指标,比如age, ER,PR, HER2 and Ki67 status等等,就可以使用机器学习模型来根据这些指标训练模型关联到其PAM50分类值。
下面是学徒写的《GEO数据挖掘课程》的配套笔记(第6篇) 文献解读 数据下载及理解 差异性分析 差异基因的富集分析 TNBC定义 PAM50的介绍 在临床实践中,就需要HR阳性,HER2阴性乳腺癌的预后和预测模型...,为了实现这些目的,基因检测,如OncotypeDx和PAM50, 已经被开发并在多个临床实验中得以验证 基于基因在癌症中的表达,乳腺癌可以分为5个固有的分子亚型 Luminal A:荷尔蒙受体阳性(雌激素受体...R 语言实现PAM50分类:genefu load(file = 'step1-output.Rdata') # 每次都要检测数据 dat[1:4,1:4] dim(dat) class(dat)...", "ssp2006", "ssp2003", "intClust", "AIMS","claudinLow") spam50...library(genefu) pam50genes=pam50$centroids.map[c(1,3)] #我们表达数据中的这三个基因名与PAM50中的基因名不一样,所以需要先进行转换 pam50genes
壹 METABRIC 和TCGA患者的临床特征 对于乳腺癌研究而言,PAM50十分重要,作者首先基于PAM50进行了生存分析,绘制了生存曲线,发现无论在METABRIC 的发现数据集还是测试数据集中,the...伍 CNA Burden与PAM50,年龄之间的关系 由于之前有文献报道称PAM50,年龄与病人的预后显著相关,作者接着考察了CNA Burden与PAM50,年龄之间的关系。...单因素方差分析用于计算CNA Burden与PAM50的关系,发现二者显著相关,同时对年龄分别采用去线性回归分析以及将年龄分段(21–39, 40–49, 50–59, 60–69, and 70–97
as published in Sotiriou et… sig.oncotypedx Signature used to compute the OncotypeDX signature as… pam50...PAM50 classifier for identification of breast cancer… pik3cags Function to compute the PIK3CA gene signature...(PIK3CA-GS) 上面列出的这些数据集都是可以打开看的: library(genefu) data(pam50) data(pam50.scale) data(pam50.robust) data...(scmod2.robust) pam50 str(scmod2.robust, max.level=1) 最重要的功能就是根据已知基因集来对乳腺癌进行分子分型 所有的分型都是用molecular.subtyping...#08519c"), legend = c("Basal","Her2","LumA","LumB"),bty = "n") plot(main = "Surival Curves PAM50
.2018.342 提到他们研究团队把HR+/HER2–, HR+/ HER2+, HR–/HER2+, and triple-negative breast cancer (TNBC) 这4类,跟 PAM50...neu_immunohistochemistry_receptor_status) 然后在2018年4月Immunity杂志上发表了文章The Immune Landscape of Cancer 附件拿到TCGA的BRCA的PAM50...BRCA.LumB BRCA.Normal 173 73 508 191 139 这个时候需要构建IHC分型和PAM50...merge(dat,b,by.x='id',by.y="TCGA.Participant.Barcode") 画图,用的是ggstatsplot包的ggpiestats,要求数据类型为factor,所以通过pam50
正常乳腺组织样本表达矩阵可以进行的分析 通常情况下应该是去和肿瘤数据进行分析,那样的分析就多元化了,这里来个简单点的,可以进行pam50分类: if(T){ ddata=t(dat) ddata...", "ssp2006", "ssp2003", "intClust", "AIMS","claudinLow") spam50...show_colnames = F, annotation_col = tmp, filename = 'ht_by_pam50_scale.png') 单独取出pam50...可以很明显的看到哪怕是对正常组织的转录组测序结果走pam50的分类也是可以拿到各种各样的分类结果的。...但是pam50的分类是在乳腺癌患者的芯片表达矩阵进行训练的模型,是因为我们用错了地方,可以看看在METEBRIC里面的分类结果: 上面的分类是pam50算法的结果,下面的分类是临床信息。
如果需要比较不同组之间的差异,也需要提供个体的分组信息,如测试数据中的PAM50列。对应TCGA的数据,一般根据某个基因的表达量或突变有无对个体进行分组。...PAM50是通过50个基因的表达量把乳腺癌分为四种类型 (Luminal A, Luminal B, HER2-enriched, and Basal-like)作为预后的标志。...根据PAM50属性对病人进行分组,评估比较两组之间生存率的差别。...BRCA_PAM50 <- droplevels(BRCA_PAM50) colnames(BRCA_PAM50)[colnames(BRCA_PAM50)=="PAM50Call_RNAseq"] PAM50...' # 按PAM50分组 fit PAM50, data=BRCA_PAM50) # 绘制曲线 ggsurvplot
Molecular subtype classification and distribution 分子亚型分类和分布 根据IHC(a,e)、NMC(b,f)、PAM50(c,g)和Consensus(...乳腺癌领域之PAM50分类 什么是PAM50 ?...首次接触这个名词肯定很蒙,因为它是乳腺癌领域的分类名词 PAM50的意思是 ,可以看到是芯片时代的产物了,它是2009年由Parker提出的,原文在:https://ascopubs.org/doi/...另外前人的研究还有: Single Sample Predictor (SSP) :SSP2003 、SSP2006、PAM50 Subtype Classification Model (SCM):SCMOD1...、SCMOD2 、simple three-gene model (SCMGENE) 利用genefu包来熟悉PAM50分类器 这个是Bioconductor的包,使用正确的方式安装好官方教程在:https
viridis::viridis(n = 10), heatmap_legend_param = list( title_gp = grid::gpar(fontsize = 12))) ### PAM50...H.pam50.tcga <- ComplexHeatmap::Heatmap( rev(sample.info$Call), cluster_rows = FALSE, name = 'PAM50...col = pam50.colors, heatmap_legend_param = list( title_gp = grid::gpar(fontsize = 12))) ### PAM50...<- ComplexHeatmap::Heatmap( rev(sample.info$pam50.geneFu.fpkm), cluster_rows = FALSE, name = 'PAM50
乳腺癌还根据使用PAM50分为五种“内在”分子亚型:luminal(LumA和LumB)、HER2富集(HER2E)、基底样basal-like和正常样normal-like。...临床医生根据PAM50的结果,进行诊断和治疗。而分子分型和临床分型有 70-80% 的一致性。...(后面仅用 恶性cancer细胞做PAM50,因此没有鉴定到该亚型。)...SCSubtype:利用scRNA数据 对样本进行“内在”分子亚型 将scRNA-seq数据,作为一个 pseudobulk数据,进行PAM50分型分析,同时利用TCGA数据集进行验证。...得到一个可靠的鉴定不同细胞分型的基因集,但这个基因集仅有4个与PAM50中的50个基因有重复。
molecular subtypes are associated with different clinic-pathological variables and clinical outcome 研究人员使用 PAM50...classifier 确定了 intrinsic molecular (PAM50) subtypes 在TNBC和5个稳定的TNBC亚型中的分布。...使用Cox比例风险回归模型,发现PAM50分类与总生存率显著相关,其中HER2-E亚型的预后较差,LAR亚型的预后较差,而IM亚型预后较好。...molecular subtypes display distinct genomic instability 由于TNBC肿瘤已知与不稳定的基因组相关,研究人员研究了染色体不稳定(CIN),即根据激素状态、PAM50
前 · 言 第二单元第九讲:生物学背景知识之细胞周期推断 上一次说到通过PAM50基因进行乳腺癌分型,利用的就是自己的表达矩阵和PAM50基因比较,看表达量变化进行分类。...细胞周期分类和PAM50类似,也是利用基因来推断G、S、M期(https://en.wikipedia.org/wiki/Cell_cycle) ?
affect gene expression. using a genetically engineered mouse mammary tumor model we demonstrate that the PAM50...platform Coverage (%) Intrinsic [1, 21] Intrinsic subtype Ref. [2, 3] Stanford cDNA array 410/549 (75%) PAM50...[9] PAM50 subtype Ref. [9] Agilent Human oligo array 42/50 (84%) 70gene [4] MammaPrint Ref. [5, 22,
使用 scRNA-seq 对 TNBC 患者内在亚型的 GRN 进行了全面分析,从 scRNA-seq 数据中推断出拷贝数变异 (CNV) 并确定了 545 个恶性细胞,并且基于PAM50模型分配恶性细胞的亚型...为了识别每个恶性上皮细胞的分子亚型,采用 PAM50 模型将恶性上皮细胞分为五种分子亚型,称为正常样、基底样、Her2+、LumA 和 LumB。发现 6 名患者的亚型组成表现出极大的多样性。
与PAM50的比较 可以看到,针对lincRNA表达矩阵对TCGA计划的BRCA进行分类,与PAM50的重合度非常高! ? 在使用癌症表现一致的lncRNA 如下图: ?
brca.tcga$segment surv.info <- brca.tcga$clin.info head(surv.info) ## fustat futime PAM50...OF TCGA-BRCA") optk.brca$N.clust ## [1] 3 不一定非要使用计算出来的最佳数量,可以结合背景知识另行选择,作者给的示例是乳腺癌所以选了5,因为乳腺癌公认的PAM50...mut.col <- c("grey90" , "black") col.list <- list(mRNA.col, lncRNA.col, meth.col, mut.col) # extract PAM50..., pathologic stage and age for sample annotation annCol PAM50", "pstage", "age"),...colors = c("#0000AA", "#555555", "#AAAA00")), PAM50
反而是公众号编辑忙不过来,所以大多数好的笔记无缘跟粉丝见面,不过我自己的笔记可以开绿色通道,现在开启系列连载: 预测BRCA基因功能缺陷的HRDetect基因集 TNBC分型研究的来龙去脉 BRCA分型之PAM50...human breast cancer by integrated analysis of DNA methylation and RNA-Seq data 其它组学数据分型研究 IntClust和PAM50
领取专属 10元无门槛券
手把手带您无忧上云