导语 GUIDE ╲ 肿瘤药物敏感性基因组学数据库(Genomics of Drug Sensitibity in Cancer,GDSC)由英国桑格研究院开发,收集肿瘤细胞对药物的敏感度和反应数据...数据库介绍 2019年7月更新后的GDSC数据库有了新的变化,增加了187种药物和超过160,000种新的独特的药物细胞系对,与以前的版本相比增加了~70%。...GDSC数据库现包含了两套主要的数据集:GDSC1和GDSC2。...GDSC2(收录2015 至今)是新的,它有118,595个IC50结果,这些结果来自桑格研究所使用改进的实验程序进行的最新筛选。...检索细胞系 (1) (2)也可在Cell Lines 选项检索 二、数据下载 下载后数据: 小编总结 GDSC数据库是生信药物基因组学相关分析等非常常用的数据库,它的细胞系与COSMIC
在第一期的GDSC数据总览中,我们根据数据库的模块进行总体的介绍。今天我们再深入了解GDSC所包含的数据及其获取的方法,也就是GDSC的数据下载模块。...GDSC数据下载的模块,分为4个模块,分别是ANOVA results、drug data、genetic features和bulk data。...(二)存贮于GDSC1000资源的多组学数据 : GDSC1000资源主要是来自文献A landscape of pharmacogenomic interactions in cancer [Iorio...基于对文献的认识,能够明确GDSC1000资源[https://www.cancerrxgene.org/gdsc1000/GDSC1000_WebResources/Home.html]中存储的数据类型...小结 本小节主要向大家介绍了GDSC中存贮的bulk数据和GDSC1000数据的认识和下载,有助于大家更轻松获取目的数据。祝大家在肿瘤药敏数据库学习和使用的路上越走越远,越走越轻松。 6.
lines 以及 198 Compounds 如果是看v1版本,987 Cell lines 和 367 Compounds 资源都被整理好了 我们这里直接使用R包oncoPredict整理好的这两个数据库的...Response Portal (CTRP) 数据库里面的细胞系表达量矩阵是来自于转录组测序, 所以 提供了 FPKM和TPM两个版本供用户选择。...然后呢 Genomics of Drug Sensitivity in Cancer (GDSC) 数据库里面的细胞系表达量矩阵应该是芯片,因为它使用了 RMA Normalized and Log...代码探索 (GDSC) 数据库 直接看 v2的版本,有809 Cell lines 以及 198 Compounds 主要是八百多个细胞系的约2万个基因的表达量矩阵,以及对应八百多细胞系的约200个药物的...药物的ic50值,最开始的rds文件里面,也就是说从 (GDSC) 数据库下载得到的是被log转换的,所以又重新使用幂函数转回来。
种细胞系以及 198种化合物 如果是看v1版本,987种 和 367种化合物 官网是:https://www.cancerrxgene.org/ 我们这里直接使用R包oncoPredict整理好的这两个数据库的...rdata文件,下载链接是:https://osf.io/c6tfx/files/osfstorage CTRP数据库里面的细胞系表达量矩阵是来自于转录组测序, 所以提供了 FPKM和TPM两个版本供用户选择...GDSC数据库里面的细胞系表达量矩阵应该是芯片,因为它使用了RMA Normalized and Log Transformed ,标准的芯片数据处理方法。...IC50数据: GDSC2_Res = readRDS(file = file.path(dir,"GDSC2_Res.rds")) dim(GDSC2_Res) head(GDSC2_Res)[,1...GDSC2_Res <- exp(GDSC2_Res) 然后就可以参照前面我们介绍的基于CellMiner数据库的基因表达与药敏分析,进行探索基因表达与药物敏感之间的相关性了。
) 两个数据库资源。.../DataFiles/Training Data/' GDSC2_Expr = readRDS(file=file.path(dir,'GDSC2_Expr (RMA Normalized and Log...Transformed).rds')) GDSC2_Res = readRDS(file = file.path(dir,"GDSC2_Res.rds")) GDSC2_Res <- exp(GDSC2...testExpr<- GDSC2_Expr[,sample(1:ncol(GDSC2_Expr),10)] testExpr[1:4,1:4] colnames(testExpr)=paste0('.../calcPhenotype_Output/DrugPredictions.csv', data.table = F) testPtype[1:4, 1:4] 不同的数据库资源作为函数的训练集,得到的结果必然是不一样的哦
开发团队也提示使用者除了可以用他们预打包的GDSC或CTRP数据作为训练数据集,也可以使用自己的训练数据从而预测任何表达矩阵情况下的药物反应。...这里边有两个重要的数据库的数据,分别是CTRP和GDSC。...GDSC全称是癌症药物敏感性基因组学数据库(https://www.cancerrxgene.org/),该数据库时关于癌症细胞药物敏感性和分子标志物信息的最大公共数据库之一,该数据库整合了细胞、药物和分子的三个不同层次...# [6] "GDSC2_Expr (RMA Normalized and Log Transformed).rds"# [7] "GDSC2_Res.rds"2、选择训练集数据# GDSC2数据#exp...readRDS(file = file.path(dir,"CTRP2_Res.rds"))drug[1:4,1:4]identical(rownames(drug),colnames(exp))两个数据库的数据都可以使用
IC50 的背景知识铺垫,认识了Cancer Therapeutics Response Portal (CTRP) 和 Genomics of Drug Sensitivity in Cancer (GDSC...) 两个数据库资源。...然后提取Bortezomib这个药物的数据资源 有了上面的已知信息,现在我们来看看Genomics of Drug Sensitivity in Cancer (GDSC) 这个数据库资源。...也仅仅是,我们简简单单的把需要预测的表达量矩阵, 去跟数据库里面有药物作用信息的表达量矩阵,进行一个相关性计算(前提是去除了批次效应),然后给需要预测的样品每个都找到了一个最相关的数据库里面的样品,直接把药物作用值赋值给预测样品...那,我们来探索一下, Genomics of Drug Sensitivity in Cancer (GDSC) 这个数据库资源里面的各个样品的表达量信息是否跟各个药物处理的IC50值有相关性!
指定基因在指定细胞系的表达量热图 适合作为学徒作业,你需要去搜索了解一下CCLE数据库,下载它的RNA-seq表达矩阵,然后根据图里面的基因名字和细胞系名字,取出需要的表达矩阵,然后热图可视化即可。...提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP) / Genomics...of Drug Sensitivity in Cancer (GDSC) 这两个: CCLE (www.broadinstitute.org/ccle/) GDSC/CGP (www.cancerrxgene.org.../) 其实还有broad的 CTRP和Roche的geneTech公司的数据库也类似。...其中 GDSC 也就是 CGP,包含着4种数据。
SNP突变、转录组和GDSC药物敏感性联合分析文章套路...--生信自学网 今天生信自学网给大家介绍SNP突变、转录组和GDSC药物敏感性联合分析的视频,这是一个多组学的文章套路。...首先我们从TCGA官网下载转录组数据和临床数据,整理得到转录组和临床数据库的表格。同时从cBioPortal获取基因的突变情况,得到突变的图形。...最后,我们通过GDSC数据库查看病人在基因突变后,对药物敏感性的影响。
方法(NRL2DRP) 2.1数据获取与网络融合 研究团队从GDSC数据库中获取药物反应与基因表征数据,从iRefIndex 数据库中获取PPI网络数据,在数据库GDSC中,基于IC50标签,选用了体细胞突变...图2 六维向量空间中细胞株对药物TG101348的响应 3.2 三种方法性能对比 基于GDSC数据集中所有265种药物,分别测试了NRL2DRP、Stanfield、KBML三种方法的性能,其中图3显示...图3 三种方法AUC、AUPR箱型图 3.3 基于特定组织条件下性能比较 为了验证NRL2DRP方法在特定组织下药物与细胞株反应的AUC指标表现,抽取数据集GDSC中三类特定的组织类型数据进行测试,如图...图4 在特定组织中NRL2DRP方法性能 3.4 发现药物与细胞株敏感性新关系 NRL2DRP方法能够发现GDSC数据集中没有标注的药物与细胞株敏感性之间的关系,并通过相关文献确认这种关系的有效性,表1...通过与Stanfield、KBML两种方法比较,基于数据集GDSC进行大量实验,通过实验结果确定了该方法的有效性与鲁棒性。 5.
一 载入数据,R包 1,安装R包 oncoPredict是CRAN中的包,直接install.packages安装,但是大概率会遇到缺少数据库相关R包的情况,根据提示安装即可。...expression data (2)训练集药物反应数据-GDSC2 pType data (3)待预测的表达数据-our expression data 。...可以直接使用R包oncoPredict整理好的这两个数据库的rdata文件,下载链接https://osf.io/c6tfx/files/osfstorage。...GDSC应该是芯片,提供了 RMA Normalized and Log Transformed。...3,读取三个数据集 训练集使用GDSC-V2 ,预测集使用之前使用的SKCM的表达矩阵 ## 药物训练集 trainingExprData=readRDS(file='.
CCLE、GDSC、LINCS和TCGA这些癌症数据库项目通常无法获得药物基因组学信息,导致了癌症基因组学研究与泛癌层面治疗反应之间的巨大鸿沟,于是各种预测模型被开发用来推断肿瘤基因组图谱(TCGA)的药物反应...作者使用最终的VAEN模型在24种CCLE化合物和251种GDSC化合物进行自我预测,结果如图2A。...(B)在CCLE和GDSC panels上评估14种共享药物。(C)使用TCGA对14种共享药物进行评估。(D)使用化合物17-AAG演示药物反应。...(E)使用CCLE和GDSC评估TCGA中预测的药物反应。 作者还对比了未使用VAE压缩的gene + EN模型表现出过拟合,PCA + EN模型对大多数药物的表现逊色于VAEN模型。...(E)使用GDSC样本。 2.3 TCGA中化合物与其靶点的复制关联 作者使用注释良好的靶点药物进一步证实了预测的药物反应的高质量。
GSCA数据库是由华中科技大学An-Yuan Guo老师实验室开发的。...小编今天给大家分享GSCA数据库的使用。...这个数据库主要整合了 TCGA 数据库的mRNA expression, mutation, immune infiltrates,methylation 和 GDSC 的 drug resistance...目前数据库是在GSCALite版本的基础上更新的版本,数据库网址是http://bioinfo.life.hust.edu.cn/GSCA/#/ 打开链接就能看到数据库主要分为四个模块 点击左侧button...Expression Differential Methylation Methylation & Survival Methylation & Expression 模块4-Drug sensitivity GDSC
癌症数据集的大图 Beat AML数据集的PSN和DSN包含88个节点(图4左)和3828条边(图4右),而在GDSC投影相似度网络中,有266个节点和35,378条边。...通过分析GDSC数据集(图5e-h)(p-value<2.2e−16)获得了可比性结果,表明方法也适用于基于细胞系的数据集的可重复分析。...Beat AML和GDSC的集群内同质性分析 BeatAML的研究也提供了AML的突变情况数据。在这里,作者使用了一个非良性基因突变的数据集来表征这两个患者样本的集群。...首先,作者检查了BeatAML和GDSC数据集中每个聚类的前5种药物的组合(基于细胞活力的中位数)是否能在DrugComb数据库中找到。...在DrugComb数据库中药物组合协同作用得分的分布 药物群间组合的协同作用分析 为了进一步验证利用网络建模预测协同药物组合的策略,作者重点研究了 ALMANAC数据集,其中有103种抑制剂的1,892,650
在两个细胞系药物数据库找共有差异基因 提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP...) / Genomics of Drug Sensitivity in Cancer (GDSC) 这两个: CCLE (www.broadinstitute.org/ccle/) GDSC/CGP (...www.cancerrxgene.org/) 其实还有broad的 CTRP和Roche的geneTech公司的数据库也类似两个细胞系药物数据库,这里先略过。...很简单,把两个数据库里面的乳腺癌细胞系区分 成为干性与否,进行差异分析即可: 干性与否的分组后差异分析 大家可以自己去下 GSE36139 (CCLE).和E-MTAB-783 (CGP).
在介绍R包的使用之前,需要大家先了解一下常用的药物敏感性数据库,最好是去到这些数据库的主页看看或者读一读相关的文献,对这些数据库有一个大致的了解。...常用药敏数据库 药敏数据库非常多,但最常用的无非就是GDSC/CTRP/CCLE等,在珠江肿瘤公众号中早就介绍过这些数据库了,所以我就不重复了,大家可以参考以下链接。...以下链接介绍了GDSC、CTRP、CCLE、NCI-60、DepMap、Pharmacodb等数据库,是非常棒的参考资料: 肿瘤药敏多组学数据库(GDSC)概览 肿瘤药敏多组学数据库(GDSC)的数据介绍和获取...GDSC与其他药敏多组学数据库 GDSC与CELL数据库的药物基因组学一致性 靶点表达水平可作为靶向药物敏感性的指标 pRRophetic方法学介绍 这个R包的思路其实很简单,就是根据已知的细胞系表达矩阵和药物敏感性信息作为训练集建立模型...前面介绍过的GDSC(Genomics of Drug Sensitivity in Cancer),是CGP项目(Cancer Genome Project)的一部分。
近年来,大规模药物基因组数据库的出现推动了预测性个性化肿瘤学研究,包括癌细胞系百科全书(CCLE)、癌症药物敏感性基因组学(GDSC)和癌症治疗反应门户v2(CTRPv2)。...作者发现两个数据库之间共有550个细胞系,针对173种可用SMILES符号的独特分子化合物进行筛选。SMILESVec描述符是大小为100的向量。...虽然GDSC主要对抗癌药物进行分类,但CTRPv2数据库具有一组包含工具化合物、探针和药物的各种小分子,包括美国食品和药物管理局(FDA)批准的癌症治疗药物。...作者预测了GDSC数据库中针对不同细胞通路的PCa细胞系测试的155种药物对这10个样本中的每一个的药物反应。...作者从CCLE/GDSC训练数据中删除了相关测试细胞系。
scDEAL突出了以下几个方面:(i)它可以使用来自癌症药物敏感性基因组学(GDSC)数据库和癌细胞系百科全书(CCLE)的大量bulk RNA-seq药物反应信息来训练和优化模型;(ii)为了考虑bulk...其次,为了评估迁移模型的训练能力是否依赖于bulk资源,仅使用来自GDSC数据库、仅CCLE数据库以及GDSC和CCLE数据库的组合的bulk数据对scDEAL进行基准测试。...结果表明,结合来自GDSC和CCLE数据库的bulk数据可以显著提高预测能力(图2c)。 第三,验证使用DAE和细胞类型正则化是否有助于减少单细胞异质性的损失并提高预测性能。...未来工作展望: 通过整合额外的bulk数据库来更新scDEAL训练数据,提高scDEAL中预测结果的准确性。.../GDSC1000_WebResources/Home.html https://depmap.org/portal/ https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi
本部分用到的数据存储在 the Genomics of Drug Sensitivity in Cancer(GDSC)数据库中,简单来说,通过分析细胞系基因表达及药物处理细胞后的表达谱变化,来推测药物的敏感性.../GDSC1000_WebResources/Data/" paths = bfcrpath(bfc, paste0(base, c("suppData/TableS4A.xlsx",...gene_expr) <- gene_table$GENE_SYMBOLS 手动下载: Processed gene expression matrix(http://www.cancerrxgene.org/gdsc1000.../GDSC1000_WebResources/Data/preprocessed/Cell_line_RMA_proc_basalExp.txt.zip) Drug sensitivities(http...://www.cancerrxgene.org/gdsc1000/GDSC1000_WebResources/Data/suppData/TableS4A.xlsx) 随后进行PROGENy 运算: library
领取专属 10元无门槛券
手把手带您无忧上云