Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >你相信癌症细胞系结果还是肿瘤病人数据(生信游民交流群)

你相信癌症细胞系结果还是肿瘤病人数据(生信游民交流群)

作者头像
生信技能树
发布于 2024-04-13 12:52:17
发布于 2024-04-13 12:52:17
19000
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

看到了一个在《Journal of Thoracic Oncology》期刊的研究,文章标题:《EGFR Oncogenic Mutations in NSCLC Impair Macrophage Phagocytosis and Mediate Innate Immune Evasion Through Upregulation of CD47》,研究者们将两种最常见的突变类型EGFR19del和EGFRL858R,分别转进三种不同的癌细胞系A549、H1299和Beas-2B(前两个是肺腺癌细胞系,第三个是正常的人肺上皮细胞系),发现引入突变型EGFR后,这些细胞系在蛋白和mRNA水平上都表现出CD47的显著上调。(一般来说,肿瘤细胞系都是纯纯的恶性的上皮细胞 )

而且还经过了一些肿瘤病人的转录组队列数据集同样的EGFR突变与否的分组后差异分析,也是有CD47作为多个数据集差异结果的交集,证据链非常solid:

CD47作为多个数据集差异结果的交集

我看到了这个结论马上就想起来了,之前看到的数据挖掘文章:《Single-cell Analyses Reveal Tumor Microenvironment Differences between EGFR 19del and L858R mutations in Lung Adenocarcinoma》,作者从上面提到的GSE171145数据集里面拿到了 two 19del patients, two L858R patients and two wild-type patients ,我看了看前面GSE171145的文献里面的病人描述,确实有EGFR具体突变位点信息,文章的落脚点就是3个分组 ,分别是:

  • 19del LUAD (10,688 cells),
  • L858R LUAD (10,286 cells),
  • EGFR-wild type LUAD (10,510 cells),

也就是说,这个是天然的病人分组,都没必要去做癌症细胞系实验啦,只需要看看CD47这个基因是否在EGFR突变肺腺癌病人组比EGFR野生型肺腺癌病人组高表达即可,而且还可以看看如果CD47这个基因确实是在EGFR突变肺腺癌病人组高表达的话,它是在具体的哪个单细胞亚群高表达呢?GSE171145这个数据集的表达量矩阵如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ls -lh *counts*|cut -d" " -f7-
  3.5M  3 26  2021 GSM5219674_LJQ-T.counts.tsv.gz
   14M  3 26  2021 GSM5219675_GBG-T.counts.tsv.gz
   14M  3 26  2021 GSM5219676_LYB-T1.counts.tsv.gz
   12M  3 26  2021 GSM5219677_LYB-T2.counts.tsv.gz
  9.9M  3 26  2021 GSM5219678_CYD-T.counts.tsv.gz
   12M  3 26  2021 GSM5219679_CYZ-T.counts.tsv.gz
   12M  3 26  2021 GSM5219680_XMS.counts.tsv.gz
  9.1M  3 26  2021 GSM5219681_ZYQ.counts.tsv.gz
   10M  3 26  2021 GSM5219682_TGS.counts.tsv.gz

很容易批量读取这些不同样品表达量矩阵文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(data.table)
dir='GSE171145_RAW/' 
samples=list.files( dir ,pattern = '.counts.tsv.gz')
samples 

library(data.table)
sceList = lapply(samples,function(pro){ 
  # pro=samples[1] 
  print(pro)
  ct=fread(file.path( dir ,pro),data.table = F)
  ct[1:4,1:4]
  rownames(ct)=ct[,1]
  ct=ct[,-1]
  sce=CreateSeuratObject(counts =  ct , 
                         min.cells = 5,
                         min.features = 300 )
  
  return(sce)
})

do.call(rbind,lapply(sceList, dim))
sce.all=merge(x=sceList[[1]],
              y=sceList[ -1 ],
              add.cell.ids = samples  ) 
names(sce.all@assays$RNA@layers)
sce.all[["RNA"]]$counts 
# Alternate accessor function with the same result
LayerData(sce.all, assay = "RNA", layer = "counts")
sce.all <- JoinLayers(sce.all)
dim(sce.all[["RNA"]]$counts )

然后走我们的标准代码,常规的单细胞转录组降维聚类分群代码可以看 链接: https://pan.baidu.com/s/1bIBG9RciAzDhkTKKA7hEfQ?pwd=y4eh ,基本上大家只需要读入表达量矩阵文件到r里面就可以使用Seurat包做全部的流程,但是初始情况下只能说是拿到如下所示的降维聚类分群图:

第一层次降维聚类分群

值得注意的是GSE171145这个数据集的作者并没有说清楚具体的每个单细胞表达量矩阵来源于的病人的突变情况,在附件也看不到,但是我们仍然是可以检查一下CD47这个基因的表达量,很简单的小提琴图即可;

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sce.all = readRDS('./2-harmony/sce.all_int.rds')
sp='human' 
load('./phe.Rdata') 
rownames(phe) = colnames(sce.all)
sce.all@meta.data = phe
sel.clust = "celltype"
sce.all <- SetIdent(sce.all, value = sel.clust)
table(sce.all@active.ident) 
DimPlot(sce.all) 
colnames(sce.all@meta.data)
table(sce.all$celltype)
VlnPlot(sce.all[,sce.all$celltype=='epi'],
        'CD47',pt.size = 0,split.by = 'orig.ident') + ggsci::scale_fill_igv()

可以看到,确实是这8个病人里面的上皮细胞里面的CD47基因表达量是区别的,但是因为GSE171145这个数据集的作者没有说清楚分组,就有点麻烦了 :

8个病人里面的上皮细胞里面的CD47基因表达量是区别的

我发了邮件给GSE171145这个数据集的作者,但是也没有人回复我:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Contact name Qing Zhou E-mail(s) gzzhouqing@126.com
Organization name Guangdong Lung Cancer Institute, Guangdong Provincial People's Hospital, Guangdong Academy of Medical Sciences, Guangzhou, China
Street address 106#,ZHONG SHAN ER ROAD
City Guangzhou
State/province Guangdong
ZIP/Postal code 510010
Country China
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
人类小气道上皮(SAE)特异性细胞分析
文章标题:《Cell-specific expression of lung disease risk-related genes in the human small airway epithelium》
生信技能树jimmy
2024/05/31
1880
人类小气道上皮(SAE)特异性细胞分析
肿瘤病人的单细胞转录组数据不做整合就能体现出来恶性癌细胞的病人异质性吗
其中第一层次降维聚类分群是:clustering and cell type identification was based on scRNA-seq of 212,404 cells from primary mononuclear bone marrow samples of RRMM patients (n = 20) as shown by an UMAP embedding colored by sample without batch-effect correction.
生信技能树
2023/11/19
2740
肿瘤病人的单细胞转录组数据不做整合就能体现出来恶性癌细胞的病人异质性吗
天啦,啥肿瘤有如此高比例的树突细胞
如下所示是的降维聚类分群和命名,很明显的可以看到髓系免疫细胞里面的巨噬细胞和树突细胞的比例是有问题的,而且那些高表达量基因明明是单核细胞的并不是树突细胞的 :
生信技能树
2024/06/08
1700
天啦,啥肿瘤有如此高比例的树突细胞
如何对应两个不同单细胞数据集的分群结果?
kimi(https://kimi.moonshot.cn/):两个不同数据集的单细胞降维聚类分群结果如何对应?
生信技能树
2025/02/05
3950
如何对应两个不同单细胞数据集的分群结果?
胃癌单细胞数据集GSE163558复现(一):数据下载、整理与读取
Hello小伙伴们大家好,我是生信技能树的小学徒”我才不吃蛋黄“。接下来的一段时间里,将由我开启一个新的学徒分享系列,给大家系统整理单细胞测序的代码。此系列包括但不限于以下内容:数据下载与读取;质控和去批次;降维聚类;分群注释;差异分析;富集分析;拟时序分析;细胞通讯;CopyKAT。
生信技能树jimmy
2024/06/13
2.4K0
胃癌单细胞数据集GSE163558复现(一):数据下载、整理与读取
糖尿病早期的病人和正常人的肾脏单细胞水平差异
文章标题:《The single-cell transcriptomic landscape of early human diabetic nephropathy 》
生信技能树jimmy
2023/09/19
3480
糖尿病早期的病人和正常人的肾脏单细胞水平差异
单细胞RNA测序分析人高级别浆液性卵巢癌的组织结构
文章标题:《Single-Cell RNA Sequencing Reveals the Tissue Architecture in Human High-Grade Serous Ovarian Cancer》
生信技能树jimmy
2024/01/02
4910
单细胞RNA测序分析人高级别浆液性卵巢癌的组织结构
人海绵体单细胞转录组图谱
文章标题:《Single-cell transcriptome atlas of the human corpus cavernosum》
生信技能树jimmy
2024/04/28
2090
人海绵体单细胞转录组图谱
肺癌转移中的再生谱系和免疫介导的修剪
文章标题:《Regenerative lineages and immune-mediated pruning in lung cancer metastasis》
生信技能树jimmy
2023/09/26
3240
肺癌转移中的再生谱系和免疫介导的修剪
进展性高级别浆液性卵巢癌核心原型表型的演变
文章标题:《Evolution of core archetypal phenotypes in progressive high grade serous ovarian cancer》
生信技能树jimmy
2023/11/08
2780
进展性高级别浆液性卵巢癌核心原型表型的演变
两种筛选和分析特定的细胞亚群的技术你pick谁(GFP报告系统和抗体标记)
交流群里面小伙伴发了一个小鼠的肝脏单细胞转录组数据文章,说不会读取作者给出来的矩阵,文章是2019的:《Single-Cell Transcriptomics Uncovers Zonation of
生信技能树
2023/09/20
3730
两种筛选和分析特定的细胞亚群的技术你pick谁(GFP报告系统和抗体标记)
单细胞分析支持人类前列腺癌研究中腺泡-神经内分泌的转分化的观点
文章标题:《Single-cell analysis supports a luminal-neuroendocrine transdifferentiation in human prostate cancer》
生信技能树jimmy
2024/01/06
3080
单细胞分析支持人类前列腺癌研究中腺泡-神经内分泌的转分化的观点
脓毒症小鼠模型单细胞(中性粒细胞这么就丢了呢)
前些天我们公众号弄了一个活动,详见:春节期间单细胞转录组数据分析全免费,收到了上百个需求, 本来呢我们自己就算是春节前后14天不吃不喝不眠不休也不可能完成这么多单细胞数据处理。好在我灵机一动,想起来了前面两个月培养的一百多个在线实习生,毕竟教了他们R语言,转录组,以及单细胞转录组。 所以我写了一个还算是比较自动化的单细胞转录组数据处理代码,如果是我自己的,可以在十几分钟就完成复现文章的第一层次降维聚类分群图,比如数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.c
生信技能树
2023/02/27
4310
脓毒症小鼠模型单细胞(中性粒细胞这么就丢了呢)
画出像烟花一样的单细胞umap图,原因竟然是?
GSE125527数据:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE125527。
生信技能树
2025/02/05
1700
画出像烟花一样的单细胞umap图,原因竟然是?
不走寻常路的单细胞表达量矩阵读取
但是我看到了一个比较狡猾的数据集(GSE133283),它官网给出来了的文件如下所示:
生信技能树
2024/03/06
5450
不走寻常路的单细胞表达量矩阵读取
急性髓系白血病微环境中不同免疫细胞细分
文章标题:《Single-cell map of diverse immune phenotypes in the acute myeloid leukemia microenvironment》
生信技能树jimmy
2024/06/13
2950
急性髓系白血病微环境中不同免疫细胞细分
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
生信技能树
2024/04/13
1.2K0
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
病毒感染相关单细胞文献复现-1
该篇文章重点研究了轮状病毒感染绒毛尖端的肠细胞会导致损伤。并且对感染的小鼠肠上皮进行的单细胞RNA测序显示了广泛的应答,包括干细胞扩增和不成熟的肠上皮细胞群。干细胞亚群更频繁地进入细胞周期,导致产生更多的肠上皮细胞来补偿绒毛尖端受损的肠上皮细胞。在丛状细胞中病毒转录物的存在和丛状细胞转录激活的证据表明丛状细胞在损伤后的上皮反应中提供了重要的信号。
生信菜鸟团
2023/09/09
3960
病毒感染相关单细胞文献复现-1
神经调节蛋白4通过抑制肿瘤易发的肝脏微环境抑制NASH-HCC的发展
文章标题:《Neuregulin 4 suppresses NASH-HCC development by restraining tumor-prone liver microenvironment》
生信技能树jimmy
2024/04/19
2030
神经调节蛋白4通过抑制肿瘤易发的肝脏微环境抑制NASH-HCC的发展
外周血单细胞RNA测序揭示阿尔茨海默病的免疫细胞特征
文章标题:《Single-Cell RNA Sequencing of Peripheral Blood Reveals Immune Cell Signatures in Alzheimer’s Disease》
生信技能树jimmy
2023/12/26
5790
外周血单细胞RNA测序揭示阿尔茨海默病的免疫细胞特征
推荐阅读
相关推荐
人类小气道上皮(SAE)特异性细胞分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验