Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >史上最大子宫内膜异位症单细胞图谱

史上最大子宫内膜异位症单细胞图谱

作者头像
生信技能树
发布于 2023-02-27 13:35:40
发布于 2023-02-27 13:35:40
53200
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

都2023了,单细胞还在卷样品数量,这不,史上最大子宫内膜异位症单细胞图谱来了。2023年1月发表在Nature Genetics的:《Single-cell transcriptomic analysis of endometriosis》,接近40万个单细胞哦,样品可以分成如下所示的5个分组:

  • 子宫内膜瘤(n = 8) ,
  • 子宫内膜异位症(n = 28) ,
  • 在位子宫内膜(n = 10) ,
  • 未受影响的卵巢(n = 4)
  • 无子宫内膜异位症的腹膜(n = 4)

纳入的是21个病人,也就是说同一个病人会多个部位取样,如下所示:

同一个病人会多个部位取样

因为是单细胞图谱,所以第一层次的降维聚类分群主要是分组展现一下即可:

第一层次的降维聚类分群

主要是分成了:

  • Mesenchymal cells, identified by expression of FAP, COL1A1 and PDGFRA/B, were the most abundant cell type present (n = 149,051 cells, 39.9% of cells
  • NK/T cells were the second most prevalent cell type present, comprising 101,217 cells (27.1% of cells).
  • Keratin (KRT7, KRT8, KRT10, KRT18, KRT19) or EPCAM-positive epithelial cells (n = 38,456 cells) represented 10.3% of the total population
  • myeloid cells (n = 27,436 cells, 7.3% of the total population),
  • smooth muscle cells (n = 18,314 cells, 4.9% of cells),
  • endothelial cells (n = 23,226 cells, 6.2% of cells),
  • B lymphocytes and plasma cells (n = 8,278 cells, 2.2% of cells),
  • mast cells (n = 1,687 cells, 0.4% of cells).

可以看到跟肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群没有区别,也是:

  • immune (CD45+,PTPRC),
  • epithelial/cancer (EpCAM+,EPCAM),
  • stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。

单细胞亚群细分

前面的第一层次降维聚类分群只能说作为文章的figure1,分析的颗粒度肯定是不够,所以通常来说会挑选部分亚群进行细分,或者全部的亚群一个个轮流细分并且讨论,本文花费大量笔墨描述的是 82,735 mesenchymal cells identified 13 distinct clusters ,可以分成4大类:

  • MME-positive endometrial-type stroma (EnS; 2 clusters; 4,290 cells),
  • fibroblasts (9 clusters; 66,711 cells),
  • smooth muscle cells (1 cluster; 1,735 cells)
  • bland cells expressing the growth arrest specific 5 long noncoding RNA (GAS5+ cells; 1 cluster; 9,999 cells)

就是我们一直说的内皮细胞,成纤维细胞,平滑肌细胞,但是这个bland cells 确实让我有点意外,因为我之前提到的一直在pericyte(周细胞)。

表达量矩阵是可以公开获取的:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE213216

可以很轻松下载到每个样品的表达量矩阵:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
GSM6574509_sample1.tar.gz 51.6 Mb
GSM6574510_sample5.tar.gz 215.5 Mb
GSM6574511_sample7.tar.gz 601.9 Mb
GSM6574512_sample8.tar.gz 575.1 Mb
GSM6574513_sample9.tar.gz 291.5 Mb
GSM6574514_sample10.tar.gz 128.9 Mb

下载这些文件后走单细胞转录组流程即可, 可以做harmony或者CCA的整合,然后降维聚类分群,如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

值得一提的是因为已经是2023了,单纯的单细胞转录组其实有点单薄,所以本文也有少量的空间单细胞数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
GSM6690475_BEME_346_barcodes.tsv.gz 8.0 Kb
GSM6690475_BEME_346_features.tsv.gz 325.6 Kb
GSM6690475_BEME_346_matrix.mtx.gz 11.8 Mb
GSM6690475_BEME_346_scalefactors_json.json.gz 175 b
GSM6690475_BEME_346_tissue_hires_image.png.gz 4.7 Mb
GSM6690475_BEME_346_tissue_positions_list.csv.gz 64.5 Kb
GSM6690475_D_V11F09-023_BEME346.tif.gz 420.5 Mb

GSM6690476_BEME-355G_scalefactors_json.json.gz 175 b
GSM6690476_BEME-355G_tissue_hires_image.png.gz 5.2 Mb
GSM6690476_BEME-355G_tissue_positions_list.csv.gz 63.7 Kb
GSM6690476_BEME_355G_barcodes.tsv.gz 11.2 Kb
GSM6690476_BEME_355G_features.tsv.gz 325.6 Kb
GSM6690476_BEME_355G_matrix.mtx.gz 13.0 Mb
GSM6690476_C_V11F09-023_BEME355G.tif.gz 467.6 Mb

学徒作业

下载前面的所有的样品的单细胞转录组表达量矩阵,每个样品独立的降维聚类分群和命名,然后技术细胞比例,看看是不是每个样品的细胞比例都是 Mesenchymal > NK/T cells > epithelial cells > myeloid

可以使用我们在《生信技能树》公众号的一个教程:这也能画?,所提到了一个很无聊的R包,名字是:scRNAstat ,它可以4行代码进行单细胞转录组的降维聚类分群,其实完全没有技术含量, 就是把 Seurat 流程的一些步骤包装成为了4个函数:

  • basic_qc (查看数据质量)
  • basic_filter (进行一定程度的过滤)
  • basic_workflow (降维聚类分群)
  • basic_markers(检查各个亚群的标记基因)

前面的下载全部的 .tar.gz 文件,然后读取成为sceList 后,需要不到20行代码,就可以批量完成全部的单细胞样品的各自独立的降维聚类分群的检验!

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
lapply(names(sceList) , function(x){  
  # x=names(sceList)[1]
  print(x)
  sce=sceList[[x]]
  sce
  dir.create( x )
  sce = basic_qc(sce=sce,org='human',
                 dir = x)  
  sce
  sce = basic_filter(sce)  
  sce = basic_workflow(sce,dir = x)   
  markers_figures <- basic_markers(sce,
                                   org='human',
                                   group='seurat_clusters',
                                   dir = x)
  p_umap = DimPlot(sce,reduction = 'umap',  
                   group.by = 'seurat_clusters',
                   label.box = T,  label = T,repel = T)
  p=p_umap+markers_figures[[1]]
  print(p)
  ggsave(paste0('umap_markers_for_',x,'.pdf'),width = 12,height = 9)
  #save(p,file = paste0('umap_markers_for_',x,'.Rdata'))
   
})

对每个样品我都快速完成了各自独立的降维聚类分群的检验,而且保存了图片以及图片背后的数据哦!如果你的内存比较小,也可以把前面的读取步骤跟下面的降维聚类分群步骤合并,这样无需存储每次单细胞数据对象啦!而且只需要背诵如下所示各个细胞亚群高表达量基因的列表:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# T Cells (CD3D, CD3E, CD8A), 
# B cells (CD19, CD79A, MS4A1 [CD20]), 
# Plasma cells (IGHG1, MZB1, SDC1, CD79A), 
# Monocytes and macrophages (CD68, CD163, CD14),
# NK Cells (FGFBP2, FCG3RA, CX3CR1),  
# Photoreceptor cells (RCVRN), 
# Fibroblasts (FGF7, MME), 
# Endothelial cells (PECAM1, VWF). 
# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
#   immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), 
# stromal (CD10+,MME,fibo or CD31+,PECAM1,endo) 

就可以很容易给每个单细胞转录组样品的各个细胞亚群进行生物学命名!

赶快去看看是不是每个样品都有 比例过滤吧:Mesenchymal > NK/T cells > epithelial cells > myeloid

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
​harmony、不harmony,这是个问题
harmony应用主成分分析,将转录组表达谱嵌入到低维空间中,然后应用迭代过程去除数据集特有的影响
生信技能树jimmy
2023/08/31
1.4K0
​harmony、不harmony,这是个问题
四行代码完成单细胞转录组的降维聚类分群
我们这里以大名鼎鼎的pbmc3k数据集为例。如果你还没有下面的seurat-data包和pbmc3k对象 ,就自己去下载:
生信技能树
2021/11/04
1.2K0
四行代码完成单细胞转录组的降维聚类分群
单细胞亚群比例变化和表达量差异分析
我们以Nov 2020的文献:《VEGF-B Promotes Endocardium-Derived Coronary Vessel Development and Cardiac Regeneration》为例,链接是:https://www.ahajournals.org/doi/10.1161/CIRCULATIONAHA.120.050635
生信技能树
2022/06/08
2.7K0
单细胞亚群比例变化和表达量差异分析
听说你还缺PBMC单细胞数据
以前我们会推荐 satijalab/seurat-data ,它内置了很多数据集,如果你还没有下面的seurat-data包和pbmc3k对象 ,就自己去下载:
生信技能树jimmy
2022/04/18
1.6K0
听说你还缺PBMC单细胞数据
单细胞转录组一条龙数据分析流程之popsicleR
popsicleR这个单细胞转录组数据分析的R包自己的官方文档很清晰,见:https://github.com/bicciatolab/popsicleR ,包括:
生信菜鸟团
2022/05/23
7910
单细胞转录组一条龙数据分析流程之popsicleR
肿瘤领域的类器官文献的单细胞转录组数据分析是很有限的(膀胱癌)
但是六年前的单细胞转录组并不流行,因为没有10x这样的商业化的仪器,所以那个时候的在每个癌症领域的类器官CNS文章都是做几十个或者上百个病人的类器官培养后,做常规的转录组和肿瘤外显子数据,来说明类器官能非常好的维持其来源的原位肿瘤,这样就说明了类器官可以成为肿瘤病人的精准医疗替身!
生信技能树
2024/04/13
2230
肿瘤领域的类器官文献的单细胞转录组数据分析是很有限的(膀胱癌)
你永远不知道公共数据集给你埋什么坑
其它:比如.loom文件可以使用Seurat包中的Read10X_loom函数或者loomR包来读取。
生信技能树
2024/11/21
1370
你永远不知道公共数据集给你埋什么坑
区区20万个单细胞居然超内存了
其中一个数据集是2020发在NC的肺癌单细胞文章:《Single-cell RNA sequencing demonstrates the molecular and cellular reprogramming of metastatic lung adenocarcinoma》,是44个肺癌病人的58个10x技术的单细胞转录组样品,因为是两三年前的10x单细胞技术那个时候都比较辣鸡所以细胞数量就平均每个样品是3千,这样的话合计是20万个单细胞。
生信技能树
2023/02/27
2K1
区区20万个单细胞居然超内存了
什么,你想要的单细胞亚群比例太少了?
本专辑将会系统性介绍单细胞图谱研究的标准数据分析思路,前面提到了:肿瘤样品的单细胞需要提取上皮细胞继续细分,眼尖的小伙伴们发现了一个问题, 就是它这个肝癌数据集里面的fibroblasts等细胞亚群占比非常少,如果真的要每个细胞亚群都继续细分, 对比例少的细胞分析起来会有误差。 我们再回顾一下这个发表于2020的文章,标题 是:《Single-cell transcriptomic architecture and intercellular crosstalk of human intrahepatic
生信技能树jimmy
2021/10/20
1K0
什么,你想要的单细胞亚群比例太少了?
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
但是因为singleR的数据库资源陈旧而且很有限,满足不了日益增长的单细胞应用,后面我们都是主推第一层次降维聚类分群后的人工命名,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
生信技能树
2024/04/13
1.2K0
使用singleR基于自建数据库来自动化注释单细胞转录组亚群
胃上皮细胞单细胞亚群
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。比如 Clin Cancer Res 2021; 的文章《Spatially Distinct Reprogramming of the Tumor Microenvironment Based On Tumor Invasion in Diffuse-Type Gastric Cancers 》,就是如此的第一层次降维聚类分群:
生信技能树jimmy
2022/04/18
1.5K0
胃上皮细胞单细胞亚群
一篇单细胞文献复现及代码部分更新
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE151177
生信菜鸟团
2023/12/14
1.7K0
一篇单细胞文献复现及代码部分更新
白癜风单细胞转录组数据处理
所以我写了一个还算是比较自动化的单细胞转录组数据处理代码,如果是我自己来做这样的处理,可以在十几分钟就完成复现文章的第一层次降维聚类分群图,如下所示的2分组的15个样品 :
生信技能树
2023/02/27
4610
白癜风单细胞转录组数据处理
拯救你多年前质量差的单细胞数据
不知道有多少课题组仍然是有一些自己的束之高阁的单细胞转录组测序数据呢,也许是年少轻狂也许是轻信了销售的嘴。 看到了前两天(2023年1月31日)的一篇肺癌单细胞文章:《Single-cell analysis reveals prognostic fibroblast subpopulations linked to molecular and immunological subtypes of lung cancer》,下意识的看了看它是否公开测序数据方便我们做教学,发现居然是;https://www.n
生信技能树
2023/02/27
7660
拯救你多年前质量差的单细胞数据
脓毒症小鼠模型单细胞(中性粒细胞这么就丢了呢)
前些天我们公众号弄了一个活动,详见:春节期间单细胞转录组数据分析全免费,收到了上百个需求, 本来呢我们自己就算是春节前后14天不吃不喝不眠不休也不可能完成这么多单细胞数据处理。好在我灵机一动,想起来了前面两个月培养的一百多个在线实习生,毕竟教了他们R语言,转录组,以及单细胞转录组。 所以我写了一个还算是比较自动化的单细胞转录组数据处理代码,如果是我自己的,可以在十几分钟就完成复现文章的第一层次降维聚类分群图,比如数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.c
生信技能树
2023/02/27
4320
脓毒症小鼠模型单细胞(中性粒细胞这么就丢了呢)
子宫腺肌病在位内膜和异位病灶的单细胞转录组分析
背景 子宫腺肌病(Adenomyosis,AM)作为常见的妇科慢性良性疾病,其精确的发病机理尚不清楚。单细胞RNA测序(Single-cell RNA sequencing,scRNA-seq)能够发现罕见的细胞亚群,探索其遗传学和功能的异质性,并揭示每个细胞的独特性,让我们能从更为详细和微观的方面解释生物学问题。作者利用scRNA-seq鉴定了AM中在位内膜(Eutopic endometrium,EM)和异位病灶(Ectopic lesions,EC)的基因表达模式,并探索了AM的潜在发病机制。
生信技能树jimmy
2021/05/18
1.2K0
子宫腺肌病在位内膜和异位病灶的单细胞转录组分析
bd平台的单细胞转录组一定能捕获到中性粒细胞吗
既然这个捕获中性粒细胞是BD单细胞转录组的卖点,那么是不是只要是选择了这个技术就一定能能捕获到中性粒细胞呢?让我们随机看看其它比较新的文章,比如同样的2023的《Single-cell and spatial transcriptome analysis reveals the cellular heterogeneity of liver metastatic colorectal cancer》,数据 是 196,473 CD45+ immune cells from 27 samples of six CRC patients, 链接在;https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE225857
生信技能树
2023/11/13
5130
bd平台的单细胞转录组一定能捕获到中性粒细胞吗
肺上皮细胞单细胞亚群
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。比如 Science Advances 27 Jan 2021: 的文章《 Decoding the multicellular ecosystem of lung adenocarcinoma manifested as pulmonary subsolid nodules by single-cell RNA sequencing》,就是如此:
生信技能树jimmy
2022/04/18
1.4K0
肺上皮细胞单细胞亚群
一个被低估的单细胞数据资源
是中山大学的科研团队在2020的尾巴在《Genome Biol 》期刊发表了一个文章:《Single-cell transcriptome profiling of an adult human cell atlas of 15 major organs》,是单人的15个器官的8万多个单细胞转录组数据和BCR和TCR数据资源。初步质控后是 91,393 cells ,去除了可能的cell doublets 后剩下84,363 cells。
生信技能树
2022/03/03
5350
一个被低估的单细胞数据资源
一篇NC文献部分复现——小鼠正常肺和纤维化肺细胞的 scRNA-seq 分析
胶原生成细胞 (Collagen-producing cells)维持肺的复杂结构并驱动肺纤维化的病理性瘢痕形成。文章中进行scRNA-seq,以鉴定正常和纤维化肺中所有胶原生成细胞,在小鼠肺的不同隔室中具有不同解剖定位的多个胶原生成亚群的特征,一个以表达「Cthrc1」 (collagen triple helix repeat containing 1) 为特征的亚群出现在纤维化肺中,表达最高水平的胶原。
生信菜鸟团
2023/11/24
1.8K0
一篇NC文献部分复现——小鼠正常肺和纤维化肺细胞的 scRNA-seq 分析
推荐阅读
相关推荐
​harmony、不harmony,这是个问题
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验