首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >看了这么多文献,为什么依然做不好细胞亚群注释?

看了这么多文献,为什么依然做不好细胞亚群注释?

作者头像
生信技能树
发布2025-11-20 12:06:23
发布2025-11-20 12:06:23
300
举报
文章被收录于专栏:生信技能树生信技能树

数据背景

今天这个文献专门做了上皮类的一个图谱,文献标题为《A Single-Cell Atlas of the Human Healthy Airways》,该文献通过使用单细胞RNA测序分析,研究沿气道分布的不同细胞群体及其转录变化。由此构建的细胞图谱中,上皮细胞占很高比例(89.1%),免疫细胞(6.2%)和基质细胞(4.7%),且这些细胞在气道的不同区域比例各异。

取样情况

10名健康活体志愿者的人体气道黏膜上皮细胞的异质性。从鼻腔到气道树的第12级分支,共在35个不同位置收集了 77,969个细胞。四个不同部位获取细胞:

1)nasal 鼻腔活检(3份样本);

2)鼻腔 brushings 刷检(4份样本);

3)tracheal 气管活检(气管隆突,第1级分支,9份样本);

4)intermediate bronchial 中间级支气管活检(第5-6级分支,10份样本);

5)distal 远端气道刷检(第9-12级分支,9份样本)。

上皮细胞类型细分

不同亚群的特征如下:

细胞类型

标志基因

鉴定特征与功能描述

基底细胞 (Basal cells)

KRT5, TP63, DLK2

占全部细胞的三分之一,具有高表达KRT5、TP63和DLK2的特征

表层上细胞 (Suprabasal cells)

KRT5, KRT19, NOTCH3

特征为TP63低表达,KRT5表达呈递减梯度,KRT19和NOTCH3表达呈递增梯度

分泌细胞 (Secretory cells)

MUC5AC, MUC5B

由克拉拉细胞和杯状细胞组成,两类细胞无法独立分群,主要差异在于MUC5AC和MUC5B的表达水平

多纤毛细胞 (Multiciliated cells)

FOXJ1, TPPP3, SNTN

高表达FOXJ1、TPPP3和SNTN,构成气道的纤毛清除功能单元

Deuterosomal细胞 (Deuterosomal cells)

DEUP1, FOXN4, CDC20B

多纤毛细胞的前体细胞,表达DEUP1、FOXN4和CDC20B等特异性标志物

浆液细胞 (Serous cells)

LTF, LYZ, PIP

与黏膜下腺相关,高表达LTF、LYZ和PIP

黏液细胞 (Mucous cells)

MUC5B

与黏膜下腺相关,高表达MUC5B但不表达MUC5AC

稀有上皮 (Rare epithelial cells)

222个,占细胞总数的0.3%

I型肺泡细胞 (Alveolar type I cells, AT1)

HOPX, AGER, SPOCK2

鉴定出10个细胞,全部来源于同一例远端刷检样本,表达HOPX、AGER和SPOCK2

II型肺泡细胞 (Alveolar type II cells, AT2)

SFTPA, SFTPB, SFTPC, SFTPD

鉴定出11个细胞,全部来源于同一例远端刷检样本,表达表面活性蛋白SFTPA、SFTPB、SFTPC和SFTPD

注释:表层上细胞 suprabasal、分泌细胞 secretory 和多纤毛细胞簇 multiciliated clusters 中均存在仅能在鼻腔样本中检测到的亚群,这些细胞群被标注为“Suprabasal N”、“Secretory N”和“Multiciliated N”。

不同细胞类型的占比情况:

这里可以看到取样操作方法对样本的细胞构成影响还是挺大的。

稀有上皮细胞类型细分

作者还对上面那一群222个细胞的亚群进行了细分,很有意思。

人体气道稀有上皮细胞类型及特征表

细胞类型

标志基因

细胞描述

刷状/簇状细胞 (Brush/Tuft cells)

LRMP, RGS13, HOXC5, HMX2, ANXA4

鉴定出13个细胞,特征为LRMP和RGS13高表达,具有HOXC5、HMX2和ANXA4调控元件特异性活性

肺神经内分泌细胞 (Pulmonary neuroendocrine cells, PNECs)

PCSK1N, SCGN, NEB, HOXB1, ASCL1, FOXA2

29个细胞簇,主要分布于气管和中级支气管活检样本,表达神经递质相关基因,具有HOXB1、ASCL1和FOXA2特异性调控元件

离子细胞 (Ionocytes)

ASCL3, CFTR, FOXI1, DMRT2

117个细胞簇,主要富集于鼻腔和远端刷检样本,特征性表达离子通道相关标志物,具有ASCL3、FOXI1和DMRT2特异性调控元件

未定义稀有细胞 (Undefined rare cells)

NREP, STMN1, MDK, HEPACAM2, HES6, AZGP1, CRYM, LRMP

63个细胞均匀分布于所有解剖部位,特异性表达NREP、STMN1和MDK,同时与其他稀有细胞共享部分基因表达,呈现基底细胞与其他稀有细胞间的过渡特征

多纤毛化杯状细胞 (Multiciliating-goblet cells)

FOXJ1, MUC5AC

约60个同时表达杯状细胞和多纤毛细胞标志物的过渡态细胞,均匀分布于分泌细胞和多纤毛细胞簇中,经免疫染色和原位杂交验证

数据下载

作者把数据放在了这里 HCA_Deprez:https://www.genomique.eu/cellbrowser/HCA/,下载下来:

代码语言:javascript
复制
### Update Log: 2024-12-09   by juan zhang (492482942@qq.com)
### 
rm(list=ls())
options(stringsAsFactors = F)
library(ggsci)
library(dplyr) 
library(future)
library(Seurat)
library(clustree)
library(cowplot)
library(data.table)
library(ggplot2)
library(patchwork)
library(stringr)
library(qs)
library(Matrix)

###### step1: 导入数据 ######  
# ct <- data.table::fread("HCA_Deprez/exprMatrix.tsv.gz",data.table = F) # 基因数少一些,细胞数一样的
ct <- data.table::fread("HCA_Deprez/Raw_exprMatrix.tsv.gz",data.table = F)
ct[1:5, 1:5]
rownames(ct) <- ct[,1]
ct <- ct[,-1]
dim(ct)
ct[1:5, 1:5]

phe <- data.table::fread('HCA_Deprez/meta.tsv',data.table = F)
head(phe)
rownames(phe) <- phe[,1]
phe <- phe[,-1]
dim(phe)
table(phe$Donor)
table(phe$Sample)
table(phe$Method)
table(phe$Position)
table(phe$CellType)
table(phe$Sex)
# rownames(phe) <- phe[,1]
# phe <- phe[,-1]
# table(phe$SampleID)
identical(rownames(phe),colnames(ct))

# 创建对象
sce.all <- CreateSeuratObject(counts = ct, meta.data = phe, min.cells = 3)
sce.all
saveRDS(sce.all, file = "HCA_Deprez/sce.all.rds")

共77,969个细胞。去试试看,能不能从里面把上皮细胞拿出来,并且进行细分亚群,看看能不能有上面列出来的亚群。

上面提到的特征基因如下:

代码语言:javascript
复制
# 定义细胞类型与标志基因的列表
cell_marker_list <- list(
"Basal_cells" = c("KRT5", "TP63", "DLK2"), # Basal cells - 基底细胞
"Suprabasal_cells" = c("KRT5", "KRT19", "NOTCH3"), # Suprabasal cells - 表层上细胞 (KRT5递减,KRT19/NOTCH3递增)
"Secretory_cells" = c("MUC5AC", "MUC5B"), #  分泌细胞 club and goblet cells
"Multiciliated_cells" = c("FOXJ1", "TPPP3", "SNTN"), # 多纤毛细胞 高表达
"Deuterosomal_cells" = c("DEUP1", "FOXN4", "CDC20B"), # precursors of multiciliated cells
# 两种与黏膜下腺相关的细胞类型:浆液细胞(高表达LTF、LYZ和PIP)和黏液细胞(高表达MUC5B但不表达MUC5AC)
"Serous_cells" = c("LTF", "LYZ", "PIP"), # Serous cells - 浆液细胞
"Mucous_cells" = c("MUC5B"), # Mucous cells - 黏液细胞
"Alveolar_type_I_cells" = c("HOPX", "AGER", "SPOCK2"), # Alveolar type I cells - I型肺泡细胞
"Alveolar_type_II_cells" = c("SFTPA", "SFTPB", "SFTPC", "SFTPD") # Alveolar type II cells - II型肺泡细胞
)

# 打印列表结构
print(cell_marker_list)

看完这篇,突然想起群友的一句呐喊:看了这么多文献,但是依然做不好细胞亚群注释!你是不是有同感?

对同种类型的组织,你看上面这提到的文献的细胞命名,是不是会有点眼花缭乱。。。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据背景
    • 取样情况
  • 上皮细胞类型细分
    • 不同细胞类型的占比情况:
  • 稀有上皮细胞类型细分
  • 数据下载
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档