前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >不同单细胞亚群各自的特征基因也是会有重合的

不同单细胞亚群各自的特征基因也是会有重合的

作者头像
生信技能树
发布于 2022-03-03 03:56:02
发布于 2022-03-03 03:56:02
66200
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

交流群看到粉丝提问,他使用seurat包的FindAllMarkers对他自己的单细胞降维聚类分群后不同单细胞亚群各自的特征基因进行热图可视化,结果报错了因为发现不同单细胞亚群各自的特征基因也是会有重合的。‘

其实非常容易理解,下面我们以如下所示的基于pbmc3k 这个单细胞数据集作为例子展示给大家 的 :

代码语言:javascript
代码运行次数:0
运行
复制
library(SeuratData) #加载seurat数据集  
getOption('timeout')
options(timeout=10000)
#InstallData("pbmc3k")  
data("pbmc3k")  
sce <- pbmc3k.final  
library(Seurat)
table(Idents(sce))

library(future)
# check the current active plan
plan()
plan("multiprocess", workers = 4)
plan()

sce.markers <- FindAllMarkers(object = sce, only.pos = TRUE, 
                              min.pct = 0.25, 
                              thresh.use = 0.25)
DT::datatable(sce.markers)
pro='markers'
write.csv(sce.markers,file=paste0(pro,'_sce.markers.csv'))
save(sce.markers,file = paste0(pro, 'sce.markers.Rdata'))

library(dplyr) 
top10 <- sce.markers %>% group_by(cluster) %>% top_n(10, avg_log2FC)
DoHeatmap(sce,top10$gene,size=3)
ggplot2::ggsave(filename=paste0(pro,'_sce.markers_heatmap.pdf'),height = 15)

每个单细胞亚群各自的高表达量基于都计算得到,并且存储好了!

代码语言:javascript
代码运行次数:0
运行
复制
> as.data.frame(table(sce.markers$cluster))
          Var1 Freq
1  Naive CD4 T  162
2 Memory CD4 T  176
3   CD14+ Mono  391
4            B  147
5        CD8 T  162
6 FCGR3A+ Mono  608
7           NK  364
8           DC  633
9     Platelet  242

其实这个时候,很容易看到每个单细胞亚群各自的特征基因,也是会有重合的哦。热图就很明显看到Memory CD4 T 和Naive CD4 T 共享了大量的基因:

热图

我们使用如下所示的展示方式:

代码语言:javascript
代码运行次数:0
运行
复制
as.data.frame(table(sce.markers$cluster))
deg_list=split(sce.markers$gene,
               sce.markers$cluster)
library(UpSetR)
data <- fromList(deg_list)
upset(data,nsets = 9)

不仅仅是Memory CD4 T 和Naive CD4 T 共享了大量的基因,还有FCGR3A+ Mono和CD14+ Mono , CD8 T 和NK,都是共享了不少的基因。

交集

其实逻辑上也很容易推理,因为seurat包的FindAllMarkers默认找到的是某一个单细胞亚群相当于所有的其它亚群的统计学显著的特异性基因,如果某两个亚群过于类似,它们就会共享大量特异性基因哦,也就是说所谓的计算得到的特异性基因在在这两个过于类似的单细胞亚群里面不特异了。

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

代码语言:javascript
代码运行次数:0
运行
复制
We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
基于非负矩阵分解的单细胞降维聚类分群
可以看到,在CD4和CD8的T细胞的各自矩阵内部降维聚类分群,这6个细分亚群都并不是泾渭分明的界限。听完分享才知道,原来作者这个时候的细分亚群其实并不关心它们内部是不是有不同的独立的单细胞亚群,仅仅是有这6个不同状态或者说发挥不同功能单细胞亚群。而区分它们的手段是非负矩阵分解,并不需要有很清晰的界限,只需要各个亚群的核心功能基因集有差异即可。
生信技能树
2022/03/03
3.1K0
基于非负矩阵分解的单细胞降维聚类分群
CellPhoneDB的单细胞通讯结果的可视化之气泡图
如果你对这些文件的理解还不够,继续看 :CellPhoneDB的单细胞通讯结果的理解
生信技能树
2022/03/03
3.1K0
CellPhoneDB的单细胞通讯结果的可视化之气泡图
速度上吊打FindAllMarkers的单细胞亚群特异性高表达基因查询算法
但是, 最开始我们得到几十个单细胞亚群的时候,就需要对每个亚群找一下各自的单细胞亚群特异性高表达基因,通常是使用Seurat包的FindAllMarkers函数,这个函数的帮助文档写的是:Finds markers (differentially expressed genes) for each of the identity classes in a dataset ,默认使用 Wilcoxon Rank Sum test (default) 方法。
生信技能树
2022/06/08
7.4K0
速度上吊打FindAllMarkers的单细胞亚群特异性高表达基因查询算法
各个单细胞亚群独立在两个分组做差异分析
可以看到,每个单细胞亚群都有自己的差异分析火山图,会议上有人提问这个分析如何做。其实主要是大家可能是初次接触生物信息学就是单细胞数据处理,所以基础知识有点欠缺。它就是普通的表达量矩阵分析而已,我七八年前就写过系列笔记,公众号推文在:
生信技能树jimmy
2022/06/13
9.3K0
各个单细胞亚群独立在两个分组做差异分析
美化你的单细胞亚群比例图
最近,郑州大学第一附属医院的史阳同学无私的分享了他对这些基础函数的改造,颜值说不上巅峰,但打败基础函数是没有问题的, 同时也算是抛砖引玉吧,希望广大生信技能树粉丝们都投稿分享自己的创作,投稿请发邮件到 jmzeng1314@163.com
生信技能树
2022/03/03
1.3K0
美化你的单细胞亚群比例图
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
是比较自动化的AUCell包的算法 ,很多小伙伴后台提问说具体该如何操作呢,代码层面是否有分享,毕竟我们仅仅是在 :这近100种单细胞亚群的2348个标记基因好用吗,截图了文章里面的method描述而已。
生信技能树
2023/09/04
7080
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
各个单细胞亚群的差异基因数量投射到umap图
我简单读了一下文章,其实就降维聚类分群后,每个单细胞亚群在两个分组简单的做一下差异分析,有多少个单细胞亚群就做多少次差异分析,差异分析的上下调基因数量就是umap图里面的每个细胞的颜色情况。
生信技能树jimmy
2022/06/13
2.9K0
各个单细胞亚群的差异基因数量投射到umap图
单细胞热图我要整整齐齐
我们以大家熟知的pbmc3k数据集为例。大家先安装这个数据集对应的包,并且对它进行降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释 ,而且每个亚群找高表达量基因,都存储为Rdata文件。标准代码是:
生信技能树
2022/07/26
2.6K0
单细胞热图我要整整齐齐
一个完美的单细胞亚群随机森林分离器是如何炼成的
虽然两个CD4的T细胞其实大量共享高表达量基因,两个单核细胞也是如此,而CD8和NK也是如此,所以它们的AddModuleScore打分也是有些微混杂,不过最重要的问题是我们的可视化并没有体现出来AddModuleScore打分是否是足够好的分类器。
生信技能树
2022/12/16
6220
一个完美的单细胞亚群随机森林分离器是如何炼成的
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
拿到了一个单细胞表达量矩阵,默认需要进行: 单细胞聚类分群注释 ,如果你对单细胞数据分析还没有基础认知,可以看基础10讲:
生信技能树
2022/12/16
1.4K0
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
各个单细胞亚群的特异性基因集合的打分能准确划分其亚群吗?
而实际情况下,不同层次的细胞亚群的界限容忍度就不一样。比如肿瘤相关单细胞数据集常规分析都是拿到表达量矩阵后的第一层次降维聚类分群通常是:
生信技能树
2022/12/16
3740
各个单细胞亚群的特异性基因集合的打分能准确划分其亚群吗?
寻找marker基因以及细胞鉴定
利用 FindMarkers 命令,可以找到各个细胞类型中与其他类别的差异表达基因,作为该细胞类型的生物学标记基因。其中 ident.1 参数设置待分析的细胞类别,min.pct 表示该基因表达数目占该类细胞总数的比例。
生信喵实验柴
2022/10/25
4.4K0
寻找marker基因以及细胞鉴定
单细胞亚群绝对数量和相对比例的探索
前面我在:单细胞转录组降维聚类分群过滤基因和过滤细胞的区别 介绍了文献,题目为“Revealing the transcriptional heterogeneity of organ-specific metastasis in human gastric cancer using single-cell RNA Sequencing”。通讯作者是浙江大学的范骁辉教授,于2022年发表在Clin Transl Med杂志(IF=10.6),这个胃癌单细胞数据集GSE163558的单细胞转录组在降维聚类分群后,就可以看细胞比例的变化情况。
生信技能树
2024/11/21
1630
单细胞亚群绝对数量和相对比例的探索
单细胞亚群该细分到什么程度呢?
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。
生信技能树
2024/11/21
2240
单细胞亚群该细分到什么程度呢?
各个单细胞亚群特异性的转录因子热图
虽然转录因子分析作为单细胞转录组数据分析的3大高级分析之一名满天下,但是因为它太耗费计算资源导致绝大部分人敬而远之,我们其实也多次分享过细节教程:
生信技能树
2022/03/03
2.3K0
各个单细胞亚群特异性的转录因子热图
单细胞测序—GSE218208(流程简化)
上一篇帖子学习记录了Seurat官方给出的分析流程单细胞测序—基础分析流程,本篇文章以GSE218208为例,记录下实际的单细胞分析流程,更为简便,其与官方给出的流程略有不同。
sheldor没耳朵
2024/07/30
3350
单细胞测序—GSE218208(流程简化)
在umap图上面叠加基因表达量
这个umap里面,叠加了FeaturePlot看一个基因表达信息。文献出处是:《IL-11 is a crucial determinant of cardiovascular fibrosis》,作者其实就是想展现IL-11这个基因呢,在其中一个fibroblasts细胞亚群里面是表达量比较高!
生信技能树
2022/03/03
1.1K0
在umap图上面叠加基因表达量
可视化单细胞亚群的标记基因的5个方法
有了好的代码,甚至非本专业的财务人员都可以复制粘贴我们写好的的代码,参考前面的例子:人人都能学会的单细胞聚类分群注释 , 但不一定每个人都能合理的解释各个单细胞亚群,而标记基因是其中最重要的一个手段来辅助说明你的细胞亚群。广为人知的seurat包就提供了5个方法来进行标记基因可视化,让我们来总结整理一下吧。
生信技能树
2021/03/23
4K3
单细胞DEGs、markers、celltypes | 专辑完结篇
生物学重复的不同条件下的scrna-seq数据的差异基因表达分析 (https://www.10xgenomics.com/resources/analysis-guides/differential-gene-expression-analysis-in-scrna-seq-data-between-conditions-with-biological-replicates)
生信菜鸟团
2023/09/19
3.3K0
单细胞DEGs、markers、celltypes | 专辑完结篇
单细胞测序—PBMC注释的细胞类型
刚开始做单细胞测序的下游分析时,常用的是官方文档提供的pbmc3K数据集,但是我对注释出来的细胞类型缺乏相应的背景知识,对单细胞测序背后的生物学意义也很模糊,这里首先对pbmc3K数据集注释出来的细胞类型进行简单的梳理。
sheldor没耳朵
2024/08/15
1.7K0
单细胞测序—PBMC注释的细胞类型
推荐阅读
相关推荐
基于非负矩阵分解的单细胞降维聚类分群
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档