前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CNS图表复现04—单细胞聚类分群的resolution参数问题

CNS图表复现04—单细胞聚类分群的resolution参数问题

作者头像
生信技能树jimmy
发布2020-09-28 10:46:13
5.4K1
发布2020-09-28 10:46:13
举报
文章被收录于专栏:单细胞天地

分享是一种态度

回顾

我们的CNS图表复现之旅已经开始,前面3讲是;

如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。

眼尖的同学发现,我的代码里面,关于单细胞聚类分群的resolution参数一直在变化:

代码语言:javascript
复制
sce <- FindNeighbors(sce, dims = 1:15)
sce <- FindClusters(sce, resolution = 0.2)
table(sce@meta.data$RNA_snn_res.0.2) 
sce <- FindClusters(sce, resolution = 0.8)
table(sce@meta.data$RNA_snn_res.0.8) 
sce <- FindClusters(sce, resolution = 0.5)
table(sce@meta.data$RNA_snn_res.0.5) 

然后提出疑问,这个resolution参数到底应该是选择多少呢?难道这个步骤没有一个绝对的标准吗?

我之前给大家举例是使用balloonplot这个可视化函数,代码如下:

代码语言:javascript
复制
library(gplots)
tab.1=table(sce@meta.data$RNA_snn_res.0.2,sce@meta.data$RNA_snn_res.0.8) 
balloonplot(tab.1)

就可以很直观的看到,我们把resolution参数分别赋值为0.2和0.8的效果,如下:

0.2和0.8的效果对比

很明显,这个resolution越小呢,我们得到的分群数量就越少,所以0.2的时候是17个群,但是0.8的时候是31个群。

而且我们根据balloonplot的可视化,可以看到,在0.2的时候的17个群里面的有一些群,会随着resolution的调高,继续裂变成为多个群。

有意思的是,我恰好在你要的rmarkdown文献图表复现全套代码来了(单细胞) 看到了一个更好的可视化方法:

代码语言:javascript
复制
# Check clustering stability at given resolution  
# Set different resolutions 
res.used <- seq(0.1,1,by=0.2)
res.used
# Loop over and perform clustering of different resolutions 
for(i in res.used){
  sce <- FindClusters(object = sce, verbose = T, resolution = res.used)
}
# Make plot 
library(clustree)
clus.tree.out <- clustree(sce) +
  theme(legend.position = "bottom") + 
  scale_color_brewer(palette = "Set1") +
  scale_edge_color_continuous(low = "grey80", high = "red")

clus.tree.out

就是借用clustree包,可视化如下:

可以非常清晰的看到,随着resolution的调高,具体是哪些群在不停地继续裂变成为多个群。

但是呢, 仍然是没有回答粉丝的问题,就是resolution设置多少,难道说没有一个绝对的指标吗?

我这里只能说,确实没有,不仅仅是resolution参数,生物信息学数据分析过程中,就比如这个单细胞吧,质控的时候去除多少个质量差的细胞去除多少基因,选择高变基因数量多少,PCA降维后选择多少个PC,基本上每个步骤都是可以灵活调整的。

这就是,数据分析的魅力吧。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 回顾
相关产品与服务
腾讯云 BI
腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档