首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >pyscenic的转录因子分析结果展示之各个单细胞亚群特异性激活转录因子

pyscenic的转录因子分析结果展示之各个单细胞亚群特异性激活转录因子

作者头像
生信技能树
发布于 2022-07-26 01:55:12
发布于 2022-07-26 01:55:12
1.9K00
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

前面的笔记:pyscenic的转录因子分析结果展示之5种可视化 带领大家回顾了一下 单细胞转录因子分析之SCENIC流程 ,并且重新认识了 使用pyscenic做转录因子分析 后的结果。

我们根据pbmc3k数据集里面的b细胞有两个非常出名的转录因子,TCF4(+) 以及NR2C1(+),进行了可视化。其实这两个转录因子并不是先验知识,是我们根据这个分析结果进行各个单细胞亚群特异性激活转录因子统计得到的。

让我们来看看这个统计分析如何做,以及如何更好的可视化。如果你确实计算资源有限制,其实看看 各个单细胞亚群特异性的转录因子热图,也是很容易理解,并不一定要 使用pyscenic做转录因子分析 哦。

首先再次回顾一下pyscenic的转录因子分析结果

代码如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
######  step0 加载 各种R包  #####

rm(list=ls())
library(Seurat)
library(SCopeLoomR)
library(AUCell)
library(SCENIC)
library(dplyr)
library(KernSmooth)
library(RColorBrewer)
library(plotly)
library(BiocParallel)
library(grid)
library(ComplexHeatmap)
library(data.table)

load(   file = 'for_rss_and_visual.Rdata')
head(cellTypes) 
sub_regulonAUC[1:4,1:2] 

可以看到每个单细胞都标记好了生物学名字,而且配套了一个转录因子活性矩阵,自己去看 前面的 使用pyscenic做转录因子分析 教程, 拿到 for_rss_and_visual.Rdata 的文件哦 :

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> head(cellTypes) 
                     celltype
AAACATACAACCAC-1  Naive CD4 T
AAACATTGAGCTAC-1            B
AAACATTGATCAGC-1 Memory CD4 T
AAACCGTGCTTCCG-1   CD14+ Mono
AAACCGTGTATGCG-1           NK
AAACGCACTGGTAC-1 Memory CD4 T
> sub_regulonAUC[1:4,1:2] 
AUC for 4 regulons (rows) and 2 cells (columns).

Top-left corner of the AUC matrix:
          cells
regulons   AAACATACAACCAC-1 AAACATTGAGCTAC-1
  ARNTL(+)       0.08163265       0.05424823
  ASCL2(+)       0.21191691       0.28589650
  ATF1(+)        0.04203110       0.04387755
  ATF2(+)        0.24141561       0.19748137

> dim(sub_regulonAUC)
[1]  208 2638

值得一提的是这个pbmc3k数据集的两千多个细胞,其实就两百多个转录因子结果哦。

看看不同单细胞亚群的转录因子活性平均值

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
selectedResolution <- "celltype" # select resolution
# Split the cells by cluster:
cellsPerGroup <- split(rownames(cellTypes), 
                       cellTypes[,selectedResolution]) 
sub_regulonAUC <- sub_regulonAUC[onlyNonDuplicatedExtended(rownames(sub_regulonAUC)),] # 去除extened regulons
dim(sub_regulonAUC)

# Calculate average expression:
regulonActivity_byGroup <- sapply(cellsPerGroup,
                                  function(cells) 
                                    rowMeans(getAUC(sub_regulonAUC)[,cells]))

# Scale expression:
regulonActivity_byGroup_Scaled <- t(scale(t(regulonActivity_byGroup),
                                          center = T, scale=T)) 
# 同一个regulon在不同cluster的scale处理
dim(regulonActivity_byGroup_Scaled)
regulonActivity_byGroup_Scaled=regulonActivity_byGroup_Scaled[]
regulonActivity_byGroup_Scaled=na.omit(regulonActivity_byGroup_Scaled)
pheatmap:pheatmap(regulonActivity_byGroup_Scaled)

如下所示的简单热图 :

简单热图

可以看到,确实每个单细胞亚群都是有 自己的特异性的激活的转录因子,仍然是推荐看看 各个单细胞亚群特异性的转录因子热图

不过,SCENIC包自己提供了一个 calcRSS函数,帮助我们来挑选各个单细胞亚群特异性的转录因子,全称是:Calculates the regulon specificity score

参考文章:The RSS was first used by Suo et al. in: Revealing the Critical Regulators of Cell Identity in the Mouse Cell Atlas. Cell Reports (2018). doi: 10.1016/j.celrep.2018.10.045

运行超级简单。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rss <- calcRSS(AUC=getAUC(sub_regulonAUC), 
               cellAnnotation=cellTypes[colnames(sub_regulonAUC), 
                                           selectedResolution]) 
rss=na.omit(rss) 
rssPlot <- plotRSS(rss)
plotly::ggplotly(rssPlot$plot)

如下所示,可以看到我们前面的笔记:pyscenic的转录因子分析结果展示之5种可视化 ,提到的 pbmc3k数据集里面的b细胞有两个非常出名的转录因子,TCF4(+) 以及NR2C1(+),确实是在b细胞里面名列前茅哦:

挑选各个单细胞亚群特异性的转录因子

大家可以把每个单细胞亚群各自的独特激活的转录因子按照我们前面的笔记:pyscenic的转录因子分析结果展示之5种可视化 ,拿去安装进行可视化哦。

比如血小板的PRDM1这个转录因子,你会发现,不同的可视化方法只有结合起来你才能对数据有一个更直观的感受。

其它可视化(基本都是展现不同细胞亚群特异性转录因子)

我们也多次介绍过:

经过了前面的步骤,我们顺利挑选到了各个单细胞亚群特异性的转录因子列表,就可以自己去提取它们在每个细胞的活性值,自己绘制热图或者其它图表,大同小异的。

下面简单的分享一下我自己的解决方案,

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(dplyr) 
rss=regulonActivity_byGroup_Scaled
head(rss)
library(dplyr) 
df = do.call(rbind,
             lapply(1:ncol(rss), function(i){
               dat= data.frame(
                 path  = rownames(rss),
                 cluster =   colnames(rss)[i],
                 sd.1 = rss[,i],
                 sd.2 = apply(rss[,-i], 1, median)  
               )
             }))
df$fc = df$sd.1 - df$sd.2
top5 <- df %>% group_by(cluster) %>% top_n(5, fc)
rowcn = data.frame(path = top5$cluster) 
n = rss[top5$path,] 
#rownames(rowcn) = rownames(n)
pheatmap(n,
         annotation_row = rowcn,
         show_rownames = T)

可以看到, SCENIC包自己提供了一个 calcRSS函数跟我的方法去找到的各个单细胞亚群的特异性的转录因子其实大同小异哦

我的方法

确实每个单细胞亚群都是有 自己的特异性的激活的转录因子,仍然是推荐看看 各个单细胞亚群特异性的转录因子热图。其实很久很久以前的教程 使用pyscenic做转录因子分析 ,也是 同样的可视化思想。

写在文末

我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 jmzeng1314@163.com

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python版SCENIC转录因子分析(四)一文就够了
在升级了pySCENIC后,发现转录因子数据库更新了。因此本文基于更新后的转录因子数据库,再次记录了从软件部署到pySCENIC的运行,最后进行可视化的详细笔记,希望对大家有所帮助,少走弯路。
生信技能树
2023/02/27
18.9K0
Python版SCENIC转录因子分析(四)一文就够了
pyscenic的转录因子分析结果展示之5种可视化
但是在R里面跑这个,超级耗时,所以有 使用pyscenic做转录因子分析 和 没想到自己会放弃conda(docker镜像的pyscenic做单细胞转录因子分析),大家可以按需取用。
生信技能树jimmy
2022/03/14
4.8K1
pyscenic的转录因子分析结果展示之5种可视化
单细胞转录因子分析之SCENIC流程
SCENIC (Single-Cell rEgulatory Network Inference and Clustering) is a computational method to infer Gene Regulatory Networks and cell types from single-cell RNA-seq data. 官网教程非常清晰:
生信技能树
2021/01/06
9.9K2
SCENIC转录因子分析结果的解读
不过,虽然SCENIC转录因子分析越来越普通,但它的难度并不会降低,在试图学习这个分析方法之前,我们必须先看看SCENIC转录因子分析的实例,多读文献,总归是没有错的!
生信技能树
2020/12/17
5.8K0
单细胞转录组实战06: pySCENIC转录因子分析(可视化)
![生信交流与合作请关注公众号@生信探索](https://files.mdnice.com/user/38387/a8e0a2ed-ea22-4f3f-924e-881260dd9a2e.png)
生信探索
2023/02/22
3.4K0
单细胞SCENIC简单可视化分析学习和整理
SCENIC教程中给出三个方法进行下游的可视化分析,分别可以选择网页(SCope)平台,R或者python进行分析。
凑齐六个字吧
2024/09/23
6530
单细胞SCENIC简单可视化分析学习和整理
使用pyscenic做转录因子分析
毕竟在文章《A scalable SCENIC workflow for single-cell gene regulatory network analysis》,有这个时间消耗对比,不服不行!
生信技能树
2021/07/29
11.8K1
单细胞转录组的3种常规数据分析思路
单细胞转录组早期有很多cns文章,但如今它已经是一个常规技术所以绝大部分实验设计就必然是“落入俗套”。那么这样的单细胞转录组项目也是有众所周知的常规数据分析策略啦,如果你不幸的继承了这样的“祖传”的单细胞转录组数据,也想简简单单发个文章而已,那么单细胞转录组的3种常规数据分析思路可能会对你有帮助啦。
生信技能树
2024/11/21
2440
单细胞转录组的3种常规数据分析思路
各个单细胞亚群特异性的转录因子热图
虽然转录因子分析作为单细胞转录组数据分析的3大高级分析之一名满天下,但是因为它太耗费计算资源导致绝大部分人敬而远之,我们其实也多次分享过细节教程:
生信技能树
2022/03/03
2.3K0
各个单细胞亚群特异性的转录因子热图
单细胞实战之亚细胞分群之CD4+T细胞分群——从入门到进阶(中级篇2)
上一讲在完成了从T/NK至CD4+T细胞流程实践后,在这一讲内容中我们将对CD4+T细胞进行亚群的细分。中级篇1最后的工程文件以及本次课程中会用到的一些文件:链接: https://pan.baidu.com/s/18_jO0y6_QyEtyzZJkmIp_Q 提取码: 27jw 。此外,可以向“生信技能树”公众号发送关键词‘单细胞’,直接获取Seurat V5版本的完整代码。
凑齐六个字吧
2025/03/23
6140
单细胞实战之亚细胞分群之CD4+T细胞分群——从入门到进阶(中级篇2)
单细胞个性化分析之转录因子篇
转录因子(Transcription Factors,TFs),是指能够以特定序列与基因专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。许多转录因子充当着主调节因子和选择基因的角色,控制着细胞类型的决定、发育模式和特定途径控制(如免疫反应)的过程。
追风少年i
2023/03/06
2.2K0
单细胞个性化分析之转录因子篇
基因是否具有单细胞亚群特异性居然是靠肉眼看
简单的扩充到配合几十种上百种组织器官单细胞公开数据,成百上千个数据挖掘思路就出来了,当然了做到这些需要的数据分析基础必不可少啦。
生信技能树
2023/09/04
2680
基因是否具有单细胞亚群特异性居然是靠肉眼看
SCENIC | 从单细胞数据推断基因调控网络和细胞类型
在2019/08/07的Nature刊中,中科院景乃禾课题组发表了文章——Molecular architecture of lineage allocation and tissue organization in early mouse embryo ,我在这篇文章中发现了一个被汤神组 (就是Hemberg-lab单细胞转录组数据分析(二)- 实验平台中开辟了单细胞转录组领域的人)反复用到的R工具-SCENIC,现在让我们来一起看看该工具有何妙用!
生信宝典
2019/12/02
5.5K0
单细胞各个亚群基因按照平均表达量排序后gsea分析
如果一定要做gsea或者gsva这样的给基因集合打分,也有几个补救措施,比如把单细胞表达量矩阵进行缺失值插补,或者把单细胞表达量矩阵构建成为metacell矩阵。不过,最简单的方法是把单细胞表达量矩阵按照各个亚群来进行表达量平均,我们以大家熟知的pbmc3k数据集为例,大家先安装这个数据集对应的包 SeuratData,并且对它进行降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释 ,而且每个亚群找高表达量基因,都存储为Rdata文件。标准代码是:
生信技能树
2023/02/28
1.3K0
单细胞各个亚群基因按照平均表达量排序后gsea分析
单细胞转录组高级分析二:转录调控网络分析
组织内细胞异质性的基础是细胞转录状态的差异,转录状态的特异性又是由转录因子主导的基因调控网络(GRNs)决定并维持稳定的。因此分析单细胞的GRNs有助于深入挖掘细胞异质性背后的生物学意义,并为疾病的诊断、治疗以及发育分化的研究提供有价值的线索。然而单细胞转录组数据具有背景噪音高、基因检出率低和表达矩阵稀疏性的特点,给传统统计学和生物信息学方法推断高质量的GRNs带来了挑战。Single-cell regulatory network inference and clustering (SCENIC)是一种专为单细胞数据开发的GRNs算法,它的创新之处在于引入了转录因子motif序列验证统计学方法推断的基因共表达网络,从而识别高可靠性的由转录因子主导的GRNs。SCENIC相关的文章2017年首先发表于nature methods,2020年又将流程整理后发表于nature protocls。需要深入了解分析原理和流程的朋友可以参考这两篇文章:
生信技能树jimmy
2020/09/04
18.2K3
单细胞转录组高级分析二:转录调控网络分析
能发CNS的单细胞转录组三大高阶分析
单细胞数据处理也是如此,在单细胞领域近5年超一千个软件工具算法被开发,详见近期Genome Biology (2021) 杂志的一个文章:《Over 1000 tools reveal trends in the single- cell RNA-seq analysis landscape》系统性的梳理了2016-2021这5年间,位于https://www.scrna-tools.org/网页的超一千个软件工具算法。
生信技能树
2023/09/04
4530
能发CNS的单细胞转录组三大高阶分析
单细胞GSVA分析专用R包
之前我们介绍过irGSEA:基于秩次的单细胞基因集富集分析整合框架,针对17种常见的Functional Class Scoring (FCS)方法进行了benchmark,感兴趣的可以仔细读一下。最近恰好看到了密西根大学的Research Assistant Professor Neurology的Kai Guo的github也有一个打分工具:https://github.com/guokai8/scGSVA ,也值得介绍一下:
生信技能树
2024/11/21
3560
单细胞GSVA分析专用R包
各种肺上皮单细胞亚群的处理前后差异
可以看到是4个分组,野生型和突变型的两种小鼠,各种都是疾病模型与对照的两个样品,都没有生物学重复,所以四个分组就是四个样品啦。跟我们在2021的尾巴在《生信技能树》和《单细胞天地》等公众号推出来的10X单细胞转录组钜惠套餐,详见:2个分组的单细胞项目标准分析,原价15~20万的6个10x单细胞转录组套餐,现价10万,比较类似。
生信技能树jimmy
2022/03/14
8340
各种肺上皮单细胞亚群的处理前后差异
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
拿到了一个单细胞表达量矩阵,默认需要进行: 单细胞聚类分群注释 ,如果你对单细胞数据分析还没有基础认知,可以看基础10讲:
生信技能树
2022/12/16
1.4K0
单细胞各个亚群特异性高表达基因的数据库注释(包括GO,KEGG,ReactomePA)
速度上吊打FindAllMarkers的单细胞亚群特异性高表达基因查询算法
但是, 最开始我们得到几十个单细胞亚群的时候,就需要对每个亚群找一下各自的单细胞亚群特异性高表达基因,通常是使用Seurat包的FindAllMarkers函数,这个函数的帮助文档写的是:Finds markers (differentially expressed genes) for each of the identity classes in a dataset ,默认使用 Wilcoxon Rank Sum test (default) 方法。
生信技能树
2022/06/08
7.5K0
速度上吊打FindAllMarkers的单细胞亚群特异性高表达基因查询算法
推荐阅读
相关推荐
Python版SCENIC转录因子分析(四)一文就够了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验