Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >单细胞基因集打分方法——AUCell

单细胞基因集打分方法——AUCell

作者头像
生信菜鸟团
发布于 2023-10-16 03:09:57
发布于 2023-10-16 03:09:57
2.3K00
代码可运行
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团
运行总次数:0
代码可运行

❝继续之前关于对单细胞数据进行基因集打分的推文更新,今天选择用AUCell,一个大家很常用的R包。 对之前做过降维聚类分群的数据进行分析。 ❞

导入数据
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rm(list=ls())
library(Seurat)
library(ggplot2)
library(dplyr)
library(clusterProfiler)
library(org.Hs.eg.db)
library(stringr)
library(msigdbr)

getwd()
#setwd("./3-cell")  
load("sce.all_by_celltype.Rdata")

#取文章中列出的marker gene
paper<-"ALB,SERPINA1,HNF4A,EPCAM,CD3D,CD3E,NKG7,CD68,CD14,CD163,
CD1C,CLEC4C,KIT, IGHG1,JCHAIN,CD79A,VWF,PECAM1,
FCGR2B,ACTA2,COL1A1,COL1A2"
papermarker<-str_to_upper(trimws(strsplit(paper,',')[[1]]))
papermarker
设置合适的基因集
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 将基因转为list 
features <- list(papermarker)
#直接使用文件中基因向量,并转为list形式
homo_KEGG = msigdbr(species = "Homo sapiens",
                    category = "C2",
                    subcategory = "KEGG") %>% dplyr::select(gs_name,gene_symbol)#这里可以选择gene symbol,也可以选择ID
#基因集是list
homo_KEGG_gene = homo_KEGG %>% split(x =.$gene_symbol, f =.$gs_name)
AUCell打分
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
###本地安装AUCell包###
#github包:https://github.com/aertslab/AUCell
devtools::install("../AUCell-master/")
library(AUCell)
#cells_AUC <- AUCell_run(sce.all@assays$RNA@data, geneSets)
cells_rankings <- AUCell_buildRankings(sce.all@assays$RNA@data,splitByBlocks=TRUE) 
cells_rankings
cells_AUC <- AUCell_calcAUC(homo_KEGG_gene, cells_rankings, 
                            aucMaxRank=nrow(cells_rankings)*0.1)
cells_AUC
#提取P53 Pathway
homo_KEGG_gene$KEGG_P53_SIGNALING_PATHWAY
geneSet <- "KEGG_P53_SIGNALING_PATHWAY"
AUCell_auc <- as.numeric(getAUC(cells_AUC)[geneSet, ])
AUCell_auc
#添加至metadata中
sce.all$AUCell <- AUCell_auc
head(sce.all@meta.data)

「对于可视化部分,小提琴图,tSNE图或者umap图都可以展示出来AUCell打分得出的值。」

一些细节的解释:
  • 在安装AUCell R包的时候,遇到了一个报错,查了一下发现是:

如果直接用 BiocManager::install("AUCell")来安装,AUCell包的版本不够新了,所以推荐本地安装。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cells_rankings <- AUCell_buildRankings(sce.all@assays$RNA@data,splitByBlocks=TRUE) 
#Error in AUCell_buildRankings(sce.all@assays$RNA@data, splitByBlocks = TRUE) : 
 # could not find function "AUCell_buildRankings"
  • 「cells_rankings」

是对每个细胞里面的基因都排序了,其中 Top-left corner of the ranking,而且还计算了Quantiles for the number of genes detected by cell

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cells_rankings
# Ranking for 24590 genes (rows) and 69997 cells (columns).
# 
# Top-left corner of the ranking:
#   cells
# genes           HCC01T_AAACCTGAGGGCATGT HCC01T_AAACCTGAGTCGCCGT
# RP11-34P13.7                    23497                   19215
# FO538757.2                       8795                   20627
# AP006222.2                       1598                    2164
# RP4-669L17.10                   18808                    6330
# RP5-857K21.4                     3508                   17640
# RP11-206L10.9                   19009                   18844
# cells
# genes           HCC01T_AAACCTGGTCACACGC HCC01T_AAACCTGTCCAGTATG
# RP11-34P13.7                    17115                   22521
# FO538757.2                      10350                   11762
# AP006222.2                      16968                   12078
# RP4-669L17.10                   16280                   16136
# RP5-857K21.4                     4398                    8877
# RP11-206L10.9                   22727                   17715
# cells
# genes           HCC01T_AAACGGGTCGCTTGTC
# RP11-34P13.7                     2166
# FO538757.2                      12879
# AP006222.2                      16149
# RP4-669L17.10                   16618
# RP5-857K21.4                    20486
# RP11-206L10.9                   21591
  • 对于「AUC」计算,考虑表达矩阵的top10%的基因,这个案例里面的是24590 个基因的表达矩阵,所以需要考虑2459个基因。我这个设置的比例有点高了,所以代码运行时间会比较长,对于基因较多的表达矩阵可以灵活减少,可以设置top5%的基因。还是结合自身数据来做这个分析。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cells_AUC <- AUCell_calcAUC(homo_KEGG_gene, cells_rankings, 
                            aucMaxRank=nrow(cells_rankings)*0.1)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分,可视化
有了基因集文件除了做scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?GSVA分析,还可以计算每个细胞的目标基因集评分 。
生信补给站
2023/08/25
17.3K0
scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分,可视化
AddModuleScore 对单细胞基因集打分及可视化
在此选择的pathway通路及基因集(基于文章给出的部分基因)是我自己选用,并没有特别的生物学意义,只是做一下可视化展示。
生信菜鸟团
2023/10/07
3.7K0
AddModuleScore 对单细胞基因集打分及可视化
单细胞实战之pseudobulks分析,GSVA富集分析——入门到进阶(初级篇3)
我们在上一讲内容中学习了“矫正”数据的三个工具~ 分别为细胞周期矫正,去除双胞体和RNA污染。接下来我们再来学习一下pseudobulks分析、GSVA富集分析。初级篇2最后得到的工程文件通过网盘分享:初级篇2 链接: https://pan.baidu.com/s/1ETVEkJNCJSe9NU7_aLEPVA 提取码: znmb
凑齐六个字吧
2025/02/14
1110
单细胞实战之pseudobulks分析,GSVA富集分析——入门到进阶(初级篇3)
为什么绝大部分单细胞转录组教程都是Read10X读取3个文件
其中最常见的就是使用Read10X读取3个文件,但是Read10X读取3个文件还得注意版本,而且必须保证3个文件名字完全一样,要么是
生信技能树jimmy
2023/08/31
4170
为什么绝大部分单细胞转录组教程都是Read10X读取3个文件
AUCell | 识别单细胞对“基因集”的响应
AUCell可以识别sc-RNA数据中具有活跃基因集或基因模块的细胞,即可以将某个通路的富集情况展现在聚类的细胞上,从而可以鉴定具有特定基因特征的细胞群。 AUCell使用“Area Under the Curve”(AUC)来计算输入基因集的关键子集是否在每个细胞内富集。AUC分数在所有细胞中的分布允许探索基因的相对表达。由于计分方法是基于排名的,因此AUCell不受基因表达单位和标准化程序的影响。此外,由于对细胞进行了单独评估,因此可以轻松地将其应用于更大的数据集,并可以根据需要对表达式矩阵进行分组。
生信编程日常
2020/08/24
3.6K0
AUCell | 识别单细胞对“基因集”的响应
单细胞转录因子分析之SCENIC流程
SCENIC (Single-Cell rEgulatory Network Inference and Clustering) is a computational method to infer Gene Regulatory Networks and cell types from single-cell RNA-seq data. 官网教程非常清晰:
生信技能树
2021/01/06
9.7K2
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
是比较自动化的AUCell包的算法 ,很多小伙伴后台提问说具体该如何操作呢,代码层面是否有分享,毕竟我们仅仅是在 :这近100种单细胞亚群的2348个标记基因好用吗,截图了文章里面的method描述而已。
生信技能树
2023/09/04
7030
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
AUCell:在单细胞转录组中识别细胞对“基因集”的响应
使用AUCell识别单细胞rna数据中具有活性“基因集”(i.e. gene signatures)的细胞。AUCell使用“曲线下面积”(Area Under the Curve,AUC)来计算输入基因集的一个关键子集是否在每个细胞的表达基因中富集。AUC分数在所有细胞的分布允许探索signatures的相对表达。
生信技能树jimmy
2020/10/19
3.9K0
AUCell:在单细胞转录组中识别细胞对“基因集”的响应
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
单细胞数据完成差异分析后,可以根据结果进行后续的GO ,KEGG,GSEA富集分析,推荐使用clusterProfiler-R包,可参考 R|clusterProfiler-富集分析 clusterProfiler|GSEA富集分析及可视化 。
生信补给站
2023/08/25
2K0
scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?
单细胞scMetabolism代谢相关通路分析学习和整理
内置了KEGG_metabolism_nc和REACTOME_metabolism两个库的代谢通路信息。
凑齐六个字吧
2024/10/02
4450
单细胞scMetabolism代谢相关通路分析学习和整理
实战出真知——单细胞基础流程
我们选择的数据已经发表的文章题目是“Single cell RNA sequencing of human liver reveals distinct intrahepatic macrophage populations”,2018年发表在nature communications上,数据存在GSE115469。
生信技能树jimmy
2020/12/11
1.9K0
实战出真知——单细胞基础流程
差异分析及可视化
在分群结果可以看到,CD8+主要分成了两群,一个是红色的(170个CD8+ cytotoxic T cells,即细胞毒性T细胞),一个是浅蓝色的(429个CD8+ effector T cells,即效应T细胞)
生信技能树jimmy
2020/03/30
1.4K0
常见不同单细胞类型数据读取及Seurat对象创建方法整理(单多样本/10X/h5/txt/csv/tsv)
需要把barcodes, features, matrix三个文件放入同一个文件夹中,这三个文件构成一个样本数据。
凑齐六个字吧
2024/09/06
2720
常见不同单细胞类型数据读取及Seurat对象创建方法整理(单多样本/10X/h5/txt/csv/tsv)
Seurat4.0系列教程3:合并数据集
在此,我们将合并两个 10X PBMC 数据集:一个包含 4K 细胞,一个包含 8K 细胞。数据集可以在这里[1]找到。
生信技能树jimmy
2021/07/02
8K0
Seurat4.0系列教程3:合并数据集
单细胞——从降维聚类分群、细胞命名、到批量富集分析,一文打通GSE104154博来霉素小鼠模型单细胞数据
注意:这个数据使用了ensemble id作为基因名,后续需要换为gene symbol
生信菜鸟团
2023/09/09
3.5K0
单细胞——从降维聚类分群、细胞命名、到批量富集分析,一文打通GSE104154博来霉素小鼠模型单细胞数据
scRNA|ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化
使用之前注释过的sce.anno.RData数据 ,后台回复 anno 即可获取
生信补给站
2023/09/26
1.9K1
scRNA|ComplexHeatmap自定义单细胞转录组celltype-level 热图可视化
用V5版本Seurat做单细胞数据文献复现
V5和V4的代码区别主要在前期导入数据和其中的数据有些许改变,曾老师在之前的几篇推文还有直播中都有提到。
生信菜鸟团
2024/01/19
3.2K0
用V5版本Seurat做单细胞数据文献复现
假如审稿人让你把单细胞数据挖掘代码上传到github
而且不得不说,github在生物信息学领域的重要性,之前我们介绍过代码海洋,详见:《代码海洋-你想模仿的这里都有啊》,也有专门的github收集整理的更加齐全,而且还分门别类整理好了,详见:https://github.com/genecell/single-cell-papers-with-code
生信技能树jimmy
2023/08/31
3340
假如审稿人让你把单细胞数据挖掘代码上传到github
条条道路通罗马—单细胞分群分析
之前在 差异分析及可视化 中使用monocle的plot_cell_clusters函数画出了PBMC的第4和第10群两种不同T细胞的差异。那么这个分析一定要用包装好的R包吗?不是的,即使不使用别人做的R包,自己也能利用作图原理画出来
生信技能树jimmy
2020/03/30
1.5K0
OSCA单细胞数据分析笔记11—Cell type annotation
“物以类聚”的类是什么类?比如将一群水果分为不同的类群,则又红又圆特征的可能是苹果。对于单细胞聚类的结果,类的最直接注释就是细胞类型。本节将学习单细胞数据分析过程中注释细胞类型的三种思路。
生信技能树jimmy
2021/07/02
2.1K0
OSCA单细胞数据分析笔记11—Cell type annotation
推荐阅读
相关推荐
scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分,可视化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验