Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >单细胞day3

单细胞day3

原创
作者头像
用户10300557
发布于 2024-06-19 15:28:15
发布于 2024-06-19 15:28:15
2270
举报
文章被收录于专栏:生信学习111生信学习111

1 加载数据

还是放在原来的文件夹下没有动

代码语言:R
AI代码解释
复制
load("obj.Rdata") #载入数据
> p1 = DimPlot(seu.obj,reduction = "umap",label = T)
> p1
> rm(list = ls()) #清空列表区域省的乱
> library(Seurat)#加载这个Seurat这个包
> load("obj.Rdata") #载入数据
> p1 = DimPlot(seu.obj,reduction = "umap",label = T) #昨天画图的口令,有一个label = true
> p1

这张图的每一个点都是一个细胞,同一个颜色的点被认为时一类细胞,那末到底是什么细胞呢,可以通过marker基因进行分析。

2marker 基因

可以把marker基因理解为特征基因,特征基因在某一类细胞中表达量比较高,在其它类细胞中表达量低。

理论上,上调和下调都算marker基因,但我们会设置 only.pos = TRUE,只关注表达量变高的。

FindAllMarkers,又是一个限速步骤,随着细胞数量的增大会更慢,它会计算出所有细胞簇的marker基因,比如计算0这一簇时,就是0 vs 剩下的1-10,1-10全部算一个组。我理解的就是找某一类和其他剩余类别的不同,工作量不小。

还有一个参数min.pct,min.pct = 0.25的意思是,以0簇为例,就是说要么在0这一簇里25%以上的细胞中表达,要么在剩下的全部簇里25%以上的细胞中表达。这样可以去掉一些表达比例太少(就是表达占比不高)的基因,比例太少的话不能代表这个簇的整体情况,其实很好理解就是你这个在这个群体里占比比较高才可以说你是marker基因。

Seurat开发了一个新的方法加快FindAllMarkers的计算速度,在初次运行时它会给出提示让你安装这个包,我的给了提示证明我并没有安装过,可以安装一下来提提速

(没有提示就说明已经安装过啦)。

2.1 R语言知识补充github的R包安装

有一些包你可能特别想用,但是不在各种管理网站上,而是放在开发者的github仓库里。这样的R包也是可以安装和使用的。

两种安装方法

1 在线安装,注意安装的时presto这个包

代码语言:R
AI代码解释
复制
if(!require(devtools))install.packages("devtools")
if(!require(presto))devtools::install_github("immunogenomics/presto",upgrade = F,dependencies = T)

2 本地下载一下

在github网站下载压缩包放在工作目录下,然后运行这个口令,这样安装可能会有一些依赖包安不上,那还得在进行安装,注意看报错

代码语言:R
AI代码解释
复制
if(!require(presto))devtools::install_github("presto-master.zip",upgrade = F,dependencies = T)

2.2 取每个细胞簇logFC排名前n的marker基因。logFC用于衡量两个样本或条件下基因表达水平的相对变化

代码语言:R
AI代码解释
复制
> mks = markers %>% group_by(cluster) %>% top_n(n = 2, wt = avg_log2FC)
> g = unique(mks$gene)

n=2就是每个簇取前2,这个可以自己设置,看情况吧,然后为什么要g = unique(mks$gene)这个呢,因为可能有些基因在不同簇中都被记为marker基因,有重复会报错,因此需要去除一下。

3可视化

3.1 热图

代码语言:R
AI代码解释
复制
> library(ggplot2)
> DoHeatmap(seu.obj, features = g) + NoLegend()+
+   scale_fill_gradientn(colors = c("#2fa1dd", "green","#f87669"))
Scale for fill is already present.
Adding another scale for fill, which will replace the existing scale.
热图的一行是一个基因,一列是一个细胞(按簇排列),红色代表高表达。
热图的一行是一个基因,一列是一个细胞(按簇排列),红色代表高表达。

3.2 气泡图

代码语言:R
AI代码解释
复制
 DotPlot(seu.obj, features = g,cols = "RdYlBu") +
  RotatedAxis()
红色代表高表达,气泡的大小代表基因在某一簇里的表达比例
红色代表高表达,气泡的大小代表基因在某一簇里的表达比例

3.3 小提琴图,每一个基因都会有一个小提琴,所以少画点

代码语言:R
AI代码解释
复制
VlnPlot(seu.obj, features = g[1:6]) #提取了前六个
这个容易看懂
这个容易看懂

3.4 Featureplot,本质上还是umap图,只是换了一种着色方式,一张图对应一个基因,展示了该基因在所有细胞里的表达情况。

3.5 峰峦图,峰峦图,或者是山脊图,其实就是密度图

代码语言:R
AI代码解释
复制
RidgePlot(seu.obj, features = g[1:2])
横坐标是基因表达量,最多的其实还是0,这种图用的比较少
横坐标是基因表达量,最多的其实还是0,这种图用的比较少

4 注释亚群

手动注释很复杂,手动注释需要自行查找每种可能的细胞类型已知的marker基因,可以从文献里查,可以从数据库里查,真的很复杂得自己看,还是自动注释把,自动注释也有问题:没有把组织、疾病类型等背景知识考虑在内 > 现成的参考数据只有人类和小鼠的 > 切换不同的参考数据就会给出不同的注释结果

4.2自动注释

常用的自动注释R包是singleR,使用的参考数据是celldex里面的

花花老师的有7个,但是我有15个很奇怪。解密了是更新啦

代码语言:R
AI代码解释
复制
library(celldex)
library(SingleR)
ls("package:celldex")
z = "ref_Human_all.RData" #花花老师用的是f = "ref_BlueprintEncode.RData"
if(!file.exists(z)){
  ref <- celldex::ref_Human_allData() #上面用啥这块改啥保留RData前面的内容,放在Data前面
  save(ref,file = z)
}
ref <- get(load(z))
library(BiocParallel)
library(SingleR) #报错显示没找到,得加载一下
scRNA = seu.obj
test = scRNA@assays$RNA$data
pred.scRNA <- SingleR(test = test, 
                      ref = ref,
                      labels = ref$label.main, 
                      clusters = scRNA@active.ident)
pred.scRNA$pruned.labels #看一下分类
new.cluster.ids <- pred.scRNA$pruned.labels
names(new.cluster.ids) <- levels(scRNA)
library(Seurat) #"RenameIdents"是Seurat里面的
scRNA <- RenameIdents(scRNA,new.cluster.ids)
p3 <- DimPlot(scRNA, reduction = "umap",label = T,pt.size = 0.5) + NoLegend()
p3 #没操作手动注释的所以没有p2

跟花花老师的不一样是因为我用了不同的参考数据集。yeah.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
单细胞测序—GSE218208(流程简化)
上一篇帖子学习记录了Seurat官方给出的分析流程单细胞测序—基础分析流程,本篇文章以GSE218208为例,记录下实际的单细胞分析流程,更为简便,其与官方给出的流程略有不同。
sheldor没耳朵
2024/07/30
3390
单细胞测序—GSE218208(流程简化)
单细胞多样本整合之harmony(seurat v5)
多样本整合这回事,其实有很多中方法,seurat5可以用一个参数支持5种整合算法。 Anchor-based CCA integration (method=CCAIntegration) Anchor-based RPCA integration (method=RPCAIntegration) Harmony (method=HarmonyIntegration) FastMNN (method= FastMNNIntegration) scVI (method=scVIIntegration)
用户11414625
2024/12/20
1.1K0
单细胞多样本整合之harmony(seurat v5)
​单细胞专题 | 8.单细胞类型注释之SingleR包详解
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 单细胞专题 | 7.单细胞下游分析——常规分析流程案例一
DoubleHelix
2022/12/16
9.9K0
​单细胞专题 | 8.单细胞类型注释之SingleR包详解
单细胞学习小组第二天
抽样数据出图:这个图和教程有出入,因为我用的Seurat版本是V4的,暂时有个项目需要V4版本的,所以没有更新。
用户11167001
2024/06/18
1230
单细胞多样本整合之CCA(Seuratv5)
看到一篇单细胞数据挖掘的文章,题为:Establishment of a Prognostic Model of Lung Adenocarcinoma Based on Tumor Heterogeneity
用户11414625
2024/12/20
2490
单细胞多样本整合之CCA(Seuratv5)
day9 二次分群和细胞周期
如果是大多数点都集中在0点附近的,就可以不用去除细胞周期的影响!,分布范围较广或者是有较多的离群值那就需要要去除。
昆兰
2024/07/01
1340
单细胞学习小组003期 Day6
The content of today is marker gene and and cell annotation.
用户11153857
2024/07/04
1420
单细胞数据的二次分群
Seurat里的FindClusters函数设置的resolution数值越大,分群的数量就越多,但是当单细胞数量太多的时候,会遇到resolution再变大,分群的数量也不再增加的情况。一次分群分不开时就会需要二次分群。
生信技能树
2024/07/05
2570
单细胞数据的二次分群
GSVA和细胞通讯
教程:https://htmlpreview.github.io/?https://github.com/jinworks/CellChat/blob/master/tutorial/CellChat-vignette.html #再次感叹生信真牛
用户10300557
2024/06/27
2580
SingleR单细胞亚群注释工具学习
SingleR 是一种用于单细胞 RNA 测序(scRNA-seq)数据分析的自动注释工具。它的主要功能是基于参考数据集为未注释的单细胞数据进行细胞类型注释。SingleR 使用了来自已知细胞类型的参考数据集(如公共的参考表达谱数据库)来推断新样本中每个细胞的类型。
凑齐六个字吧
2024/09/03
3400
SingleR单细胞亚群注释工具学习
单细胞测序—基础分析流程
参考官方文档:https://satijalab.org/seurat/articles/pbmc3k_tutorial
sheldor没耳朵
2024/07/30
1.1K0
单细胞测序—基础分析流程
单细胞学习第四天
2 多样本的整合,使用harmony,它需要的计算资源少,且准确程度高,是最受欢迎的方法。
用户11167001
2024/06/20
1990
单细胞转录组|单细胞数据分析中细胞类型的智能识别与注释
前面的文章我们介绍过单细胞基于python手动注释的方法,本篇基于Seurat学习自动注释和手动注释。
天意生信云
2025/03/06
3120
单细胞转录组|单细胞数据分析中细胞类型的智能识别与注释
单细胞数据分析1
代码:https://satijalab.org/seurat/v3.0/pbmc3k_tutorial.html
Erics blog
2023/10/15
6280
单细胞亚群鉴定
细胞亚群鉴定是进行单细胞转录组分析的最基础一步,是赋予细胞数据以生物学意义的关键过程。细胞亚群鉴定主要借助 marker 基因在各个细胞亚群的表达情况来判断细胞亚群所属细胞类型。
生信喵实验柴
2022/10/25
2.3K0
单细胞亚群鉴定
单细胞数据分析2(练习GSE218208)
Erics blog
2023/10/15
5360
单细胞数据分析3(单细胞数据自动注释)
Erics blog
2023/10/15
4540
单细胞降维聚类分群注释全流程学习(seruat5/harmony)
https://mp.weixin.qq.com/s/drmfwJgbFsFCtoaMsMGaUA
凑齐六个字吧
2024/09/07
3550
单细胞降维聚类分群注释全流程学习(seruat5/harmony)
单细胞二次分群和细胞周期
细胞的有丝分裂,分为分裂期(M)和分裂间期(G1,S,G2),细胞处于不同的细胞周期时,代谢活跃状态和染色体的状态大不相同,所以在不同周期表达量是有差异的
用户10300557
2024/06/26
1560
单细胞组间比较分析
这篇文章介绍的是有分组的单细胞数据怎样分析,数据来自GEO的GSE231920,有3个treat,3个control样本,代码完整,可以自行下载数据跑一跑,但请注意细胞数量是6w,对计算资源要求较高,自己的电脑跑不动,需要在服务器上跑。
生信技能树
2024/07/05
3000
单细胞组间比较分析
相关推荐
单细胞测序—GSE218208(流程简化)
更多 >
LV.0
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档