Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >系统比较Seurat和scanpy版本之间、软件之间的分析差异

系统比较Seurat和scanpy版本之间、软件之间的分析差异

原创
作者头像
追风少年i
发布于 2024-04-22 08:28:54
发布于 2024-04-22 08:28:54
5680
举报

作者,Evil Genius

标准的单细胞rna测序分析(scRNA-seq)工作流程软件括通过序列排列将原始读取数据转换为细胞基因计数矩阵,然后进行过滤、高变量基因选择、降维、聚类和差异表达分析等分析。Seurat和Scanpy是实现这种工作流的最广泛使用的软件,通常被认为是实现类似的单个步骤。

下面我们就需要比较一下软件之间、以及不同版本之间的数据分析差异。

单细胞rna测序(scRNA-seq)是一种强大的实验方法,为基因表达分析提供细胞分辨率。随着scRNA-seq技术的广泛应用,分析scRNA-seq数据的方法也越来越多。然而,尽管已经开发了大量的工具,但大多数scRNA-seq分析都是在两种分析平台之一进行的:Seurat或Scanpy。表面上,这些程序被认为实现了分析相同或非常相似的工作流程:scRNA-seq结果计算分析的第一步是将原始读取数据转换为细胞基因计数矩阵X,其中输入Xig是细胞i表达的基因g的RNA转录本的数量。通常,细胞和基因被过滤以去除质量差的细胞和最低表达的基因。然后,将数据归一化以控制无意义的可变性来源,如测序深度、技术噪声、库大小和批处理效果。然后从归一化数据中选择高度可变基因(hvg)来识别感兴趣的潜在基因并降低数据的维数。随后,基因表达值被缩放到跨细胞的平均值为0,方差为1**。这种缩放主要是为了能够应用主成分分析(PCA)来进一步降低维数,并提供有意义的嵌入来描述细胞之间的可变性来源。然后通过k近邻(KNN)算法传递细胞的PCA嵌入,以便根据细胞的基因表达描述细胞之间的关系。KNN图用于生成无向共享最近邻(SNN)图以供进一步分析,最近邻图被传递到聚类算法中,将相似的单元分组在一起。图(s)也用于进一步的非线性降维,使用t-SNE或UMAP在二维中图形化地描绘这些数据结构。最后,通过差异表达(DE)分析鉴定cluster特异性marker基因,其中每个基因的表达在每个cluster与所有其他cluster之间进行比较,并通过倍比变化和p值进行量化。

Seurat是2015年用R语言编写的,在生物信息学领域特别受欢迎;它是第一个全面的scRNA-seq分析平台之一。Scanpy是2017年继Seurat之后开发的一个基于python的工具,提供了一组类似的特性和功能。这两个工具都有广泛的运用。Seurat和Scanpy之间的选择通常归结为用户的编程偏好和他们的scRNA-seq数据分析项目的具体要求。

 pipeline
pipeline

Seurat和Scanpy的输入由一个基因计数矩阵组成,通常是cellranger生成的矩阵。

一个“标准的”scRNA-seq实验需要花费数千美元,具体价格在很大程度上受数据大小的影响。虽然由于不同方法之间的差异,很难提供确切的成本,但据估计,一个典型的测序试剂盒的成本大约在数百到数千美元之间,测序成本每百万次读取5美元。对于高质量数据,每个cell的必要读取次数取决于实验的背景,但作为一个例子,cell Ranger通常建议其v3技术每个cell 20,000对reads,其v2技术每个cell 50,000对reads。样品制备也有很大的成本,通常需要宝贵的患者样本,或维持细胞或动物系数月至数年,为实验分析做准备。一个标准的10x Genomics scRNA-seq实验序列数千万到数十亿的reads,根据环境的不同,推荐的细胞计数范围为500-10k+。这些估计没有考虑额外的成本,包括人工、实验设置和后续分析。

生物信息学数据分析中一个典型的隐含假设是,软件和版本之间的选择应该对结果的解释几乎没有影响。然而,在软件或版本之间观察到相当大的可变性,即使在执行其他类似或看似相同的分析时也是如此。这里研究的目的是量化标准scRNA-seq pipeline在软件之间(即,Seurat与Scanpy)和同一软件的多个版本之间(即,Seurat v5与v4, Scanpy v1.9与v1.4, Cell Ranger v7与v6)的变异性。

Seurat和Scanpy在默认的scnaseq工作流中显示出相当大的差异

下图显示了使用PBMC 10k数据集与默认设置比较Seurat v5.0.2和Scanpy v1.9.5的结果,展示了“标准”单细胞RNA-seq工作流的两种实现之间的典型可变性。

在筛选UMIs、细胞最小基因数、基因最小细胞数和最大线粒体基因含量后,不同软件之间的细胞或基因过滤没有差异。此外,给定相同的矩阵作为输入,Seurat和Scanpy也以相同的方式处理日志规范化,产生等效的输出。然而,HVG选择的默认算法产生了差异,Jaccard index(两组之间差异基因的交集/并集)为0.22。This difference could be resolved either by selecting the “seurat v3” flavor for Scanpy or the “mean.var.plot” algorithm for Seurat。

PCA分析开始观察到更多的差异,使用默认参数运行时也会产生不同的结果。PCA图显示PC1-2空间中每个细胞的绘制位置存在明显差异,尽管图的大致形状保持不变。Scree图也显示出差异,最明显的是第一个PC解释的方差比例相差0.1。PCA的变化都可以通过HVG设置标准化来解决,并相应地调整PCA。

接下来,这些软件在SNN图的生成上有很大的不同。每个细胞的每个邻域的内容和大小都有很大差异。Seurat和Scanpy的每个细胞邻域间的Jaccard指数中位数为0.11,median degree ratio(Seurat/Scanpy)量级为2.05。每个函数的degree ratio几乎总是大于1,这表明Seurat在默认情况下比Scanpy给出更多的高连接SNN图。考虑到SNN图的点在所有degree ratio中相对均匀地分布在0和最大潜在Jaccard指数之间,似乎不是简单的度差驱动低平均Jaccard指数。在生成SNN图时对函数参数进行对齐,degree ratio没有质的提高,但中位Jaccard指数有轻微的提高。

使用默认设置的聚类也会导致输出的差异,即使在调整函数参数和输入SNN图时,Seurat和Scanpy也证明了Louvain聚类的差异,但在Leiden算法的实现中是相同的

UMAP图在视觉上显示了局部和邻近cluster形状的一些差异,即使在控制全局移动或旋转的情况下。比较由这些UMAP数据构建的KNN图的邻域相似性,发现邻域重叠较差,随着函数参数和先前输入之间的相似性对齐,邻域重叠会适度改善。对这些由UMAP导出的KNN图进行Leiden聚类和随后的UMAP绘图,发现软件之间的UMAP绘图的一般特征保持不变,但仍然存在一些相当大的不可调和的差异。

在DE分析中,Seurat和Scanpy的显著性差异基因的Jaccard指数重合为0.62(即,所有聚类的基因总数调整后p值< 0.05),但Seurat的显著性marker基因比Scanpy多约50%。显著marker基因的差异是软件间默认设置的一些差异的结果。首先,每个软件分别实现Wilcoxon功能,Seurat需要tie校正,而Scanpy默认情况下省略tie校正。此外,每个软件在默认情况下调整p值不同- Seurat与Bonferroni multiple testing correction,而Scanpy与Benjamini-Hochberg多重测试校正。最后,Seurat在默认情况下,在执行Wilcoxon秩和检验之前,通过p值、每组拥有该基因的细胞百分比和对数倍变化(logFC)过滤marker;Scanpy在不调用其他函数的情况下不会执行这种类型的过滤。将Scanpy的过滤参数和聚类设置为与Seurat相同(filter:tie-correction, Bonferroni correction)进行DE分析,将marker基因重叠的Jaccard指数提高到0.73,提供相同的聚类分配进一步将Jaccard指数提高到0.99。其余1%的基因由于logFC计算的差异而存在差异。将方法设置为类似于Scanpy(没有过滤,Benjamini-Hochberg),使Jaccard指数恶化到0.38,因为无法去掉Seurat中的tie校正。

当对齐cluster信息时,可以执行进一步的DE分析,比较每个cluster中每个基因的表达水平差异。除了比较所有聚类中显著marker基因的外,还可以比较marker之间的相似性(即DE分析后每个聚类的基因)。Scanpy缺乏过滤意味着Scanpy包括所有cluster中的所有基因,即使该基因在该cluster中表达最少或无差异;而Seurat,默认情况下,根据logFC, p值和reference中表达基因的细胞数量,每个cluster只包含很小比例的基因。对Scanpy应用类似的阈值处理大大减少了这个问题,由于Scanpy缺少过滤,它将Jaccard指数从0.22提高到0.92。然而,这仍然不能完全调整差异。

Seurat和Scanpy计算logFC的方式也不同。比较各组间相似基因的一致性相关系数(CCC)为0.98,PCA拟合线斜率为1,表明各组间具有较强的相关性。简而言之,CCC衡量两个变量在相关性和方差方面的一致性。然而,通过观察logFC值的散点图,可以发现大量值之间存在显著差异。具体来说,在少数情况下(135185个marker中的4109个),Scanpy预测cluster中某个基因的logFC接近±30,而Seurat预测的logFC接近0。

在调整后的p值方面,Seurat和Scanpy之间也存在差异。对于默认的函数参数,Seurat预测的p值要么小于或类似于Scanpy,但不会大得多。大多数p值接近最大值1,但存在很大程度的变异性。相当多的p值远离y=x线,包括Seurat低于1e-50但Scanpy接近1的差异基因。20%的差异基因在软件之间的p值在p=0.05阈值上翻转,并且在两个方向上翻转相当均匀(即仅在Seurat中显著,或仅在Scanpy中显著)。当函数参数像Seurat一样对齐时,几乎所有调整后p值的差异都消失了。然而,由于在Seurat /presto的Wilcoxon秩和计算中缺乏切换校正的能力,这些差异无法与类似scanpy的函数参数相协调。

 Seurat and Scanpy show considerable differences in scRNA-seq workflow results with default function arguments
Seurat and Scanpy show considerable differences in scRNA-seq workflow results with default function arguments

 Seurat vs. Scanpy, aligned function arguments (Seurat-like),sequential analysis.
Seurat vs. Scanpy, aligned function arguments (Seurat-like),sequential analysis.

 Seurat vs. Scanpy, default function arguments, controlled analysis
Seurat vs. Scanpy, default function arguments, controlled analysis

 Seurat vs. Scanpy, aligned function arguments (Seurat-like), controlled analysis
Seurat vs. Scanpy, aligned function arguments (Seurat-like), controlled analysis

 Seurat vs. Scanpy, aligned function arguments (Scanpy-like),controlled analysis
Seurat vs. Scanpy, aligned function arguments (Scanpy-like),controlled analysis

Seurat和Scanpy的比较表明,在某些情况下,程序结果是可以调和的,但并非总是如此。函数之间有三种可能的对齐方式:默认对齐、匹配函数参数时对齐、不兼容对齐。下表显示了每个函数在这些类中的分类。表1 (Seurat)和2 (Scanpy)详细介绍了分析函数名的每个步骤、默认参数、尽可能与其他软件匹配所需的参数以及该软件的唯一参数。

下采样比较

考虑到软件之间引入的可变性,一个自然的问题是如何对这些差异的大小进行基准测试。为此,在生成过滤UMI矩阵之前,模拟reads和细胞的下采样,并比较了沿下采样分数梯度引入的差异与全尺寸数据。我们使用各自软件的默认函数参数执行分析的每个步骤,并且在每个步骤之前不对齐输入数据,除了DE分析的那些步骤,这些步骤需要在每个步骤之前对齐输入,以便比较相同cluster中的差异基因统计(差异基因选择,logFC和调整的p值)。对于分析的每一步,除了生成如图1所示的所有图外,我们还选择了一个单一的数字指标,该指标将捕获组间差异的程度,如下所示:

• Cell filtering: Jaccard index of cell sets • Gene filtering: Jaccard index of gene sets • HVG selection: Jaccard index of HVG sets • PCA: Mean of difference in corresponding PC loadings PCs 1-3 • KNN/SNN: Median magnitude of log of SNN degree ratio • Clustering: ARI • UMAP: Median Jaccard index of UMAP-derived KNN neighborhoods across all cells • Marker gene selection: Jaccard index of significant marker gene sets • Marker selection: Jaccard index of marker sets • logFC: CCC • Adjusted p-value: Fraction of adjusted p-values that flipped across the p=0.05 threshold between conditions

对reads和细胞进行降采样的最不稳健的步骤是基因选择;然而,考虑到hvg和差异基因与下采样部分的全尺寸数据集的相似性,似乎基因集的差异主要在于不太重要的基因。

Read  downsampling to 4% of original size vs.  full dataset in Seurat, with a  fraction that displays variation  comparable to Seurat vs. Scanpy.
Read downsampling to 4% of original size vs. full dataset in Seurat, with a fraction that displays variation comparable to Seurat vs. Scanpy.

Read  downsampling to 4% of original size vs.  full dataset in Scanpy, with a  fraction that displays variation  comparable to Seurat vs. Scanpy.
Read downsampling to 4% of original size vs. full dataset in Scanpy, with a fraction that displays variation comparable to Seurat vs. Scanpy.

Cell  downsampling to 16% of original size vs.  full dataset in Seurat, with a  fraction that displays variation  comparable to Seurat vs. Scanpy.
Cell downsampling to 16% of original size vs. full dataset in Seurat, with a fraction that displays variation comparable to Seurat vs. Scanpy.

Cell  downsampling to 16% of original size vs.  full dataset in Scanpy, with a  fraction that displays variation  comparable to Seurat vs. Scanpy
Cell downsampling to 16% of original size vs. full dataset in Scanpy, with a fraction that displays variation comparable to Seurat vs. Scanpy

  Metrics vs. fraction of reads downsampled. (A) Jaccard index of cell overlap
Metrics vs. fraction of reads downsampled. (A) Jaccard index of cell overlap

 Metrics vs. fraction of cells downsampled. (A) Jaccard index of cell overlap
Metrics vs. fraction of cells downsampled. (A) Jaccard index of cell overlap

版本控制对DE分析具有重要意义

除了软件选择(例如,Seurat vs. Scanpy)之外,软件版本也可以在结果的解释中发挥作用。将Seurat v5与v4进行比较,在重要差异基因、marker和logFC估计值集方面存在相当大的差异。logFC计算的差异源于不同版本间伪计数应用程序的变化。Marker选择的差异完全来自于logFC计算和过滤参数的差异。将Scanpy v1.9与较早的v1.4进行比较还揭示了重要marker基因和marker list的巨大差异,这是由于删除了不同版本之间的marker过滤。这些版本之间的logFC计算和调整后的p值没有差异。比较使用默认设置的Cell Ranger软件v7和Cell Ranger v6生成的计数矩阵也揭示了所有DE指标之间的差异。跨Cell Ranger版本的分析显示,pipeline的所有步骤都存在相当大的差异。

  Cell Ranger version control (v7 vs. v6).
Cell Ranger version control (v7 vs. v6).

这些命令之间的主要区别在于v7中默认包含基因计数矩阵中的内含子计数,而v6中默认排除内含子计数。这种区别对UMI过滤和每个细胞的基因小提琴图有影响,与cell Ranger v6有更多的限制

 UMI counts pre-filtering and number of features under different conditions
UMI counts pre-filtering and number of features under different conditions

Random seeds

涉及随机化影响的工作流步骤有近似knn搜索、Louvain/Leiden图形聚类和UMAP。为了对软件或数据大小之间的差异程度进行基准测试,我们使用相同的输入数据和软件选择运行这些步骤,只改变应用的随机种子。在相同的PCA输入条件下,相同算法间SNN邻域的Jaccard指数中位数和对数度比的变化(Annoy为0.85和0.05,umap-learn/PyNNDescent为1和0)远低于Seurat和Scanpy的0.27和1.61对数度比,表明软件之间的差异不能仅仅用随机性来解释。随机种子间Louvain聚类后的ARI为0.96,显著高于Seurat和Scanpy中Louvain实现间的ARI(0.85)。UMAP衍生的随机UMAP种子间KNN的Jaccard指数中值,Seurat为0.41,Scanpy为0.47,显著高于相同输入为0.21的Seurat和Scanpy之间的UMAP图。然而,对于Seurat和Scanpy,在随机UMAP种子中对相同数据进行Leiden聚类后的ARI为0.64,与Seurat和Scanpy计算的观察到的ARI相似,给定相同的PCA和SNN输入,UMAP为0.69。这表明,尽管在Seurat或Scanpy中随机种子之间生成的UMAP图与软件之间生成的UMAP图具有更高的相似性,但Leiden算法不能完全捕获这种相似性。

总结

Seurat和Scanpy在使用默认设置执行分析的方式上存在相当大的差异,这些差异只能通过调整函数参数来部分调和。这些差异相当于当降采样读数小于5%或降采样细胞小于20%时引入的可变性。计数矩阵生成和分析中涉及的软件的版本控制也会对下游分析产生影响,特别是在没有仔细考虑跨版本行为变化的情况下。为了在scRNA-seq分析中实现准确性和可重复性,必须进行一致的封装选择、深思熟虑的参数选择和有意的版本控制。

参考文章在The impact of package selection and versioning on single-cell RNA-seq analysis

生活很好,有你更好

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
单细胞转录组之Seurat包全流程-数据过滤、降维分群及可视化
对于之前从CellRanger得到的比对结果,读取sample/outs/filtered_feature_bc_matrix文件夹下的三个文件:barcodes.tsv(1列,为barcode名);genes.tsv(2列,第1列为ENS编号,第2列为基因名);matrix.mtx(3列,第1列为基因编号,第2列为细胞编号,第3列为对应的reads数)
青青青山
2022/06/16
13.2K0
单细胞转录组之Seurat包全流程-数据过滤、降维分群及可视化
重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)
NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集)等内容。
生信宝典
2021/12/31
2.7K0
重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)
scanpy和Seurat单细胞分析对比
尝试把曾老师的单细胞seurat分析的代码转换成scanpy版本的,包括样品读取,质控,harmony去除批次效应,降维聚类,marker鉴定。
生信技能树
2023/11/16
1.8K0
scanpy和Seurat单细胞分析对比
Seurat包基本分析实战—文献图表复现
分享是一种态度 一、背景知识 文献:https://www.aging-us.com/article/103695/text GSE:https://www.ncbi.nlm.nih.gov/geo/
生信技能树jimmy
2020/10/19
1.9K0
Seurat包基本分析实战—文献图表复现
热点综述 | 高维单细胞RNA测序数据分析工具
scRNA-seq数据集通常包含由于不完全RNA捕获、PCR扩增偏差和/或特定于患者或样本的批次效应而产生的技术噪声,如何降低技术噪声对数据分析的影响?
尐尐呅
2022/04/01
8540
热点综述 | 高维单细胞RNA测序数据分析工具
R中单细胞RNA-seq分析教程 (4)
分析 scRNA-seq 数据时,绘制标记基因的特征图通常是一个良好的起点。然而,要深入理解数据中的异质性,需要通过无偏的方式将细胞分组,这就是聚类的作用。理论上,任何聚类方法都可以应用于 scRNA-seq 数据,包括层次聚类和 k-means 等常用于 bulk RNA-seq 数据的方法。但由于 scRNA-seq 数据样本量通常极大(如一次 10x 实验可能包含数千个细胞),这些方法运行速度非常慢。此外,由于 scRNA-seq 数据本身的稀疏性,即便通过 PCA 等降维处理去噪,不同细胞之间的差异也难以像 bulk RNA-seq 那样精准量化。因此,scRNA-seq 数据分析中更常采用基于图的社区识别算法。这里的“图”是一个数学概念,表示一组对象及其之间的关系;通俗地说,就是细胞间构建的网络。
数据科学工厂
2024/12/30
1740
R中单细胞RNA-seq分析教程 (4)
高维单细胞转录组数据处理最新(2020年3月)综述(万字长文)
看到隔壁《单细胞天地》公众号翻译了一个最新的单细胞数据处理综述,很精彩,所以申请转载到生信技能树平台以飨读者:
生信技能树
2020/05/14
2.7K0
高维单细胞转录组数据处理最新(2020年3月)综述(万字长文)
生物医学研究和临床应用中单细胞RNA-seq数据分析指南
单细胞RNA测序(scRNA-seq)在生物医学研究中的应用,提高了对疾病发病机制的认识,并为新的诊断和治疗策略提供了有价值的见解。随着包括临床样本在内的高通量scRNA-seq数据的扩大,对这些大量数据的分析已经成为进入这一领域的研究人员的一个必须面对的前景。在这里,回顾了典型scRNA-seq数据分析的工作流程,包括原始数据处理和质量控制,适用于几乎所有scRNA-seq数据集的基本数据分析,以及应针对特定科学问题量身定制的高级数据分析。在总结每个分析步骤的当前方法的同时,还提供了软件和脚本的在线数据。对一些具体的分析任务和方法提出了建议和注意事项。
追风少年i
2022/12/08
1.9K0
生物医学研究和临床应用中单细胞RNA-seq数据分析指南
scRNA-seq marker identification(二)
单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq——读入数据详解 scRNA-seq——质量控制 为什么需要Normalization和PCA分析 scRNA-seq聚类分析(一) scRNA-seq聚类分析(二) scRNA-seq Clustering (一) scRNA-seq Clustering (二) scRNA-seq Clustering quality control (一)scRNA-seq Clustering quality control (二)scRNA-seq marker identification(一)
生信技能树jimmy
2020/12/11
1.8K0
scRNA-seq marker identification(二)
R中单细胞RNA-seq分析教程 (14)
本系列开启 R 中scRNA-seq数据分析教程[1],持续更新,欢迎关注,转发!想要获取更多教程内容或者生信分析服务可以添加文末的学习交流群或客服QQ:941844452。
数据科学工厂
2025/04/02
1230
R中单细胞RNA-seq分析教程 (14)
单细胞实战之Ro/e、Augur、miloR——入门到进阶(中级篇4)
在上一讲中完成了inferCNV的分析流程,本讲将回顾学习单细胞分析中的三个工具:Ro/e、Augur、miloR,这三个工具分别能够判断细胞簇在组织分布倾向、扰动影响和细胞差异丰度。
凑齐六个字吧
2025/04/06
1820
单细胞实战之Ro/e、Augur、miloR——入门到进阶(中级篇4)
scRNA-seq marker identification(一)
单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq——读入数据详解 scRNA-seq——质量控制 为什么需要Normalization和PCA分析 scRNA-seq聚类分析(一) scRNA-seq聚类分析(二) scRNA-seq Clustering (一) scRNA-seq Clustering (二) scRNA-seq Clustering quality control (一) scRNA-seq Clustering quality control (二)
生信技能树jimmy
2020/10/19
4.2K1
scRNA-seq marker identification(一)
BatchBench比较scRNA批次矫正方法
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
生信技能树jimmy
2020/06/04
2K0
BatchBench比较scRNA批次矫正方法
COVID-19病人支气管免疫细胞单细胞测序分析
与COVID-19严重性相关的呼吸免疫特性目前还不清楚。作者选了COVID-19严重程度不同的患者以及健康人的支气管肺泡灌洗液免疫细胞,进行单细胞转录组测序。发现重度患者的支气管肺泡灌洗液中富含巨噬细胞,普通型患者的特点是存在高度克隆扩增的CD8+ T细胞。
生信技能树jimmy
2020/06/24
1.7K0
COVID-19病人支气管免疫细胞单细胞测序分析
单细胞入门【2】:scRNA-seq测序数据的计算分析指南
scRNA-seq是一种流行且功能强大的技术,可分析大量单个细胞的整个转录组。然而对这些实验生成的大量数据的分析需要专门的统计和计算方法。
尐尐呅
2022/03/31
2K0
单细胞入门【2】:scRNA-seq测序数据的计算分析指南
空间通过细胞空间排布分析银屑病的严重程度
研究强调了ST在健康皮肤中同时绘制基因表达图谱和定义不同的、生物学相关的细胞“邻域”的能力。在这样做的过程中,发现了ST在捕获成熟脂肪细胞(成熟脂肪细胞和皮脂细胞)的基因表达方面的明显优势。分析还表明,免疫细胞在健康皮肤的滤泡周围和血管周围的niche中富集,而在炎症皮肤中,这种病灶定位明显改变。PsO病变在免疫细胞空间分布上有明显的变化,从健康皮肤中主要分布在毛囊周围,到银屑病皮肤的表面到真皮中部。因此,除了活动性PsO病变中免疫群体的组成变化外,它们的位置可能为了解它们的调节和功能提供了急需的见解。例如,分析发现稳态效应T细胞(TH/TC)和调节性T细胞(Tregs)与apc聚集在血管周围的滤泡周围区域。卵泡是共生微生物的家园,是病原体和过敏原进入的门户,并丰富表达免疫调节因子。小鼠研究表明,稳态免疫监视依赖于居住在卵泡中的共生体。了解健康和患病人体皮肤中特定的共生细菌种群以及它们如何影响淋巴细胞功能是积极研究的途径。 长期以来,皮肤免疫耐受的丧失被认为是导致PsO发生和延续的原因。因此,除了炎症细胞的涌入外,卵泡生态位周围的稳态免疫监视和耐受性机制的紊乱也可能是病变形成的关键诱因。与这一观点相一致的是,全球转录组学分析显示,与严重疾病相比,轻度PsO病变富含免疫调节特征。在临床上,已知头皮上的银屑病病变(人体毛囊最密集的皮肤)更难以治疗,并且更有可能累及全身。此外,在头皮和非头皮PsO中都观察到毛囊脱落、缩小和皮脂腺萎缩。卵泡上皮周围效应/调节性T细胞的战略性定位和比例导致(或防止)皮肤炎症的机制值得进一步研究。 将ST应用于活跃的银屑病病变和来自未受损伤的非病变皮肤的活检,能够在组织尺度上发现细胞组织和细胞间通讯的扭曲。通过这样做,说明了这个平台的价值,将公开可用的皮肤单细胞转录图谱放入其原生组织环境中。研究结果确定了两个表皮和一个真皮空间簇在病变皮肤横截面上显著富集(在某些情况下独特表达)。这些cluster表达了参与炎症(例如TH17激活)和表皮增殖和分化途径的基因,这些途径也在表皮修复过程中出现。长期以来,PsO被认为是一种伤口过度愈合的病理。在所有样本中都有pso富集cluster,因此可能代表疾病的“核心特征”,无论其严重程度或是否存在合并症。先前的工作报道了IL-17A在轻度疾病参与者样本中的表达与严重疾病相比的矛盾增加。尽管如此,IL-17阻断在临床上对轻度和严重疾病都有效,验证了既定的概念,即驱动整个疾病严重程度谱的机制沿着17型免疫轴聚集。 研究受到Visium ST技术目前可用分辨率的限制,该技术以50 μm的增量捕获基因表达。然而,我们整合了scRNA-seq数据集,以获得更高的细胞分辨率和空间背景。随着这项技术的发展,具有更高密度和更高分辨率的空间条形码珠的平台将提供更多关于健康和患病状态下细胞微环境的粒度。另一个关键的考虑因素是测序的深度和基因的辍学率。因此,我们的分析也可能没有捕获到罕见的细胞类型或非常低表达的基因。因此,我们避免了“缺乏证据”的争论,只关注基因的积极富集来得出结论。SpaceFold对组织结构做了两个假设:组织应该具有典型的结构,每个点的细胞类型分数表明这种细胞类型的物理坐标,因为它与起源点有关。因此,异质组织区域内斑点的坐标可能与物理细胞类型位置不对应,因此不能直接解释。然而,不同细胞类型分布区域之间的相对坐标仍然可以与使用组织细胞标志(例如,lc和黑素细胞区分基底表皮层和基底膜)进行比较来得出结论。最后,与病变样本相比,一些空间簇(0、1、2、3、8、15和16)在非病变皮肤中趋向于富集;然而,在这些cluster中观察到的样本间差异以及分析的低样本量使得这些差异在统计上不显著。
追风少年i
2024/05/27
1460
空间通过细胞空间排布分析银屑病的严重程度
SPOTlight || 用NMF解卷积空间表达数据
Giotto|| 空间表达数据分析工具箱 Seurat 新版教程:分析空间转录组数据(上) Seurat 新版教程:分析空间转录组数据(下) scanpy教程:空间转录组数据分析 10X Visium:空间转录组样本制备到数据分析 空间信息在空间转录组中的运用 定量免疫浸润在单细胞研究中的应用
生信技能树jimmy
2021/01/12
2.9K0
SPOTlight || 用NMF解卷积空间表达数据
单细胞转录组数据分析必读综述
摸索单细胞转录组数据分析这两年,我遇到过太多的CNS文章及综述,但只有本文被我安排给了所有人进行翻译,本译文来自于最优秀的学习者,最开始在不到3000粉丝的单细胞天地公众号发布,却喜获近5000的阅读量。
生信技能树
2019/05/20
6.7K0
单细胞转录组数据分析必读综述
python 单细胞scanpy流程
这篇推文耗时甚久,主要是学习和跑通官网代码,其次是加了一些自己的细微调整,比如整理marker基因表格,还有可视化的调整等。
用户11414625
2024/12/20
4050
python 单细胞scanpy流程
超详细 | 生物医学研究和临床应用中scRNA-seq的数据分析指南
随着高通量scRNA-seq(包括临床样本)能力的扩大,对这些海量数据的分析能力已成为进入该领域研究人员的必备技能。近日,《Military Medical Research》发表了一篇综述文章,回顾了典型scRNA-seq数据分析的工作流程,总结每个分析步骤的当前方法,并针对某些特定的分析任务和方法指出了建议和注意事项。
尐尐呅
2023/01/17
8590
超详细 | 生物医学研究和临床应用中scRNA-seq的数据分析指南
推荐阅读
相关推荐
单细胞转录组之Seurat包全流程-数据过滤、降维分群及可视化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档