首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >scATAC-seq3:常用工具—SnapATAC简介

scATAC-seq3:常用工具—SnapATAC简介

作者头像
生信技能树jimmy
发布于 2022-01-17 09:34:05
发布于 2022-01-17 09:34:05
1.9K0
举报
文章被收录于专栏:单细胞天地单细胞天地

引文

之前的推文中,我们简单介绍了scATAC-seq的技术原理和发展历程。从本期推文开始,我们将分享scATAC-seq的常用工具和基本的分析流程。scATAC-seq分析工具当中,比较为人熟知的是ArchR、SnapATAC以及Signac三个R包,本期我们着重对SnapATAC进行介绍。SnapATAC是由加州大学圣地亚哥分校的任兵教授团队开发的工具,这款工具很早就已经推广使用了,不过直到今年才在NC上发表见刊。

任兵教授团队今年除了这篇SnapATAC的正式发表,还有另一篇建立在单细胞Hi-C数据基础上的分析工具SnapHiC在《Nature Methods》上发表。对于SnapATAC这个名字具有一语双关的意思,一方面代表Single Nucleus Analysis Pipeline for ATAC-seq,又可以包含Snapshot of single cell chromatin accessibility 这样的含义。

scATAC-seq的分析难点

由于scATAC-seq对于peak的捕获效率只能达到5%-15%左右,因此对于区分细胞类型的过程来说,scATAC-seq相比于scRNA-seq的分析困难更大。当前针对于scATAC-seq数据集,主要的无监督学习算法有以下几种类型:

  • 1)根据细胞染色质开放区的转录因子motif的位点分布进行聚类,例如chromVAR;
  • 2)通过自然语言处理工具,例如LSA、LDA等方法,将细胞根据染色质开放性的相似程度进行区分;
  • 3)根据序列组装k-mer算法,分析细胞染色质开放性的差异;
  • 4)先基于细胞推测的调控元件计算基因的activity score,再比较细胞之间的差异,例如Cicero。

但是对于这些算法而言,大多都需要通过SVD进行线性降维处理,如果针对细胞数目较大的数据集,则其运算量会非常大,在现行的计算条件下很难进行实现。

SnapATAC的优势

2019年《Genome Biology》曾发表一篇题为《Assessment of computational methods for the analysis of single-cell ATAC-seq data》的文章,对当时的scATAC-seq的分析工具进行了比较系统的评价。

通过比较不同工具的聚类可视化结果,可以看到cisTopic、Cusanovich2018、SnapATAC三种工具的聚类效果明显优于其他的工具。除此以外,针对大数据计算存在的问题,SnapATAC则通过Nyström这种方法,极大地提高了scATAC-seq分析的运算效率和处理大规模数据集的能力。

SnapATAC简介

本期推文我们先简单介绍一下SnapATAC的功能和相较于其他分析工具的特性和差异。

  • 1)SnapATAC的上游分析,作者推荐其团队开发的SnapTools进行处理(SnapATAC也能够处理由Cellranger进行上游处理的结果),而由SnapTools产生的上游处理结果储存在snap格式的文件当中。
  • 2)SnapATAC区分细胞类型主要是通过评估细胞之间的染色质开放性的差异,而每个细胞的染色质开放性是通过二进制向量进行表示的。二进制向量的长度n,表示将基因组切割为n个区间bin。如果对于某区间bin对应向量中的值为1,则表示该区间内含有一个或一个以上的reads;而如果该区间对应向量中的值为0,则表示该区间不含有reads。这个和0-1规划的数学模型非常相似,即1代表开放,0代表不开放。因此bin的大小的选择对结果的影响至关。我们后面会专门讨论这个问题。主要所有细胞之间的染色质开放性差异最终通过Jaccard相似度矩阵的形式进行体现。
  • 3)SnapATAC是通过Nyström这种方法对大规模的数据集进行降维,主要分为两步:首先对细胞中的一部分进行降维,再基于这部分细胞形成的embedding结果,将其他的细胞进行投影。但主要存在的一个问题在于每次抽样不同的细胞,会产生不一样的结果。SnapATAC主要是根据多次结果,进行整合出一个能够实现高度重现的结果。
  • 4)SnapATAC的细胞类型定义主要支持的途径有以下三种:通过accessibility score根据marker gene进行定义、通过整合scRNA-seq的数据集进行定义、根据过去已有数据的定义结果进行监督学习。

总结

本期推文我们主要对SnapATAC这种工具进行了简单的介绍。其实针对scATAC-seq数据分析的工具,最关键的两个问题是分析准确度和计算效率如何能够提高。在下一篇推文当中,我们将具体介绍SnapATAC的分析流程和分析中遇到的相关问题。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
scATAC-seq2: scATAC-seq技术原理
之前的推文中,我们主要对scATAC-seq研究的科学问题作了简单的介绍。这篇推文主要介绍scATAC-seq的技术原理和发展历程。下面这张图选自SnapATAC这个R包的作者Rongxin Fang的github上分享的内容(https://github.com/r3fang/SnapATAC/blob/master/notebooks/experiemnt_timeline.md),记录了从2015年到2019年期间scATAC-seq技术的发展。早期的scATAC-seq测序通量很低,而现在的scATAC-seq (常用的是10x) 能够达到很高的通量。
生信技能树jimmy
2021/10/09
2.2K0
scATAC-seq分析ArchR(三):使用模块打分注释细胞亚群
scATAC-seq数据分析除了经典的 Signac软件,还有一款也适用差多的软件 ArchR,官网给到你:
生信技能树
2025/05/12
2420
scATAC-seq分析ArchR(三):使用模块打分注释细胞亚群
胎儿视网膜和干细胞来源的视网膜类器官的scATAC-seq发现细胞命运改变过程中的染色质变化
题目:Single-cell ATAC-seq of fetal human retina and stem-cell-derived retinal organoids shows changing chromatin landscapes during cell fate acquisition DOI:https://doi.org/10.1016/j.celrep.2021.110294
生信技能树jimmy
2023/08/31
3730
胎儿视网膜和干细胞来源的视网膜类器官的scATAC-seq发现细胞命运改变过程中的染色质变化
scATAC-seq1:由转录组到表观组
自1665年罗伯特·虎克在《Micrographia》一书中提出cell的概念,早期的生物学家便开始通过细胞的形态和功能对细胞进行分类。但随着科技的发展和时代的进步,人们逐渐发现同一种命名的细胞类型内部往往也存在着功能和形态的显著差异。而由于技术的缺陷,过去很长一段时间中人们对于细胞的研究停留在通过实验的角度进行观察和分析。单细胞测序技术的出现成为细胞生物学历程上的一个重要的转折点,它对于细胞类型定义、发育轨迹、细胞功能互作等研究提供了一个全新的视角。最受关注的单细胞组学无疑是单细胞转录组学,其技术在十年内飞速发展,并在近两年不断出现空间转录组学的新技术,实现空间维度高分辨率的转录组测序。同时,近几年人类和小鼠中各器官的单细胞转录组图谱层出不穷。
生信技能树jimmy
2021/10/09
7360
scATAC-seq4: scATAC-seq上游分析
上期推文【scATAC-seq3:常用工具—SnapATAC简介】当中,我们主要对SnapATAC这一个工具的特点进行了简单的介绍。在本期推文当中,我们将继续上一次的话题,简单介绍scATAC-seq的上游分析流程,即最常用的Cellranger和用于SnapATAC分析的上游分析软件snaptools。
生信技能树jimmy
2022/03/14
2.5K0
scATAC-seq4: scATAC-seq上游分析
scATAC-seq数据分析之标准分析流程
在上一篇推文【scATAC-seq数据分析之数据读入及质控】中,我们介绍了如何使用 R 包 Signac 进行 scATAC-seq 数据的读取与质控。本节将继续讲解如何基于 Signac 执行标准的分析流程。
生信菜鸟团
2025/05/18
2800
scATAC-seq数据分析之标准分析流程
10X scATAC-seq的结果 fragment files 含义
参考:https://www.archrproject.com/bookdown/a-brief-primer-on-atac-seq-terminology.html
生信技能树
2025/05/26
2360
10X scATAC-seq的结果 fragment files 含义
代码分享|| 见过将代码整理成wiki资源的吗?这是篇极好的学习单细胞与scATAC-Seq组学以及联合分析的文献资源!
由于最近学习多组学方向的思路,顺便随手将以前整理的资源进行了翻阅,发现了非常多好东西,~本次分享的文献是一篇极好的学习scRNA-Seq与scATAC-Seq组学以及联合分析的文献资源!囊括了上游分析的bash代码和下游每一张Figure的复现代码,是一个非常好的学习单细胞与ATAC-Seq联合分析的文献资源,代码可以说整理的非常好了,还包括各种readme说明。作者甚至还将代码整理了一个wiki版本的,这说明有各种详细的说明以及代码大纲,简直不要太棒!
生信技能树
2024/06/08
2470
代码分享|| 见过将代码整理成wiki资源的吗?这是篇极好的学习单细胞与scATAC-Seq组学以及联合分析的文献资源!
单细胞转录组|scATAC-seq 数据整合
本文在此展示了如何将多个源自人类外周血单核细胞的单细胞染色质数据集进行整合。其中一个数据集是通过10x Genomics的多组学技术获得的,它涵盖了每个细胞的DNA可及性和基因表达数据。另一个数据集则是通过10x Genomics的单细胞ATAC测序(scATAC-seq)技术得到的,仅包含DNA可及性信息。
数据科学工厂
2024/12/30
2010
单细胞转录组|scATAC-seq 数据整合
ATAC-seq领域超级大佬William J. Greenleaf团队开发的scATAC-seq分析软件:ArchR
scATAC-seq数据分析除了经典的 Signac软件,还有一款也使用超多的软件 ArchR,官网给到你:
生信技能树
2025/05/08
3470
ATAC-seq领域超级大佬William J. Greenleaf团队开发的scATAC-seq分析软件:ArchR
单细胞分析|整合 scRNA-seq 和 scATAC-seq 数据
单细胞转录组学极大地提升了对细胞状态进行分类的能力,但要深入理解生物学现象,不能仅仅停留在对细胞群的简单列举上。随着新方法的不断涌现,用于测量细胞的不同状态,一个关键的挑战是如何将这些数据集整合起来,以便更全面地理解细胞的特性和功能。
数据科学工厂
2024/04/28
7460
单细胞分析|整合 scRNA-seq 和 scATAC-seq 数据
一个PBMC的scATAC-seq基础分析:Signac
scATAC-seq用的最多的包就是Signac包了,这个包来自Seurat包的扩展,分析步骤等跟Seurat非常像,下面来看看。学习官网为:
生信技能树
2025/03/31
3870
一个PBMC的scATAC-seq基础分析:Signac
一个成年小鼠大脑的scATAC-seq:Signac
scATAC-seq用的最多的包就是Signac包了,这个包来自Seurat包的扩展,分析步骤等跟Seurat非常像,下面来看看。
生信技能树
2025/04/04
2440
一个成年小鼠大脑的scATAC-seq:Signac
Seurat软件学习5-scRNA-Seq和scATAC-Seq数据整合
Seurat软件学习1-多个模型得数据进行整合:https://cloud.tencent.com/developer/article/2130078
小胡子刺猬的生信学习123
2022/10/15
9550
Seurat软件学习5-scRNA-Seq和scATAC-Seq数据整合
单细胞分析(Signac): PBMC scATAC-seq 聚类
在本教学指南中,我们将探讨由10x Genomics公司提供的人类外周血单核细胞(PBMCs)的单细胞ATAC-seq数据集。
数据科学工厂
2024/05/27
2040
单细胞分析(Signac): PBMC scATAC-seq 聚类
单细胞分析(Signac): PBMC scATAC-seq 整合
在本教学指南中,我们将探讨由10x Genomics公司提供的人类外周血单核细胞(PBMCs)的单细胞ATAC-seq数据集。
数据科学工厂
2024/05/27
2880
单细胞分析(Signac): PBMC scATAC-seq 整合
scATAC-seq分析之Signac Motif富集分析
对scATAC-seq数据进行清洗质控【scATAC-seq数据分析之数据读入及质控】、注释以及进行差异peaks分析【scATAC-seq数据分析之标准分析流程】之后,后续的分析框架和方向与scRNA-seq分析(例如差异基因富集分析、拟时序分析和分化分析)及传统的bulk ATAC-seq分析(例如motif富集分析, motif footprinting)类似。本文基于Signac官方教程,介绍一下scATAC-seq数据的DNA 序列基序(motif)富集分析(https://stuartlab.org/signac/articles/motif_vignette)。
生信菜鸟团
2025/05/18
2110
scATAC-seq分析之Signac Motif富集分析
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学领域,将新数据集映射到已建立的参考数据集上的能力,与读取映射工具变革基因组序列分析的方式如出一辙。
数据科学工厂
2024/04/02
3640
单细胞分析|Seurat中的跨模态整合
Seurat4.0系列教程14:整合scRNA-seq and scATAC-seq数据
单细胞转录学改变了我们描述细胞状态的能力,但深入的生物学解释需要的不仅仅是分群。随着测量不同细胞模式的新方法的出现,一个关键的分析挑战是整合这些数据集,以更好地了解细胞身份和功能。例如,用户可以在同一生物系统上执行 scRNA-seq 和 scATAC-seq 实验,并一致地用同一组细胞类型标签对两个数据集进行注释。这种分析尤其具有挑战性,因为 scATAC-seq 数据集难以注释,单细胞分辨率收集的基因组数据很少,而且 scRNA-seq 数据中缺乏可解释的基因标记。
生信技能树jimmy
2022/01/10
3.4K1
Seurat4.0系列教程14:整合scRNA-seq and scATAC-seq数据
scATAC-seq建库原理,质控方法和新R包Signac的使用
NGS系列文章包括NGS基础、在线绘图、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程)、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step))、批次效应处理等内容。
生信宝典
2020/09/27
4.8K0
scATAC-seq建库原理,质控方法和新R包Signac的使用
推荐阅读
相关推荐
scATAC-seq2: scATAC-seq技术原理
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档