首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >单细胞多组学数据分析不会分析

单细胞多组学数据分析不会分析

作者头像
生信技能树jimmy
发布于 2023-08-31 03:17:00
发布于 2023-08-31 03:17:00
34200
代码可运行
举报
文章被收录于专栏:单细胞天地单细胞天地
运行总次数:0
代码可运行

不开玩笑,只需要你设计实验收集样品花钱在公司测序了即可,数据分享到公开数据库后就可以发表在《 BMC Genomic Data》杂志啦,比如2023年8月7号见刊的《The single-cell transcriptome and chromatin accessibility datasets of peripheral blood mononuclear cells in Chinese holstein cattle》,实验设计蛮简单的:

  • 单细胞多组学技术:single-cell RNA sequencing (scRNA-seq) and single-cell sequencing assay for transposase-accessible chromatin (scATAC-seq).
  • 四个分组: four whole-blood treatments (no, 2 h, 4 h, and 8 h LPS)
  • 得到的细胞数量:7,107 (no), 9,174 (2 h), 6,741 (4 h), and 3,119 (8 h) cells

因为脂多糖(LPS)组成革兰氏阴性细菌的外膜,其暴露可导致牛的局部或全身炎症水平升高,所以本实验设计就是使用脂多糖(LPS)看LPS 作为慢性炎症的关键介质调节免疫应答。

全文没有一个图,但是数据是实打实的公开了,GSE225962,如下所示的样品:

代码语言:javascript
代码运行次数:0
运行
复制
GSM7061075 no LPS, scRNA-seq
GSM7061076 2 h LPS, scRNA-seq
GSM7061077 4 h LPS, scRNA-seq
GSM7061078 8 h LPS, scRNA-seq
GSM7061079 no LPS, scATAC-seq
GSM7061080 2 h LPS, scATAC-seq
GSM7061081 4 h LPS, scATAC-seq
GSM7061082 8 h LPS, scATAC-seq

虽然说给的文件有点奇怪:

代码语言:javascript
代码运行次数:0
运行
复制
GSM7061075_C.scRNAexpression.txt.gz 15.5 Mb
GSM7061076_T1.scRNAexpression.txt.gz 17.8 Mb
GSM7061077_T2.scRNAexpression.txt.gz 15.0 Mb
GSM7061078_T3.scRNAexpression.txt.gz 8.0 Mb
GSM7061079_C.scATACgenes-barcode.matrix.txt.gz 1.2 Mb
GSM7061080_T1.scATACgenes-barcode.matrix.txt.gz 10.5 Mb
GSM7061081_T2.scATACgenes-barcode.matrix.txt.gz 8.7 Mb
GSM7061082_T3.scATACgenes-barcode.matrix.txt.gz 5.4 Mb

单细胞转录组矩阵很容易读取并且降维聚类分群,然后看看随着脂多糖(LPS)处理时间段变化的基因,通路以及细胞亚群,但是单细胞ATAC数据作者给出来的文件应该是不够的,可能是需要去 PRJNA938112 里面下载原始数据后进行处理啦。感兴趣的可以试试看:

  • scATAC-seq4: scATAC-seq上游分析
  • scATAC-seq3:常用工具—SnapATAC简介
  • scATAC-seq1:由转录组到表观组
  • scATAC-seq2: scATAC-seq技术原理

单细胞ATAC-seq

同样的,单细胞ATAC-seq也是上下游独立开,走在Linux系统的cellranger-atac软件进行上游分析,然后走R语言里面的下游统计可视化即可。

这里我们拿刚刚发表的范文举例:西湖大学和浙江大学的科研团队合作的,发表于2022年6月的,发表在Cell Discovery 的文章 :《Single-cell multiomics analysis reveals regulatory programs in clear cell renal cell carcinoma》,链接是:https://www.nature.com/articles/s41421-022-00415-0

是关于 clear cell renal cell carcinoma (ccRCC) 的肿瘤微环境的单细胞多组学,包括:

  • single-cell RNA sequencing (scRNA-seq)
  • single-cell assay for transposase-accessible chromatin sequencing (scATAC-seq)

数据在PRJNA768891,需要自己下载其测序数据,如下所示:

代码语言:javascript
代码运行次数:0
运行
复制
$ ls -lh *gz|cut -d" " -f5-
28G 82 15:14 SRR16213608_S1_L001_R1_001.fastq.gz
28G 82 15:18 SRR16213608_S1_L001_R2_001.fastq.gz
29G 82 15:23 SRR16213609_S1_L001_R1_001.fastq.gz
29G 82 15:27 SRR16213609_S1_L001_R2_001.fastq.gz
42G 82 15:33 SRR16213610_S1_L001_R1_001.fastq.gz
42G 82 15:40 SRR16213610_S1_L001_R2_001.fastq.gz
41G 82 15:46 SRR16213611_S1_L001_R1_001.fastq.gz
34G 82 15:51 SRR16213611_S1_L001_R2_001.fastq.gz
39G 82 15:57 SRR16213612_S1_L001_R1_001.fastq.gz
34G 82 16:02 SRR16213612_S1_L001_R2_001.fastq.gz
44G 82 16:09 SRR16213613_S1_L001_R1_001.fastq.gz
37G 82 16:15 SRR16213613_S1_L001_R2_001.fastq.gz
37G 82 16:21 SRR16213614_S1_L001_R1_001.fastq.gz
33G 82 16:26 SRR16213614_S1_L001_R2_001.fastq.gz

简单的看 PRJNA768891描述信息,可以知道前面的3个是 (scATAC-seq) ,后面的4个是(scRNA-seq) ,需要分开独立走cellranger流程,所以需要自行去cellranger官网注册并且下载软件和数据库文件,我们一直在做单细胞,所以下面的数据库文件是不同时间段下载的不同版本:

代码语言:javascript
代码运行次数:0
运行
复制
   34M 31 17:06 aspera-connect-3.7.4.147727-linux-64.tar.gz
  972M 31 17:03 cellranger-4.0.0.tar.gz
  955M 31 17:03 cellranger-5.0.1.tar.gz
  1.1G 31 17:03 cellranger-6.0.0.tar.gz
  528M 324 10:50 cellranger-atac-2.1.0.tar.gz

 14G 53  2021 refdata-cellranger-arc-GRCh38-2020-A-2.0.0.tar.gz
   11G 31 17:04 refdata-gex-GRCh38-2020-A.tar.gz
  9.9G 31 17:05 refdata-gex-GRCh38-and-mm10-2020-A.tar.gz
  9.7G 31 17:06 refdata-gex-mm10-2020-A.tar.gz
  
  
  3.3M 31 17:03 refdata-cellranger-vdj-GRCh38-alts-ensembl-4.0.0.tar.gz
3.3M 324 15:20 refdata-cellranger-vdj-GRCh38-alts-ensembl-5.0.0.tar.gz
3.5M 324 15:20 refdata-cellranger-vdj-GRCm38-alts-ensembl-5.0.0.tar.gz

大家作为初学者,可以一次性下载最新版即可。这个步骤需要的计算资源比较大,所以我们一次性跑完结果给大家哈。

交流群

因为这个Cell Discovery 的文章 :《Single-cell multiomics analysis reveals regulatory programs in clear cell renal cell carcinoma》,非常贴心的整理了其全套单细胞多组学下游分析R语言代码给大家,在:GitHub (https://github.com/Dragonlongzhilin/RenalTumor).

我下载并且解压看了看,还是有很多可取之处,所以组建交流群号召大家一起解读一下这些代码,而且我们 提供这个文章附带的PRJNA768891数据集的上游分析结果给大家哈。

就是你不做单细胞多组学,打开这套代码也可以观摩一下里面的自定义函数技巧:

代码语言:javascript
代码运行次数:0
运行
复制
    41 Combined.P.FC.R
     105 Dot.plot.R
      12 Filter.gene.R
      43 IDConvert.R
     125 Integrate.scRNA.scATAC.R
      91 Plot_colorPaletters.R
     294 analysis.diff.survival.TCGA.R
      40 doubletDetect.R
      31 plot.violin.R
      29 ratio.plot.R
      18 variableFeatureSelection.R

因为单细胞转录组我们已经有了大量教程(4个系列两百多个笔记),大家很容易得到文章里面的降维聚类分群和生物学命名,如下所示:

降维聚类分群和生物学命名

可以看到主要是5个淋巴系免疫亚群:

  • CD4+ (CD4, IL7R, CD3D, CD3E)
  • CD8+ T cells (CD8A, CD8B, CD3D, CD3E)
  • Treg (FOXP3, IL2RA)
  • natural killer (NK)/natural killer T (NKT) cells (KLRD1, GNLY)
  • B cells (MS4A1/CD20, CD79A)

以及5个髓系细胞

  • macrophages (CSF1R, CD68, CD163),
  • monocytes (S100A12, FCGR3A/CD16),
  • mast cells (TPSAB1, KIT)
  • Dendritic cell
  • Neutrophil

其实就是我们一直确定的肿瘤单细胞降维聚类分群规则啦,第一层次分群也是肿瘤上皮细胞,基质细胞(内皮,成纤维等),免疫细胞(淋巴系的T, NK 和B,髓系的巨噬和单核)。

所以本次交流群我们会重点解读单细胞ATAC-seq的代码哦,如下所示:

代码语言:javascript
代码运行次数:0
运行
复制
     208 1.mergeData.R
      79 2.cluster.R
     118 3.1.integrate.scATAC.scRNA3000.R
     189 3.2.AssignCellType.R
     541 4.1.callPeak&DAR.R
     213 4.2.peakAnnotation.genomicLocation.R
      70 4.3.peak.annotated.geneHancer.R
     138 5.1.motif.enrichment.R
     297 5.2.motif.analysis.R 
      39 5.3.2.drug.plot.R
     124 6.1.cis-coassessibility.R
     204 6.2.ccans.annotated.genomicLocation.R
     122 7.1.All.TF.target.R
     321 7.2.Tumor..TFs.regulatoryNetwork.R
     480 7.Tumor.TFs.regulatoryNetwork.R
     552 8.1.Immune.CD8T.R
     536 8.1.Immune.CD8T.TF.target.R
     507 8.2.Immune.Macrophage.R
     525 8.2.Immune.Macrophage.TF.target.R
      86 Endothelial.R
     814 ExtraDataAnalysis.R
      76 NK.analysis.R

尤其是代码里面的scATAC和scRNA数据的整合,文献里面的展示的很漂亮:

scATAC和scRNA数据的整合

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
CellRanger ARC—单细胞RNAseq和ATAC联合分析套件
CellRanger ARC 是10x Genomics 专为单细胞多组学数据分析设计,同时分析单细胞RNA测序(scRNA-seq)和单细胞ATAC测序(scATAC-seq)数据的一组分析pipline 。
生信菜鸟团
2024/07/22
2.2K0
CellRanger ARC—单细胞RNAseq和ATAC联合分析套件
能从源头解决数据分析的瑕疵吗
可以看到,里面确实是15个样品,分别是常规转录组,单细胞转录组,以及空间单细胞转录组,如下所示:
生信技能树
2024/01/23
1970
能从源头解决数据分析的瑕疵吗
单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析(1)
scTCR可以更细致的获取肿瘤免疫微环境的变化,比如单细胞转录组可以获取不同样本,不同分组(癌和癌旁,是否治疗,是否响应)的celltype组成,可以知道哪些celltype发生变化。
生信补给站
2023/08/25
2.6K0
单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析(1)
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1
这篇文章是2021年发表在MC上的文章,主要讲的是利用单细胞多组学的手段解析妇科癌症的文章。
小胡子刺猬的生信学习123
2022/07/24
1.2K0
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1
小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码)
新鲜出炉(2023年5月)的文章:《Fueling sentinel node via reshaping cytotoxic T lymphocytes with a flex-patch for
生信技能树
2023/09/04
7230
小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码)
人类妇科恶性肿瘤的多组学单细胞景观
文章标题:《A multi-omic single-cell landscape of human gynecologic malignancies》
生信技能树jimmy
2024/03/04
3220
人类妇科恶性肿瘤的多组学单细胞景观
单细胞转录组实战01: CellRanger7定量
10X提供人和鼠的基因组参考index,其他物种可以是用cellranger自行构建
生信探索
2023/02/09
8880
单细胞转录组之从fastq到counts
进入NCBI SRA数据库,输入GSE编号,选择要下载的数据,下载Accession List,至rawdata文件夹.
青青青山
2022/05/12
3.1K0
单细胞转录组之从fastq到counts
跑一个肝癌的单细胞转录组10x数据定量流程
在 https://www.ebi.ac.uk/ena/browser/view/PRJNA793914 可以看到这个项目详情,而且前些天我们演示了如何下载这个项目的fastq格式的测序数据原始文件,详见:aspera的高速下载确实很快吗。但是从网络下载的单细胞转录组数据文件的样品名字别抹掉了,变成了顺序编号的id,而且呢,文件名字并不符合规则:
生信技能树
2024/03/06
3530
跑一个肝癌的单细胞转录组10x数据定量流程
单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵
cellranger count 管道将FASTQ文件中的测序结果与参考转录组进行比对,并生成一个.cloupe文件,用于在Loupe Browser中进行可视化和分析,同时还生成了一些与其他公开工具兼容的输出,用于进一步分析。
DoubleHelix
2022/06/13
3.7K0
单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵
今年暑假一起学单细胞吧(附上游数据下载tips)
之所以选取这个模块,是因为这部分包含了scRNAseq的上游实验部分,掌握好这部分能够更好帮助我们了解scRNAseq的结果文件,进行下游分析
生信技能树jimmy
2023/08/31
5540
今年暑假一起学单细胞吧(附上游数据下载tips)
一次错误的单细胞转录组定量
首先呢,可以看到这个数据集其实是给出来了单细胞表达量矩阵文件, 我们仅仅是为了演示上游fq文件处理哈。
生信技能树
2024/11/21
3020
一次错误的单细胞转录组定量
单细胞RNA速率(velocyto)分析学习(一)
该部分内容仅为从Cellranger到loom文件部分内容,使用的数据集是GSE188711。
凑齐六个字吧
2025/05/08
3430
单细胞RNA速率(velocyto)分析学习(一)
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学领域,将新数据集映射到已建立的参考数据集上的能力,与读取映射工具变革基因组序列分析的方式如出一辙。
数据科学工厂
2024/04/02
3920
单细胞分析|Seurat中的跨模态整合
一个10x单细胞转录组项目从fastq到细胞亚群
这样的文件很明显没办法给我们跑单细胞转录组流程,看了看原文:《Single-cell RNA sequencing reveals B cell–related molecular biomarkers for Alzheimer’s disease》,其实在《单细胞天地》有它的介绍:单细胞测序揭示阿尔兹海默症的B细胞相关标志物
生信技能树
2022/03/03
2.3K0
一个10x单细胞转录组项目从fastq到细胞亚群
使用Seurat基于scRNA-seq分析scATAC-seq
Seurat 3.X版本能够整合scRNA-seq和scATAC-seq, 主要体现在:
生信技能树jimmy
2020/03/30
2.4K0
scATAC-seq建库原理,质控方法和新R包Signac的使用
NGS系列文章包括NGS基础、在线绘图、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程)、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step))、批次效应处理等内容。
生信宝典
2020/09/27
4.9K0
scATAC-seq建库原理,质控方法和新R包Signac的使用
你的单细胞数据集还可以分析体细胞突变
单细胞水平上的体细胞突变特征对于研究癌症进化、克隆镶嵌和细胞可塑性至关重要。传统的单细胞基因组测序方法在可扩展性和基因组丢失率方面存在挑战。另一策略是从scRNA-seq 和 scATAC-seq 检测体细胞突变,这种方法的主要优点是可以将细胞谱系映射到转录或调控程序,但由于不同细胞类型的基因表达差异、等位基因脱落事件、RNA 编辑、有限的覆盖深度和测序伪影,突变的检测受到严重限制。因此,现有算法检测体细胞突变具有局限性。因此,研究团队开发了一种名为SComatic的算法,旨在直接检测 scRNA-seq 和ATAC-seq(可及染色质序列测定)数据集中的体细胞突变,而无需匹配的大量或单细胞DNA测序数据。
生信菜鸟团
2024/07/31
5630
你的单细胞数据集还可以分析体细胞突变
BRCA1和BRCA2基因敲除小鼠的单细胞转录组
数据在 https://www.ncbi.nlm.nih.gov/bioproject/PRJNA632854 :
生信技能树
2020/12/03
1.2K0
BRCA1和BRCA2基因敲除小鼠的单细胞转录组
scATAC-seq分析之CellRanger-ATAC定量
现在来看看上游 cellranger atac定量吧,下次再看实验原理,再下次就看文献中的应用!
生信技能树
2025/04/18
4630
scATAC-seq分析之CellRanger-ATAC定量
推荐阅读
相关推荐
CellRanger ARC—单细胞RNAseq和ATAC联合分析套件
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档