前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >单细胞免疫组库基础介绍

单细胞免疫组库基础介绍

作者头像
生信技能树jimmy
发布于 2022-11-24 03:04:56
发布于 2022-11-24 03:04:56
2.1K00
代码可运行
举报
文章被收录于专栏:单细胞天地单细胞天地
运行总次数:0
代码可运行

分享是一种态度

免疫系统

免疫系统中主要包含两类淋巴细胞:B lymphocytes (B cells) 和 T lymphocytes (T cells)。B cells 和 T cells 的区别在于表达的 antigen receptor 的结构(structure),分别是B-cell receptor (BCR) 和 T-cell receptor (TCR)。

BCR:由两条重链(IgH)和两条轻链(Igκ,Igλ)组成。

TCR:由α、β两条肽链组成。BCR的重链包含1个可变区域(VH)和3个恒定区域(CH1/CH2/CH3),轻链包含1个可变区域(VL)和1个恒定区域(CL)。TCR的α、β两条肽链也包含可变区V和恒定区C。

可变区域(VH/VL)由三个互补决定区(complementarities determining region, CDR) CDR1、CDR2、 CDR3 和间隔的 4 个骨架区(framework region, FR)构成 。CDR1、 CDR2 和 FR 区域相对保守, CDR3 变异最大,并直接决定了 BCR/TCR 的抗原结合特异性。BCR/TCR 的 CDR3 由 V、 D、 J 三个基因编码,淋巴细胞的成熟过程中,通过 V、 D、 J 基因的重排形成了各种重组序列片段,由于 V、 D、 J 基因片段本身具有多样性,再加上体细胞突变、 V(D) J 区之间碱基的插入删除(Indel)等形成了 T/B 细胞的多样性。因此对于淋巴细胞多样性的研究便集中在了 CDR3 区多样性的研究。

基础知识理解

免疫组库:V(D)J序列多样性的集合即为免疫组库(Immune Repertoire, IR)

免疫组库测序目标:5‘转录组+V(D)J片段分析,可同时获得单细胞转录组以及免疫组库数据。(V(D)J区段在mRNA的5‘端)

V(D)J的区段的长度:通常是650bp左右。PE-150测序最多能测300bp。

V(D)J 基因的 Reads 比对:Reads 富集前,先使用 cutadapt 对 Read-pairs 去接头和引物序列。随后将 Read-pairs 比对到 V(D)J 基因片段上,只有比对上的 read 用于后续的组装。其中 read 比对要求:比对得分超过 20;至少有 15bp 能够精确匹配到参考序列。

Contig:一致性序列组装得到的contigs序列。组装的过程中,每个 barcode 是独立进行分析的。对过滤后的 read 按照 barcode 分组,其中每个 barcode 至多有 100k 的 reads 用于组装,避免人为因素影响导致的极高覆盖度情况。且仅使用有多于 10 个 reads 的 UMI 的 read 用于组装,最后获得 contigs 序列。

组装后的有效细胞数:有效的细胞数的估计与表达靶向 V(D)J 转录本相关,要求 barcode 有一个 contig 能够有至少 2 个具有足够 reads 支持的 UMI。

contigs注释:使用 Smith-Waterman 将每个细胞中每个组装的 congtigs 与所有的参考序列(V , D, J, C 和 5'UTR )逐一进行比对。

contigs有效性评价

  1. 完全跨越 V 和 J 部分,否则为无效 “None”;
  2. 在预定的 V 位置包含可识别的起始密码子。如果没有找到起始密码子,则认为是无效的 “False”;
  3. 在 V 起始密码子框内包含一个 CDR3 区域。如果没有发现 CDR3,则被认为是无效的;
  4. 在 V - J 跨越区不含终止密码子。如果发现终止密码子,则被认为是无效的。理想情况下,每个 Barcode 包含两个匹配的有效的 contigs,由 1 个 TRA 和 1 个 TRB 或 1 个重链( IGH)和 1 个轻链( IGK 或 IGL)构成。

Clonotypes克隆型:通过精确的核苷酸匹配,把拥有完全相同的有效 CDR3 核酸序列的 Cell barcodes 组合在一起, 成为克隆型。

clonotype的丰度:细胞支持数(barcode个数)即为clonotype丰度。

consensus 序列:所有细胞中拥有相同的有效 CDR3 核酸序列的 contig 组装在一起的最终序列,被称为共有序列。即把某个 clonotype 的所有 contig 组装在一起得到的序列成为 consensus 序列

克隆型的多样性:克隆型中的 V-J 基因组合方式的多样性就是克隆型的多样性。

cellranger mkvdjref

VDJ的参考基因组需要使用 cellranger mkvdjref重新构建。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ tree /opt/genome/refdata-gex-GRCh38-2020-A/
/opt/genome/refdata-gex-GRCh38-2020-A/
├── fasta
│   ├── genome.fa
│   └── genome.fa.fai
├── genes
│   └── genes.gtf
├── pickle
│   └── genes.pickle
├── reference.json
└── star
    ├── chrLength.txt
    ├── chrNameLength.txt
    ├── chrName.txt
    ├── chrStart.txt
    ├── exonGeTrInfo.tab
    ├── exonInfo.tab
    ├── geneInfo.tab
    ├── Genome
    ├── genomeParameters.txt
    ├── SA
    ├── SAindex
    ├── sjdbInfo.txt
    ├── sjdbList.fromGTF.out.tab
    ├── sjdbList.out.tab
    └── transcriptInfo.tab
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ cellranger mkvdjref --genome GRCh38_release95 --fasta /path/genome/Homo_sapiens/GRCh38_release95/Homo_sapiens.GRCh38_release95.genome.fa --genes Homo_sapiens.GRCh38.95.gtf
$ tree
.
└── GRCh38_release95
    ├── fasta
    │   └── regions.fa
    └── reference.json
    
$head GRCh38_release95/fasta/regions.fa
>1|IGHE ENST00000390541|IGHE|C-REGION|IG|IGH|E|00
GCCTCCACACAGAGCCCATCCGTCTTCCCCTTGACCCGCTGCTGCAAAAACATTCCCTCCAATGCCACCTCCGTGACTCTGGGCTGCCTGGCCACGGGCTACTTCCCGGAGCCGGTGATGGTGACCTGGGACACAGGCTCCCTCAACGGGACAACTATGACCTTACCAGCCACCACCCTCACGCTCTCTGGTCACTATGCCACCATCAGCTTGCTGACCGTCTCGGGTGCGTGGGCCAAGCAGATGTTCACCTGCCGTGTGGCACACACTCCATCGTCCACAGACTGGGTCGACAACAAAACCTTCAGCGTCTGCTCCAGGGACTTCACCCCGCCCACCGTGAAGATCTTACAGTCGTCCTGCGACGGCGGCGGGCACTTCCCCCCGACCATCCAGCTCCTGTGCCTCGTCTCTGGGTACACCCCAGGGACTATCAACATCACCTGGCTGGAGGACGGGCAGGTCATGGACGTGGACTTGTCCACCGCCTCTACCACGCAGGAGGGTGAGCTGGCCTCCACACAAAGCGAGCTCACCCTCAGCCAGAAGCACTGGCTGTCAGACCGCACCTACACCTGCCAGGTCACCTATCAAGGTCACACCTTTGAGGACAGCACCAAGAAGTGTGCAGATTCCAACCCGAGAGGGGTGAGCGCCTACCTAAGCCGGCCCAGCCCGTTCGACCTGTTCATCCGCAAGTCGCCCACGATCACCTGTCTGGTGGTGGACCTGGCACCCAGCAAGGGGACCGTGAACCTGACCTGGTCCCGGGCCAGTGGGAAGCCTGTGAACCACTCCACCAGAAAGGAGGAGAAGCAGCGCAATGGCACGTTAACCGTCACGTCCACCCTGCCGGTGGGCACCCGAGACTGGATCGAGGGGGAGACCTACCAGTGCAGGGTGACCCACCCCCACCTGCCCAGGGCCCTCATGCGGTCCACGACCAAGACCAGCGGCCCGCGTGCTGCCCCGGAAGTCTATGCGTTTGCGACGCCGGAGTGGCCGGGGAGCCGGGACAAGCGCACCCTCGCCTGCCTGATCCAGAACTTCATGCCTGAGGACATCTCGGTGCAGTGGCTGCACAACGAGGTGCAGCTCCCGGACGCCCGGCACAGCACGACGCAGCCCCGCAAGACCAAGGGCTCCGGCTTCTTCGTCTTCAGCCGCCTGGAGGTGACCAGGGCCGAATGGGAGCAGAAAGATGAGTTCATCTGCCGTGCAGTCCATGAGGCAGCAAGCCCCTCACAGACCGTCCAGCGAGCGGTGTCTGTAAATCCCGGTAAA
>2|TRBV28 ENST00000390400|TRBV28|L-REGION+V-REGION|TR|TRB|None|00
ATGGGAATCAGGCTCCTCTGTCGTGTGGCCTTTTGTTTCCTGGCTGTAGGCCTCGTAGATGTGAAAGTAACCCAGAGCTCGAGATATCTAGTCAAAAGGACGGGAGAGAAAGTTTTTCTGGAATGTGTCCAGGATATGGACCATGAAAATATGTTCTGGTATCGACAAGACCCAGGTCTGGGGCTACGGCTGATCTATTTCTCATATGATGTTAAAATGAAAGAAAAAGGAGATATTCCTGAGGGGTACAGTGTCTCTAGAGAGAAGAAGGAGCGCTTCTCCCTGATTCTGGAGTCCGCCAGCACCAACCAGACATCTATGTACCTCTGTGCCAGCAGTTTATG
>3|IGHD4-4 ENST00000414852|IGHD4-4|D-REGION|IG|IGH|None|00
TGACTACAGTAACTAC
>4|IGHV4-39 ENST00000390619|IGHV4-39|L-REGION+V-REGION|IG|IGH|None|00
ATGGATCTCATGTGCAAGAAAATGAAGCACCTGTGGTTCTTCCTCCTGCTGGTGGCGGCTCCCAGATGGGTCCTGTCCCAGCTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCATCAGCAGTAGTAGTTACTACTGGGGCTGGATCCGCCAGCCCCCAGGGAAGGGGCTGGAGTGGATTGGGAGTATCTATTATAGTGGGAGCACCTACTACAACCCGTCCCTCAAGAGTCGAGTCACCATATCCGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGCTCTGTGACCGCCGCAGACACGGCTGTGTATTACTGTGCGAGA
>5|TRAV1-1 ENST00000542354|TRAV1-1|L-REGION+V-REGION|TR|TRA|None|00
ATGTGGGGAGCTTTCCTTCTCTATGTTTCCATGAAGATGGGAGGCACTGCAGGACAAAGCCTTGAGCAGCCCTCTGAAGTGACAGCTGTGGAAGGAGCCATTGTCCAGATAAACTGCACGTACCAGACATCTGGGTTTTATGGGCTGTCCTGGTACCAGCAACATGATGGCGGAGCACCCACATTTCTTTCTTACAATGCTCTGGATGGTTTGGAGGAGACAGGTCGTTTTTCTTCATTCCTTAGTCGCTCTGATAGTTATGGTTACCTCCTTCTACAGGAGCTCCAGATGAAAGACTCTGCCTCTTACTTCTGCGCTGTGAGAGA

cellranger vdj

BCR的fastq数据格式如下。包含I1,I2,R1,R2四个文件。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ ll data/sc5p_v2_hs_PBMC_10k_b_fastqs/
total 4355360
-rw-r--r-- 1 156607322 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L001_I1_001.fastq.gz
-rw-r--r-- 1 182936492 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L001_I2_001.fastq.gz
-rw-r--r-- 1 386947795 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L001_R1_001.fastq.gz
-rw-r--r-- 1 944440175 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L001_R2_001.fastq.gz
-rw-r--r-- 1 157303860 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L002_I1_001.fastq.gz
-rw-r--r-- 1 182417776 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L002_I2_001.fastq.gz
-rw-r--r-- 1 386954157 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L002_R1_001.fastq.gz
-rw-r--r-- 1 939676846 Jul 11 00:34 sc5p_v2_hs_PBMC_10k_b_S1_L002_R2_001.fastq.gz
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$  cellranger vdj --id=sc5p_v2_hs_PBMC_10k_b_fastqs --fastqs=/path/VDJ/data/sc5p_v2_hs_PBMC_10k_b_fastqs/ --reference=/path/vdjref/GRCh38_release95/

结果目录

all_contig* :所有contig相关的文件

consensus*:一致性序列相关的文件

filtered_contig *:过滤后的contig相关的文件

clonotypes.csv:克隆型相关信息

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 单细胞天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
10X Genomics单细胞免疫组库VDJ分析必知必会
我们生活着的世界并非只有我们自己,而是有很多小于或大于我们的生物不断与我们交互着,有的让我们开心,有的使我们伤心。这就关系到一个本质的问题:
生信技能树jimmy
2020/05/29
7.8K0
10X Genomics单细胞免疫组库VDJ分析必知必会
单细胞免疫组库数据分析||Seurat整合单细胞转录组与VDJ数据
在做10X单细胞免疫组库分析的是往往是做一部分BCR、TCR做一部分5‘转录组,那么怎样才能把两者结合到一起呢?
生信技能树jimmy
2020/06/05
4.3K0
scRepertoire||单细胞免疫组库分析:R语言应用(一)
10× Genomics单细胞免疫组库VDJ分析必知必会(https://www.jianshu.com/p/db4831091a5c) 免疫组库数据分析||immunarch教程:快速开始(https://www.jianshu.com/p/9d7711879bf5) 免疫组库数据分析||immunarch教程:克隆型分析(https://www.jianshu.com/p/287f890d7ef4) 免疫组库数据分析||immunarch教程:探索性数据分析(https://www.jianshu.com/p/dd4fcfb63627) 免疫组库数据分析||immunarch教程:载入10X数据(https://www.jianshu.com/p/7379d0a809a8) 免疫组库数据分析||immunarch教程:GeneUsage分析(https://www.jianshu.com/p/0dbdd6733b34) 免疫组库数据分析||immunarch教程:Diversity 分析(https://www.jianshu.com/p/8b846094c092) 免疫组库数据分析||immunarch教程:Clonotype tracking(https://www.jianshu.com/p/79ee2c5871a7) 免疫组库数据分析||immunarch教程:Clonotypes annotation(https://www.jianshu.com/p/effc2ad05f47) 免疫组库数据分析||immunarch教程:Kmer 与 Motif 分析(https://www.jianshu.com/p/f2b7d0153432)
生信技能树jimmy
2020/09/21
5.7K0
scRepertoire||单细胞免疫组库分析:R语言应用(一)
scRepertoire||单细胞免疫组库分析:R语言应用(二)
通过检查克隆空间,我们可以有效地观察特定比例下克隆所占的相对空间。另一种思考方法是把整个免疫受体测序看作一个量杯(总量)。在这个杯子里,我们将填充不同粘度的液体-或不同数量的克隆比例。克隆空间内稳态是问以不同比例(或者是不同粘度的液体,类推)填充的克隆杯子的百分比是多少。比例切点在函数中cloneType变量下设置,可以进行调整,以下为基准:
生信技能树jimmy
2020/09/23
3.5K0
scRepertoire||单细胞免疫组库分析:R语言应用(二)
探索人类肠道免疫细胞图谱
当然,scanpy的分析都是可以做的,关键是找到有意思的生物学解释。其实,这个数据中大量的免疫组库的信息,我们并没有去利用。
生信技能树jimmy
2020/11/25
6140
探索人类肠道免疫细胞图谱
使用MiXCR进行免疫组库分析
接下来又认识了免疫组库测序数据,知道了免疫组库测序数据的一些特性,并且使用igblast进行免疫组库分析了,但是那个是初步的比对,虽然找到每一个测序片段的V,D(可选),J,C基因,并且拿到 CDR3序列,中间步骤有点多,常规的测序数据过滤就算了,还需要把PE数据合并,fastq格式转为fasta格式,而且本身igblast软件就很难使用,数据库文件构建也繁琐。其实也有包装好的一站式流程。
生信技能树
2020/06/03
2.9K0
SeekSoulTools — 单细胞转录组学一站式分析工具
SeekSoulTools 是寻因生物自主开发的一套处理单细胞转录组数据的软件,用于识别细胞标签barcode,比对定量,得到可用于下游分析的细胞表达矩阵,之后进行细胞聚类和差异分析,产品不仅支持SeekOne系列试剂盒产出数据,还可通过对barcode的描述,支持各种自定义设计结构。软件使用教程已经写的很好了,这边仅仅是作为知识的搬运工,记录一下测试体验过程。
生信菜鸟团
2024/07/10
5760
SeekSoulTools — 单细胞转录组学一站式分析工具
单细胞免疫组库VDJ| 从零开始scRepertoire分析,解决真实场景中可能的问题
经过前面单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析(1)中的cellranger count 和 cellranger vdj的分析后,得到了单细胞转录组 和 单细胞TCR的结果数据 。考虑到样本数太多,选择既有RNA又有TCR样本的数据进行后续分析。重点解决以下三个小问题
生信补给站
2023/08/25
6.7K0
单细胞免疫组库VDJ| 从零开始scRepertoire分析,解决真实场景中可能的问题
cellranger multi—手把手教你单细胞免疫组库定量
单细胞免疫组库 是一种基于单细胞测序技术的高精度研究方法,用于解析免疫细胞(如T细胞、B细胞)的抗原受体(TCR/BCR)序列及其转录组特征。传统bulk测序无法揭示细胞异质性,而单细胞技术可精准识别克隆型分布、分化轨迹及功能状态,为免疫机制研究提供分子级分辨率。
生信菜鸟团
2025/03/18
2040
cellranger multi—手把手教你单细胞免疫组库定量
通过IMGT数据库认知免疫组库
有趣的是,最近突然接到了一些粉丝求助,关于免疫组库数据处理的。所以就系统性的整理一下相关知识点,并且带领大家实战演练一个完整的免疫组库测序数据项目分析流程哈。
生信技能树
2020/04/27
3.9K1
课前准备---单细胞VDJ分析导论2
单细胞T细胞和B细胞抗原受体测序数据分析可以潜在地对适应性免疫细胞进行深入评估,从而为了解免疫细胞的发育提供信息,从而跟踪疾病和治疗中的克隆扩增。然而,由于数据的复杂性和潜在的生物学特性,在单细胞水平上分析和解释T细胞和B细胞及其适应性免疫受体谱一直是极具挑战性的。
追风少年i
2024/07/02
4500
课前准备---单细胞VDJ分析导论2
10X空间转录组之免疫组库分析
疫情即将过去,大家期间过的怎么样?无论疫情如何,科研一直在路上,并且在不断的推陈出新,而我们今天要分享的就是10X空间转录组的免疫组库分析。
生信菜鸟团
2022/05/24
1.4K0
10X空间转录组之免疫组库分析
课前准备---单细胞VDJ分析导论
3、BCR/TCR clustering and filtering TCR/BCR克隆型是指具有相同(TCR)或相似(BCR)受体的细胞。 4、与单细胞转录组联合分析
追风少年i
2024/07/01
1940
课前准备---单细胞VDJ分析导论
利用cellranger分析单细胞数据
当前的单细胞测序主要采用 illumina 测序平台进行测序,一般为双末端测序,测序完成之后首先需要对 illumina 测序数据进行质控过滤,过滤条件与其他分析类似。需要注意的是,虽然单细胞测序也是双末端测序,但是 reads1 中通常为 barcode+umi 序列,reads2 为转录本序列。
生信喵实验柴
2022/10/25
2.8K0
利用cellranger分析单细胞数据
huARdb:单细胞水平克隆型-转录组分析的人类抗原受体数据库
人类适应性免疫系统是免疫系统的一个分支,负责特定抗原识别和清除。通过与特定抗原的相互作用,适应性免疫系统被激活,并可以存储针对目标抗原的长期免疫记忆。因此,具有高抗原特异性的长期免疫记忆可以在随后暴露于抗原期间产生更强大的反应。适应性免疫反应激活需要 T 或 B 细胞上表达的受体识别抗原,分别称为 T 细胞受体 (TCR) 或 B 细胞受体 (BCR)。
生信技能树jimmy
2022/03/14
9280
huARdb:单细胞水平克隆型-转录组分析的人类抗原受体数据库
单细胞免疫组库VDJ|和Nature学STARTRAC,定量T细胞动态变化
STARTRAC是发表于2018年的NATRUE 文章(Lineage tracking reveals dynamic relationships of T cells in colorectal cancer)中的分析方法,可以应用于单细胞免疫组库数据来揭示T细胞动态变化的分析。原理假设认为克隆型一致的细胞来源一致,可以定量刻画T细胞的组织分布、克隆扩增、组织迁移和状态变化等。
生信补给站
2023/08/25
4K0
单细胞免疫组库VDJ|和Nature学STARTRAC,定量T细胞动态变化
单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析(1)
scTCR可以更细致的获取肿瘤免疫微环境的变化,比如单细胞转录组可以获取不同样本,不同分组(癌和癌旁,是否治疗,是否响应)的celltype组成,可以知道哪些celltype发生变化。
生信补给站
2023/08/25
2.3K0
单细胞免疫组库VDJ|从数据下载开始完成cellranger vdj分析(1)
单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵
cellranger count 管道将FASTQ文件中的测序结果与参考转录组进行比对,并生成一个.cloupe文件,用于在Loupe Browser中进行可视化和分析,同时还生成了一些与其他公开工具兼容的输出,用于进一步分析。
DoubleHelix
2022/06/13
3.5K0
单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵
单细胞实战(三) Cell Ranger使用初探
然后利用Filezilla下载其中SRR7722937的R1、R2的html,打开看下
生信技能树jimmy
2020/03/27
7.3K1
特殊物种cellranger基因组质量评估
序列文件就是基因组的序列以fa格式存储,这里我们看到在GRCh38版本中染色体两端加了很多N。 从序列文件我们可以得到什么?
生信技能树jimmy
2020/06/04
1.3K0
特殊物种cellranger基因组质量评估
推荐阅读
相关推荐
10X Genomics单细胞免疫组库VDJ分析必知必会
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验