首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >全基因组 - 人类基因组变异分析(PacBio) (1)

全基因组 - 人类基因组变异分析(PacBio) (1)

原创
作者头像
三代测序说
修改于 2023-10-19 09:07:02
修改于 2023-10-19 09:07:02
6940
举报
文章被收录于专栏:三代测序-说三代测序-说

破解人类基因密码的三代测序技术:

2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作。

Science 封面文章:人类基因组完成图|Science 杂志
Science 封面文章:人类基因组完成图|Science 杂志

而在这项宏伟的计划背后,以 PacBio、ONT 为代表的第三代基因测序技术,以及同时发展起来的三代测序生物信息学技术,也走入人们的视野,作为破解人类基因组奥秘的最新武器,其在解决人类遗传性疾病、罕见病和肿瘤等领域的巨大潜力,也让第三代基因测序赛道逐渐成为投资关注的热点和创业新方向。

经过测序技术的不断发展,相比于上一代测序技术,第三代基因测序技术在读长方面拥有绝对优势,突破了过去技术上无法突破的高重复区域和高多态性区域,为人类「生命密码」的真正完整的解锁提供了全新解决方案。

全基因组版块先主要以人类重测序分析为主,后期陆续加入小鼠,动植物(挖坑,思路和使用软件类似)。

人类基因组变异分为单核苷酸或单碱基变异SNV/SNPs (single nucleotide variation,SNV; single nucleotide polymorphisms, SNPs),小片段的插入缺失,结构变异(大片段的插入缺失,到位,易位等)。如下图所示:

人类基因组变异情况(GRch38)
人类基因组变异情况(GRch38)

短读长测序(二代测序)数据对于SNV/SNPs 或者小片段的插入缺失在难以比对和串联重复区域有些变异是无法测到的(技术本身原因)。

NGS, next generation sequecing
NGS, next generation sequecing

短读长测序(二代测序)数据对于50-80%的结构变异是无法测到的(测序技术本身原因)。

NGS, next generation sequecing
NGS, next generation sequecing

三代测序本身因为长读长,能够改善二代测序难以检测或者准确检测的突变区域和类型。

三代测序能够改善二代测序的不足
三代测序能够改善二代测序的不足

因此,三代测序技术(长度长)能解决基因组上二代测序无法解决的痛点,以下是一些三代测序在人类遗传学和疾病方向的应用场景(有待进一步完善):

  1. 复合免疫基因对疾病相关研究的影响( MHC基因复合物含有大量拷贝数变异)。
  2. 癌症基因组还包括大规模结构变异,例如大的插入、缺失、逆转、重复、易位和基因融合, 使得三代测序及分析能够提供有关癌症基因组复杂性最全面的观点。
  3. 神经系统、神经肌肉和神经退行性疾病,如重复扩增,拷贝数变异区域。

本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见!

PacBio人类基因组变异分析流程图
PacBio人类基因组变异分析流程图

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv
染色体结构变异(Structure Variation, SV),指基因组上发生的长度大于50bp的大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV)、易位(Translocation)、重复(Duplication, DUP)等类型的变异,其中占比最大的就是大片段的插入和缺失(图1)。插入缺失很好理解就是,多了一段或者少了一段DNA序列;重复就是有一段区域的序列重复出现;倒位就是序列翻转了一下,如本来那个位置该是AATTG的,结果变成了GTTAA;易位的话就是序列位置的变化,又进一步分为染色体内易位和染色体间易位。据统计,基因组结构变异可能导致的遗传性疾病已经超过1,000种,对于每个人来讲其基因组都有至少20,000个的结构变异,这些变异带来的影响或许比SNVs或InDels带来的影响更大。
三代测序说
2023/11/22
1.6K0
全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv
基于PacBio HiFi数据的人类全基因组重测序变异分析流程
随着第三代测序技术,特别是PacBio HiFi(High Fidelity)测序技术的发展,我们能够获得兼具长读长和高准确度的测序数据。这为人类全基因组重测序(WGS)分析,尤其是复杂区域和结构性变异(Structural Variation, SV)的检测,带来了革命性的进步。本文旨在梳理一套完整的利用PacBio Sequel II或Revio平台产生的HiFi数据进行人类基因组变异分析的流程,详细介绍从原始数据处理、序列比对、变异检测、注释、过滤到可视化的各个环节,并涵盖所涉及的关键软件工具(如pbmm2, DeepVariant, pbsv, Annovar, SnpEff, AnnotSV, SnpSift, Slivar, IGV)的安装与使用细节。
天意生信云
2025/04/22
5620
基于PacBio HiFi数据的人类全基因组重测序变异分析流程
全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指的是基因组中单个核苷酸腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)在物种成员之间或个体配对染色体之间的差异, 是最常见也最简单的一类造成基因组多样性的DNA序列变异。
三代测序说
2023/11/12
2K2
全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant
基因组 | Nat.Rev.Genet | 人类基因组中结构变异的多样性及其后果
◉ 基因组变异通常根据变异等位基因所改变的核苷酸数量进行分类。◉ 尽管这些类别的确切划分并不精确,并且基于半任意的阈值而有所不同,但人类遗传学领域已达成共识,将涉及少于50个核苷酸的变异归为‘短’变异(有时也称为序列变异),而所有其他涉及≥50个核苷酸的变异则归为结构变异(SVs)。◉ 短变异仅包括两个不同类别:单核苷酸变异和短插入或缺失(统称为indels)。◉ 总的来说,平均每个人的基因组中大约存在四百万个短变异。◉ 相比之下,结构变异包含更为多样化的突变类别和子类,每种都有其特有的替代等位基因结构和独特性质。◉ 结构变异可以进一步划分的一个主要标准是其变异等位基因是否涉及总共小于50个碱基对的基因组增益或损失,这将‘平衡’结构变异(如倒位)与‘非平衡’结构变异(如缺失、重复和大型串联重复)区分开来。◉ 建立一个适用于所有结构变异的统一分类系统已被证明具有挑战性,部分原因在于难以用单一技术或检测方法鉴定所有结构变异,这一问题已在别处进行了近期综述。◉ 在本图中,指明了能够捕捉每个结构变异类别的技术;浅色六边形表示使用传统方法无法可靠检测该类别中大多数结构变异的技术。◉ 过去二十年的人类基因组研究中显示出一个普遍趋势:变异大小与人群中的丰度之间存在强烈的负相关关系。◉ 极端情况下,染色体级别的异常(即相互易位)在不到1%的个体中被观察到。◉ delINVdel,配对-缺失倒位;DUP-TRP/INV-DUP,重复-倒置三倍重复-重复;HERV,人类内源性逆转录病毒;INVdup,倒置重复;LINE,长散布元件;mCNV,多等位拷贝数变异;Med.,中位数;SINE,短散布元件;STR,短串联重复;SVA,SINE-可变数目串联重复-Alu;VNTR,可变数目串联重复。
生信菜鸟团
2025/07/12
2840
基因组 | Nat.Rev.Genet | 人类基因组中结构变异的多样性及其后果
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
长读段比对算法与一代/二代测序数据的比对算法有很大的不同,因为长读段通常更长、包含更多错误和变异,并且需要更复杂的比对策略。
三代测序说
2023/10/26
1.7K1
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
全基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV
基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV)、易位(Translocation)、重复(Duplication, DUP)等类型的变异。第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。结构变异往往会对基因结构和表达产生更大的影响,在遗传病和肿瘤的发生发展中扮演了重要角色,因此发现和正确注释结构变异对于疾病的诊断有着至关重要的意义。
三代测序说
2023/12/09
1.1K4
全基因组 -  人类基因组变异分析 (PacBio)(7)-- AnnotSV
群体遗传学习笔记:NGS结构变异检测原理
随着测序的成本越来越低,测序技术越发先进,除了研究单核苷酸多态性(SNP)。研究者们开始慢慢将目光转向了各位复杂,但是也同样非常常见的结构变异(SV)。接下来几期推文会和大家一起学习结构变异的检测原理,然后通过一系列的实战演练和大家一起熟悉一些相关的工具和流程。
生信菜鸟团
2020/06/02
2.4K0
破译诊断密码:长读长测序,点亮临床精准诊断新未来
在现代医学实践中,仍有相当一部分遗传病患者及其家庭深陷漫长的诊断困境,历经多轮检测仍无法明确病因。传统的二代测序(NGS),虽在成本和通量上占据优势,但其短读长的固有局限性,在面对基因组的复杂“角落”——如结构变异(SVs)、串联重复序列异常扩增、复杂单倍型时,往往难以提供完整且准确的答案,导致诊断瓶颈。
天意生信云
2025/04/04
2170
破译诊断密码:长读长测序,点亮临床精准诊断新未来
破译诊断密码:长读长测序,点亮临床精准诊断新未来
天意生信云平台始终致力于为生命科学领域的科研人员与临床工作者提供高质量的学习资源与交流平台。我们深知,在技术日新月异的今天,仅仅掌握理论知识是远远不够的,系统性的学习、规范性的操作以及实战性的技能训练同样至关重要。特别是在三代测序这一前沿技术领域,深入理解其原理并掌握实际应用能力,已成为推动研究突破和临床诊断革新的关键。
用户11203141
2025/04/04
2150
破译诊断密码:长读长测序,点亮临床精准诊断新未来
全球首个“个人参考基因组服务计划(PRGSP)”正式启动
北京时间2018年3月31日晚间,北京希望组生物科技有限公司(以下简称“希望组”)在南京举行的第五届NGS创新开发者大会,与北京基云惠康科技有限公司(以下简称“基云惠康”)共同宣布启动“个人参考基因组服务计划(Personal Reference Genome Service Project)”,开始面向全球市场提供全新的“个人参考基因组”服务。 该服务计划将采用最新的ONT GridION/PromethION、Bionano Saphyr、Illumina、10X Genomics测序、以及高分辨率的生物芯片平台,对每一个样本采用多种平台进行检测,通过基因组组装,并进行Phasing,得到一个二倍体(Diploid)的个人参考基因组,最后SNP/InDel/SV/STR/Methylation五种变异同时进行检测,从而在全球范围率先重新定义“全基因组测序(WGS)”的技术标准,宣告了“个人参考基因组”时代的到来。 在二代测序成为主流的当前,全基因组测序(WGS)一般指将样本进行30X的二代测序,再将测序数据与人类参考基因组序列进行比对,识别SNP和InDel,以及少部分CNV和STR,这样的检测已经成为二代测序遗传病诊断、孕前携带者筛查等应用领域的事实最高测序标准。但是,我们也非常清楚,人类基因组中,超过了50%的序列是重复序列,基于二代测序的全基因组测序(WGS),并不能有效检测重复区域的基因组变异;另外,非常重要的,也是一直被忽视的,人类基因组变异,不仅仅包括单碱基变异(SNV),还存在大量的结构变异(SV/CNV)、串联重复序列(STR)和碱基甲基化修饰,而基于二代测序的全基因组测序(WGS),漏掉了大量的这些类型的变异,从而导致了所谓的“基因组暗物质”现象;进而也可以解释,全基因组测序(WGS),在遗传病诊断领域,至今阳性检出率也仅能达到50%左右,远远低于理想的目标。 而以三代测序和光学图谱为主要亮点的“个人参考基因组”,采用了超长读长的数据:将Oxford Nanopore数据进行组装,得到高完整度的Contig,再将Bionano DLS数据进行Scaffolding,最后用Illumina数据对参考基因组的部分错误进行矫正,再结合10X技术的数据,对基因组数据进行Phasing,从而得到高质量的、二倍体的个人参考基因组图谱;然后,基于个人参考基因组,将illumina数据用于SNP和InDel的识别,将Nanopore的数据进行SV/STR/Methylation的识别,将Bionano的数据用于SV的识别,再用生物芯片的数据对上述变异进行验证,综合所有这些数据和结果,形成“个人全谱变异集”。 个人参考基因组将作为今后新生儿的基础数据,可以成为肿瘤早筛非常重要的对比资料;个人参考基因组,还可以应用到复杂遗传病的诊断、孕前携带者筛查等领域;个人参考基因组中部分“个人特有”的序列,将作为我们理解人类进化、个人特征起到非常重要的作用。 根据目前的规划,希望组与基云惠康将构建大规模的测序和分析平台,从而达到2-3年内完成1万个样本(第一阶段: 10K)和3-10年内完成一千万(第二阶段:10M)个样本的个人参考基因组服务能力。限于生产和研发成本的原因,目前在中国提供“个人参考基因组”服务,将收费10万人民币/样本,在全球其他国家将收费2万美元,目前已经可以面向全球提供这种最新的技术服务。 希望组CEO汪德鹏先生表示,我们是一家“不去模仿、不去跟随、只想去创造、开创未来”的企业,是世界领先的专注于将三代测序技术应用于遗传病和肿瘤检测的企业。早在2016年,我们已经参与完成了第一个参考序列级的中国人参考基因组“华夏一号”项目,此次“个人参考基因组服务计划”的启动,旨在利用更新的技术、更全面的方案检测并注释个人全谱变异类型,开启基因组医学领域的新时代。 基云惠康CEO郝向稳先生表示,GeneKang专注于个人全基因组数据分析、解读与基因应用开发,在全基因组解读知识库构建及相应的技术工具开发上持续投入,致力于让基因数据成为健康生活的基础设施,改善大众健康。“个人参考基因组服务计划”与我们的初衷不谋而合,获取个人基因组的“真实面目”并且能够对其蕴含的信息进行解读,相信该项目必将推动基因组学事业的发展,揭秘生命更多的“内幕”, 使基因检测技术能够真正的造福大众(一览.医械,跟踪报道)
生信技能树
2018/07/27
4660
跨越短读长局限:三代长读长测序在科研与临床的未来五年机遇
在本篇推文中,我们将首先聚焦三代测序技术本身,深入探讨其相较于传统方法的革命性优势、关键应用场景以及未来五年的发展机遇。希望通过这篇前瞻性的解读,能为您理解后续的实战培训内容、把握技术前沿打下坚实的基础。
天意生信云
2025/04/02
3380
跨越短读长局限:三代长读长测序在科研与临床的未来五年机遇
Nature重大突破:科学家成功完成Y染色体测序,标志着人类基因组的完整解读
这张扫描电子显微镜图像显示了一对连接的Y染色体(右)与一对连接的X染色体相比,在细胞分裂前期时重复的Y染色体(右)小了多少。图片来源:BIOPHOTO ASSOCIATES/SCIENCE SOURCE
生信宝典
2023/08/30
3320
Nature重大突破:科学家成功完成Y染色体测序,标志着人类基因组的完整解读
人类基因组时代的泛基因组学
今天想分享一个主题:人类基因组时代的泛基因组学。主要内容源自今年《Nature Reviews Genetics》上一篇题为《Pan-genomics in the human genome era》的文章。
黄树嘉
2020/09/29
1.1K0
人类基因组时代的泛基因组学
Nature | 基于四代家系参考的人类新生突变率
◉ 我们使用五种正交的下一代和长读长测序技术对四代系谱CEPH 1463中的28名成员进行了测序:对于G2至G4代,采用HiFi测序、Illumina和Element测序技术对其外周血进行了分析;而对于G1至G3代,则利用可用的永生化淋巴细胞系生成了UL-ONT和Strand-seq数据。该系谱数据集已被扩展,纳入了第四代以及G3代的配偶(编号为200080和200100)。◉ 该研究采用了多种先进的基因组测序平台,确保在不同世代之间获得全面且高精度的遗传信息,从而增强了对遗传变异传递模式的理解。
生信菜鸟团
2025/07/12
2800
Nature | 基于四代家系参考的人类新生突变率
69 种基于全基因组测序数据分析结构变异的算法评估
在今年的 6 月份,基因组学领域的权威期刊Genome Biology发表了一篇方法学评估类文章,在这篇文章中作者系统地分类和评估了目前主要的69种基于全基因组测序(whole genome sequencing,WGS)数据分析结构变异的算法/方法:Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing [1]。
用户6317549
2019/10/28
2.4K0
69 种基于全基因组测序数据分析结构变异的算法评估
三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?
在上一期(三代测序技术100问(1):NGS与第三代测序,如何做出明智选择?)中,我们厘清了二代与三代测序技术的适用边界,明确了选择需“因题施策”。然而,踏入三代测序的大门,新的抉择又摆在面前:目前市场上主流的长读长技术平台主要由两大阵营引领——美国的PacBio(Pacific Biosciences)和英国的ONT(Oxford Nanopore Technologies)。它们的技术原理、性能特点和应用侧重各有千秋,常常让研究者们,特别是准备首次尝试三代测序的团队感到选择的困惑。
天意生信云
2025/04/24
5810
三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?
斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
---- 新智元报道   编辑:桃子 袁榭 拉燕 【新智元导读】近日,斯坦福大学研究团队把人类DNA测序的时间缩短至5小时2分钟,重新定义了人类基因组测序速度! DNA测序时间减半,还创下了最新吉尼斯世界纪录!近日,斯坦福大学研究团队完成了利用人工智能计算加速工作流程的「DNA巨量测序」技术。 最新研究已于1月12发表在《新英格兰医学杂志》上。 论文地址:https://www.nejm.org/doi/full/10.1056/NEJMc2112090 此研究中处理速度最快的病例样本仅用了5小时2
新智元
2022/03/04
4770
文献解读-基准与方法研究-第十五期|《不同 DNA 测序平台的标准化比较》
二代测序(NGS)已广泛应用于许多实验室的临床试验,并提供广泛的应用,从靶向肿瘤学组合到用于细菌分类的宏基因组测序,再到基于群体的全基因组测序。第三代测序技术可以对长度为数千个碱基对的长读长(LR)进行测序,也可以检测更大的结构变化(例如,易位,倒置,重复)。LR测序的一个优点是能够解析基因组中难以测序的区域,其中存在大量重复序列,这些区域可能难以与参考基因组进行正确比对。直到最近才在临床实验室测试的背景下对SR和LR技术进行大规模全面比较。
INSVAST
2024/07/09
2340
文献解读-基准与方法研究-第十五期|《不同 DNA 测序平台的标准化比较》
MP长篇综述 | 植物泛基因组及其应用
2022年12月15日,中山大学史俊鹏副教授、中国科学院遗传与发育生物学研究所田志喜研究员、中国农业大学赖锦盛教授和上海师范大学黄学辉教授共同撰文,在Molecular Plant杂志发表了题为“Plant pan-genomics and its applications”的长篇综述。该论文对植物中泛基因组产生的源动力、表征、分析方法以及在植物遗传学和育种中的应用进行了系统总结和展望。
生信宝典
2023/08/30
7530
MP长篇综述 | 植物泛基因组及其应用
Sentieon 项目文章 | 长读长基因组测序在神经发育障碍分子诊断中的应用
神经发育障碍(NDDs)是异质性的疾病,会导致身体和智力的障碍。该疾病困扰着全球1-3%的儿童。
INSVAST
2025/06/12
1521
Sentieon 项目文章 | 长读长基因组测序在神经发育障碍分子诊断中的应用
推荐阅读
全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv
1.6K0
基于PacBio HiFi数据的人类全基因组重测序变异分析流程
5620
全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant
2K2
基因组 | Nat.Rev.Genet | 人类基因组中结构变异的多样性及其后果
2840
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
1.7K1
全基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV
1.1K4
群体遗传学习笔记:NGS结构变异检测原理
2.4K0
破译诊断密码:长读长测序,点亮临床精准诊断新未来
2170
破译诊断密码:长读长测序,点亮临床精准诊断新未来
2150
全球首个“个人参考基因组服务计划(PRGSP)”正式启动
4660
跨越短读长局限:三代长读长测序在科研与临床的未来五年机遇
3380
Nature重大突破:科学家成功完成Y染色体测序,标志着人类基因组的完整解读
3320
人类基因组时代的泛基因组学
1.1K0
Nature | 基于四代家系参考的人类新生突变率
2800
69 种基于全基因组测序数据分析结构变异的算法评估
2.4K0
三代测序技术100问(2):PacBio 与 ONT,谁是你的长读长利器?
5810
斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
4770
文献解读-基准与方法研究-第十五期|《不同 DNA 测序平台的标准化比较》
2340
MP长篇综述 | 植物泛基因组及其应用
7530
Sentieon 项目文章 | 长读长基因组测序在神经发育障碍分子诊断中的应用
1521
相关推荐
全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档