当我们谈及三代纳米孔测序,脑海中浮现的第一印象往往是其无与伦比的长读长能力,从数万碱基(kb)到数兆碱基(Mb),它为基因组学研究带来了革命性的突破。然而,生命科学的探索并非总是“越长越好”。最近,李老师就被问及一个非常具体且前沿的问题:“我想做人体体液中cfDNA的测序,三代纳米孔测序是否适用于这类短片段DNA呢?” 今天,我们就来深入探讨纳米孔测序在片段大小“下限”上的表现。
首先,让我们了解一下cfDNA(cell-free DNA),即细胞游离DNA。当细胞凋亡或坏死时,其内的DNA会被释放到血液等体液中,并被核酸酶降解成小片段。由于受到核小体(nucleosome)的保护,这些降解过程并非完全随机,使得cfDNA的片段大小分布呈现出独特的规律:在约167bp处有一个典型的主峰,这恰好对应于一段DNA缠绕在单个核小体上的长度。绝大多数cfDNA片段的长度都在500bp以内。这些携带着来源细胞遗传信息的“碎片”,在肿瘤液体活检、无创产前检测(NIPT)等领域展现出巨大的临床应用潜力。
纳米孔测序的一个核心特性是“全覆盖读长” ——它既能测长片段,也能兼顾短片段。理论上,只要核酸分子能够顺利通过纳米孔通道,就会产生可被检测的电流信号,从而转化为碱基序列。然而,理论与实践之间存在着一个关键的物理限制。李老师解释道:“电流信号的产生,并非是单个碱基通过孔道时形成的,而是大约5-6个碱基同时处于孔口附近,共同决定了当前时刻的信号状态。” 这意味着,如果DNA片段过短,它在孔道中停留的时间将非常有限,导致采集到的有效信号点数过少。在这种情况下,复杂的basecalling算法可能无法完成稳定可靠的模式匹配,最终导致碱基识别的准确度显著下降。
根据大量的文献报道和ONT官方资料,目前普遍认为100bp左右是纳米孔测序比较可靠的长度下限。低于这个长度的片段并非完全无法测出,但其序列质量往往会因为信号不足或信噪比过低而大打折扣。因此,对于以167bp为峰值的cfDNA,纳米孔测序是可以进行的,但在分析结果时,需要对可能出现的效率和准确性相对偏低的情况有所预期。
面对短片段测序的挑战,ONT及其社区并未止步不前,而是通过化学和算法的双重优化,不断拓宽技术的应用边界。
cfDNA的微创获取方式,结合纳米孔测序仪便携、快速、实时输出的独特优势,正催生出一个充满想象力的“黄金组合”。这一组合已经在临床研究中展开了积极的探索,例如在肿瘤动态监测、早期筛查以及快速无创产前检测等领域。可以预见,随着建库化学、测序芯片和碱基识别算法的不断迭代更新,纳米孔测序在处理cfDNA等体液游离核酸方面的性能将持续提升。其在精准医疗和即时诊断(Point-of-Care Testing, POCT)领域的应用前景,无疑将越来越广阔。