在三代测序技术的璀璨星空中,纳米孔测序以其独特的“实时、长读长”特性而备受瞩目。一个常常萦绕在研究者,特别是初学者心头的问题便是:“纳米孔测序到底能测多长?在时间足够的情况下,它的读长应该是没有上限的吧?” 这个看似简单的问题,实则触及了纳米孔测序技术的核心原理与实践边界。今天,我们就跟随李冕老师的思路,一同探寻答案。
首先,我们需要明确纳米孔测序的一个显著优势:其读长在理论上并不受仪器本身的限制。这一特性源于其独特的工作原理:
从这个过程中我们可以看出,只要输入的核酸分子足够长且不发生断裂,马达蛋白和纳米孔蛋白的复合体能够持续工作,那么信号采集就能一直进行下去。因此,纳米孔测序的读长上限并没有一个固定的“天花板”。
既然理论上可以“无限长”,为何我们在实际应用中看到的读长并非如此呢?李老师为我们揭示了在实际操作中,纳米孔测序平均读长受到的几大关键制约因素:
“读长的瓶颈,往往在于样本制备,而非测序本身。”李老师一语中的。常规的DNA提取试剂盒,无论是在细胞裂解、柱纯化、离心还是洗脱等步骤中,都不可避免地会对DNA分子产生剪切力。大多数文献和厂家手册中都表明,通过常规柱式法提取的基因组DNA,其片段大小通常分布在10-50kb的范围内。这意味着,即使测序仪有能力测得更长,但输入的“原料”本身就决定了最终读长的上限。
即使我们获得了超长片段的DNA,在后续的文库构建实验中,DNA分子仍可能因为移液、混匀等操作的剪切力而断裂。此外,测序芯片上的马达蛋白、纳米孔蛋白以及其镶嵌的生物膜,其活性和寿命也是有限的,不可能无限期地稳定工作。这些因素都会共同影响最终可获得的测序读长。
当DNA片段的长度过长时,它在溶液中更容易发生打结、缠绕,或形成复杂的二级结构。这些“疙瘩”在进入狭窄的纳米孔口时,可能无法被完全解开,从而导致孔道被堵塞,即所谓的“堵孔” 现象。一旦发生堵孔,该孔道的测序就会终止,这不仅影响了单条read的长度,也会降低整个测序芯片的数据产出。
综合以上因素,我们来看看纳米孔测序在实际应用中的读长表现:
总结一下:纳米孔测序技术确实具备产生超长读长的非凡能力,其读长没有理论上的“天花板”。但实际结果是一个受样本DNA完整性、文库构建方式和测序过程稳定性等多方面因素共同决定的复杂平衡。
在绝大多数应用场景下,我们追求的并非“无限长”,而是一个稳定、可重复且“足够长”的读长分布。对于基因组拼接、复杂结构变异检测、全长转录本测序等核心任务而言,几十kb到上百kb的读长已经足以提供关键的结构信息,帮助我们攻克二代测序难以逾越的障碍。