分析CNV的技术越来越多,除了核型、FISH、aCGH、SNParray、CNVseq、BOBS、WES、WGS等,还有基于cell free DNA 检测胎儿或肿瘤CNV的技术。但大多数技术都是基于待检测样本与拷贝数正常样本的比值差异来计算拷贝数的。
其实每种技术有其特点,不同测序平台、建库protocol、实验环境、操作人员习惯、测序仪测序质量等 这些都可能带来一些差异,而且捕获测序往往因为基因组上的一些特殊的特征(GC 异常,重复元件,转座子插入等),往往捕获效率很难达到绝对的均一分布,加上基于PCR的测序技术(二代测序)在GC异常区域测序质量往往比较差,比对率低。这些因素都给CNV 分析带来了挑战。
基于上述原因,我们可以选取合适的策略来尽可能减小这些technical or biological variability。比如我们尽量选取一家测序建库质量稳定可靠,WES 试剂盒稳定,均一性好(有的厂家会在GC异常区域多设计探针,以补偿捕获效率低)的试剂盒,采用同一测序平台,同一测序试剂盒,同样的protocol,尽量采取一批次多一点样本一起建库上机测序等。
但这些并非是绝对得按这样的要求来做。如果是CNV-seq,测的是组织样本(或血液中淋巴细胞)的大片段(100kb+),在建库试剂稳定可靠的前提下,我认为选取一些同样实验protocol、同样测序平台的阴性样本作为固定的对照就可,不一定非得是同批次的阴性对照,当然同批次的阴性对照效果应该会更好。
假如是NIPT plus,检测的是胎儿的CNV,那么情况就要复杂多了。NIPT是基于血浆游离DNA的检测,其中来自于胎儿的,当年Denis Lo的文章说是13%左右,也有基于大样本量的男胎统计是11%多点的。其中胎儿的两个染色体组,一个来自于母亲,另一个来自于父亲。假如有个胎儿检出2M大小的CNV杂合缺失,假如胎儿的DNA含量是10%,假定此缺失是因为来自父亲的染色体组出现了2M的缺失,那么这就要求我们准确在全基因组范围内检出2M大小的拷贝数是1.95的情况。这对于数据的稳定性要求是极高的,任何样本的GC等稍有异常或出现其他可能的偏好性都可能影响检出的胎儿CNV的可靠性。因此NIPT plus建议尽可能地选取同批次、同样稳定实验室protocol、同样测序平台的临检环境样本作为对照,同时尽可能减少相同超声异常表型和非临床环境(如过多的室间质评样本、同样疾病的性能验证或同一疾病的组织样本不同阳性比例的掺比实验等)。检出的胎儿CNV尽量结合超声等其他临床指标和最新的ACMG CNV致病性评级做综合评估。
基于捕获测序的,因捕获的不均一性,对于CNV检测的影响很大。很多说法是要大批量的样本建立baseline,其实不然。基于多重PCR的技术对于捕获的均一性实在是太差,但对于纯合缺失的检测还是有一定可靠性。基于液相杂交探针捕获的,随着技术优化,捕获的均一性越来越好。对于trioWES的情况,一般用同批次的父母做对照可很好地发现新发CNV,如果是遗传性CNV,还是尽可能用同批次、同实验室protocol、同平台测序的其他样本作为对照就可。对于有表型信息的,可结合表型和ACMG CNV致病性评级做综合评估。