欢迎关注"生信修炼手册"!
de novo mutation 是属于生殖细胞突变中的一类突变,指的是在一个家系中,第一次出现的突变。这个突变在父本中是没有的,只是在子代中第一次出现。
在varscan中,专门有一个子命令trio
, 用来分析de novo突变。需要3个bam文件,分别对应faher, mother, child,同时还需要参考基因组的fasta序列。用法如下
第一步:生成mpileup 文件
samtools mpileup -B -q 1 -f ref.fasta dad.bam mom.bam child.bam >trio.mpileup
第二步,鉴定de novo 突变
java -jar VarScan.jar trio
trio.mpileup \
trio.mpileup.output \
--min-coverage 10 \
--min-var-freq 0.20 \
--p-value 0.05 \
-adj-var-freq 0.05 \
-adj-p-value 0.15
varscan首先会使用和mpileup2snp
子命令相同的算法分析3个样本中的生殖细胞变异位点,然后会根据子代和父本的分型结果,筛选出不符合孟德尔遗传规律的突变位点,即子代的allel不可能通过父代遗传得到的突变位点,这些位点也称为 Mendelian Inheritance Errors位点,简写为MIE, 对这些的位点的分型结果进行校正,校正过后,如果确实为MIE, 就继续标记为MIE, 如果为一个de novo突变,就标记为de novo突变。
这条命令运行成功之后,会产生如下两个输出文件
trio.mpileup.output.snp.vcf
trio.mpileup.output.indel.vcf
分别对应snp和indel两种变异类型的结果,在输出的VCF文件中,如果一个突变位点为MIE, 对应的FILTER字段会标记为mendelError
,否则标记为PASS
;如果一个突变位点为de novo 突变,对应的INFO字段会标记DENOVO。
需要注意的是,直接分析得到的de novo突变中,还是会存在部分假阳性的位点,需要做进一步的过滤。