本文从以下五个方面介绍了可视化序列比对数据和相关的tracks:
文件格式
IGV推荐使用格式是:BAM以及SAM格式。
除了BAM,GOBY、VCF、PSL、BED、TDF等格式IGV也支持。
Sort和Index
BAM文件在载入IGV前,需要进行sort 和index。Index会生成一个以“.fai”结尾的辅助文件,这个文件会根据文件名自动关联序列比对数据(.bam),导入IGV中。
Tracks
载入bam文件后会产生3个相关的tracks:
一般情况下,前两个tracks会自动出现。这些设置可以通过右键进行修改。
Coverage Track
默认情况下,IGV能动态计算和显示比对文件的覆盖率和测序深度。当IGV窗口放大到reads 可视化阈值大小(默认为30KB)时,这个track会以灰色条形图显示每个位点的测序深度。如果某核苷酸与参考序列不同(超过20%reads)时,IGV会标出不同的颜色。
即:A→绿色;C→蓝色;G→橙色;T→红色。
覆盖率数据(TDF)
可用igvtools将BAM文件转化为TDF格式,这个文件是专门显示覆盖率
TDF文件是BAD文件的精简版,当只需要看覆盖率数据时,可用igvtools工具进行转换;方便快速查看。
Alignment Track
当IGV窗口放大到30KB(默认)时,就会显示出各个reads的情况。
结构变异(Structural Variants)
IGV使用颜色和其他的标记来显示变异:SNP、SV、异倍体(aneuploidy)。
IGV使用reads透明度来表示其质量。
Paired-end 比对
对于PE比对,igv可通过右键选择将reads以成对的方式展示。(如下图)
用户可以将需要标记的reads用紫色标记(1),而不同于预期的将会同(3)一样进行标记。
在PE比对中,还可以通过右击一个read,选择View mate region in split screen,分屏查看paired mate。(注:若这个read没有mapped mate,则这个选项为灰色)。双击窗口顶端的位点栏,即可恢复正常的单屏视图。
Interpreting Color by Insert size
IGV用颜色来标记异常的插入片段大小的reads,这个只用DNA比对(不适用于RNA-Seq)。
默认的颜色标记规则:如图
Interpreting Color by Pair Orientation
本文简单介绍了使用igv查看序列比对的情况,还有其他模式如Bisulfite Mode,详细可看原文网页(http://software.broadinstitute.org/software/igv/book/export/html/37)。期待大家的交流学习哇。