介绍
本文介绍如何使用Sentieon工具实施"功能等效流程",也称为CCDG流程标准,该标准在:
https://github.com/CCDG/Pipeline-Standardization/blob/master/PipelineStandard.md中进行了描述,并发布在https://www.nature.com/articles/s41467-018-06159-4中。为了符合该流程的版本要求,您应该使用Sentieon工具的201704版本或更高版本。
从Sentieon工具的201911版本开始,Sentieon BWA更新为0.7.17版本;BWA 0.7.17版本在其输出中生成MC MateTags,而samblaster addMateTags不会删除此MC标签并将自己的MC标签添加到BAM文件中,从而创建了重复的MC标签。
命令行等效性
比对
CCDG功能等效管道中的比对阶段使用BWA-MEM 0.7.15版本完成:
要使用Sentieon运行等效命令,请执行以下操作:
要在使用Sentieon版本201911或更高版本时运行等效命令,请执行以下操作:
重复标记
CCDG 功能等效管道中的重复数据删除阶段使用 Picard 2.4 或更高版本完成:
要使用 Sentieon 运行等效命令,请执行以下操作:
Sentieon命令使用特殊的3次重复数据删除流程来标记具有唯一或多个比对位置的读段。
使用分箱方案重新校准碱基质量分数
CCDG 功能等效管道中的 BQSR 阶段使用 GATK3 或 GATK4 完成:
要使用 Sentieon 运行等效命令,请执行以下操作:
请记住,Sentieon不会进行任何降采样,因为Sentieon工具足够高效,能够处理测序中的所有深度。此外,此流程不同于实现 CCDG 功能等效管道中所需的特殊分箱的常规最佳实践流程。
使用 Sentieon 的管道脚本
以下脚本将使用 Sentieon 对输入 FASTQ 执行 CCDG 功能等效管道:
领取专属 10元无门槛券
私享最新 技术干货