遗传病测序数据分析解读科普系列
第1.1期解读必要数据:变异注释
好的工具,让复杂遗传病易于被诊断
如果觉得内容对您有用,欢迎分享
如果有不同观点或建议,欢迎留言
背景介绍
解读流程回顾
由于目前通用的变异数据文件vcf通常是无法直接进行遗传病变异分析,因此需要通过变异注释为数据解读提供必要的信息。
注释前
注释后
1
变异注释介绍
变异注释分类
变异注释的主要分三个部分:
基因组功能注释
数据库信息注释
预测软件结果注释
注意,这三个部分不是绝对独立,内容上会有相互交叉,例如OMIM数据库信息注释需要依赖于基因组功能注释。
注释过程示意图:II与III属于基因组功能注释,
I与IV属于数据库信息注释,V属于变异预测软件分析注释
基因组功能注释
这步注释的目的为:
注释变异对基因组功能造成影响的相关信息,如:位于哪个基因,标注对应的refseq编号/外显子编号/cds序列和蛋白序列位置及影响等信息(如NOD2:NM_022162:exon8:c.G2722C:p.G908R)
数据库信息注释
这步注释的目的为:
标注变异相关的知识数据库(如OMIM,HPO等)或统计数据库(如ExAC,dbSNP等)相关的信息,进一步丰富可供数据解读的参考信息。
OMIM数据库中MMACHC基因部分信息
预测软件结果注释
这步注释的目的为:
通过生物信息学相关算法(如SIFT,polyphen2等),对变异进行功能有害性预测,对变异致病性分析提供参考性信息。
注意:有害性预测不等于分析致病性,也不能作为直接证据使用。
Polyphen2,SIFT有害性分析及氨基酸保守性分析
2
注意问题
注意软件及数据库差异的影响
随着NGS技术应用范围的日益增加,每个领域范围内信息更新的速度也会随之加快,因此软件及数据库的种类和版本的变化需要注意,尤其是相同功能软件分析结果之间的差异性。
不同注释软件结果差异性
图片来源:golden helix官网
不同预测软件结果比较
数据库更新
OMIM数据库更新记录
部分数据库更新文章
3
小结
变异注释是获取数据解读变异相关信息的步骤,是解读的依据和证据的来源,因此需要选择适合解读方法的相关信息(注释软件,数据库,预测软件等)。
目前工具及数据库的变化速度比较快,因此要注意相应的更新信息,保持信息的及时性及准确性。
如果对文章内容有评价或不同看法,
欢迎到行业大咖顾大夫创建的论坛中讨论
NGS基因诊断率能力提高之路径
多维度、多学科、多角度,合共同之力解决问题。
领取专属 10元无门槛券
私享最新 技术干货