背景
BACKGROUND
人类基因组测序数据分析得到的变异位点,如SNV、INDEL,需要经过基因信息、人群频率、进化保守性预测、蛋白功能影响预测等分析,才能用于遗传分析和解读。虽然各实验室相继推出了如pubvar、mutlazer之类的查询网站,但由于维护频率不高,后台很多数据库未及时更新,导致注释的结果存在信息不全、版本过低等情况。目前已知的主流变异位点注释软件包括annovar、VEP、 snpeff等,VEP是ensembl出品,质量有保障。VEP发布了在线版和下载版,对于非生物信息背景的各位,可以用在线版实现相关信息的注释。
使用说明
MANUAL
一
、注册账号
百度或谷歌搜索”ensembl vep”,进入vep官网,注册方式如图:
二
、登陆使用
注意事项
VEP默认使用GRCh38版本的参考基因组,请根据需要选择GRCh37(hg19)版本。
三
、部分注释选项说明
1、人群频率注释
1000G所有人种:
1000G不同人种:
GnomAD:
2、参考文献注释:
报道该变异位点的文献PMID号,文献收集自ClinVar数据库2019年12月更新版和HGMD-public数据库2019年第4季度更新版(2020年10月30日测试结果)
3、转录本注释:
标记收录到MANE中的转录本编号:
备注:MANE(Matched Annotation between NCBI and EBI)挑选的Ensembl (ENST开头的转录本号) 和RefSeq (NM开头的转录本号) 序列完全一致的转录本,详见文末网址(1)
标记经典转录本:
4、功能注释(即用来判断ACMG证据PP3,BP4,BP7的信息)
dbNSFP数据库注释:
共采用29种算法对错义突变进行致病性预测,详见文末网址(2)
(默认为Disabled,根据需要选择dbNSFP数据库中需要注释的内容)
剪切位点预测:
四
、结果查看和导出
五
、部分结果解析
01
转录本选择
推荐MANE挑选的转录本,若MANE未收录,则挑选“VEP_canonical”标记为“YES”的转录本
02
剪接预测软件spliceAI输出结果解析
DS_AG, DS_AL, DS_DG, DS_DL分别代表acceptor gain,acceptor loss,donor gain,donor loss的Delta得分,其含义是影响剪接的概率,越接近1则影响剪接的概率越大,阈值设定如下:0.2 (high recall), 0.5 (recommended), and 0.8 (high precision)
03
其它信息
VEP的在线注释对各数据库的说明在输出结果的表头中已有相应介绍,可以将鼠标悬停到在线结果表的表头相应栏位即可显示
以下为文中关联网址:
(1)https://asia.ensembl.org/info/genome/genebuild/mane.html
(2)https://usf.app.box.com/s/cdws8yx5occ603ccbknwyamz5reapdug
END
作者:研发中心生信分析组 侯 敏
编辑:医学市场部 廖小芳