转载请注明:解螺旋·临床医生科研成长平台
众所周知,同源性是预测基因和蛋白质功能的主要线索,而序列同源性的判断则离不开两个或多个序列之间相似性的检测。一般来说,序列间的相似度越高,它们是同源序列的可能性就越高。
其中,序列比对无疑是评估序列相似性的最简单方法。显然,Blast就是序列比对检测的中坚力量。Blast自1990年首次亮相以来,凭借从各大数据库(EST、PDB数据库等)获取信息的能力,迅速成为序列比对界的领头羊。
老实说,Blast的界面非常友好,点击相应模块后,大家只需在序列框中丢上自己的靶序列,勾选好物种基因组,点击搜索即可!
可看着结果界面涌现出的几十个、数百个甚至数千个候选匹配序列,不少选择困难症的童鞋表示头疼不已:结果辣么多,究竟哪个才是最优解?本文以NM_001206932为例,分解BLAST结果页面,让大家迅速摆脱Blast新手身份。
Blast结果解析
首先会看到一个表头,即本次比对的基本信息,如比对类型、序列长度、所选的数据库等等。如果所选的数据库不合适,请及时迷途知返哦。
接下来就是Blast的结果显示图(Graphic Summary):颜色比例尺,其中相似度从高到低排列分别为:红、紫、绿、蓝、黑,红色区域越多则表示有较好的比对结果。
而在Blast结果的描述区域,两个衡量标准最为重要:Max Score和E值(E value),前者匹配片段越长,相似性越高则Score值越大;后者是得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。
而点击相应注释名称,又或者在结果显示图(Graphic Summary)中点击对应的线条,均可以查看比对结果的详细信息。
如此,就可对Blast结果做到了如指掌,然而有些急性子的科研者却对Blast的运行速度有些瞧不上眼,因而又挖掘出了序列比对的新神器Blat,不仅让序列比对速度翻倍增长,而且其共线性输出结果更加简单易读。详情请查看文章《Blast太慢?可以试试Blat》。
序列比对常用在线工具
1
SimiTriX-SimiTetra
功能:多序列比对相似性展示
网址:http://cotton.hzau.edu.cn/EN/tools/BioERCP/simitrix.php
2
MUSCLE
功能:运行速度比较快的多序列比对
网址:http://www.ebi.ac.uk/Tools/msa/muscle/#
3
Clustal Omega
功能:DNA、RNA、蛋白的多序列比对
网址:http://www.ebi.ac.uk/Tools/msa/clustalo/
4
ClustalW2
功能:应用较广泛的多序列比对
网址:http://www.ebi.ac.uk/Tools/msa/clustalw2/
5
T-Coffee
功能:准确度高,速度慢的多序列比对
网址:http://www.ebi.ac.uk/Tools/msa/tcoffee/
参考文献:https://bitesizebio.com/37866/crash-course-blast-searching/
领取专属 10元无门槛券
私享最新 技术干货