很高兴再次见到生信技能树的粉丝们,我是技能树VIP小编tsznxx,目前在安德森肿瘤医院工作,记忆力好的小朋友应该对我之前的教程有印象:
在那里我用了最优雅的方式来解决基因结构的呈现方式,希望对大家胃口。
生物信息学技能面试题(第5题)-根据GTF画基因的多个转录本结构
这里我将带来完全不一样的教程:
人生苦短
我用Python!
之前用过Perl版的circos,配置文件一堆,安装包一堆,非常痛苦。后来也试过R版的circos,也并不方便。于是自己花时间用Python实现了这个东西。代码一共200多行,大概一半是注释行。还有部分是优化呈现。基本功能的实现极其简单。
1
Packages (git@github.com:tsznxx/PyCircos.git)
2
实现技巧
2.1 matplotlib 的polar 画图。 说白了就是按照极坐标的形式画常规的matplotlib图。
?
pax = fig.add_axes([0,0,1,1],polar=True)
然后就可以像普通2D的axis对象一样call各种bar,scatter,fill_between, vlines, hlines等图了。参数上有细微的差别,角度(弧度单位)是横坐标,半径方向是纵坐标。 染色体band 用pax.bar() (填充和非填充两种方式) 刻度用pax.vlines() CNV的图用的是pax.fill_between() 2.2 画inter-chrom link 这个用的是SVG里面的路径Path里的CURVE3(这个功能很简单,在Javascript的SVG画图里面很常用,但是由于我很少用JavaScript,我花了好久才找到这种实现方式)。CURVE3的意思就是由3个点确定一条曲线(quadratic Bézier curve),(起点,控制点,终点)。控制点是表示切线方向。
对于一条路径,就是一组点组成的闭合曲线:(起点,控制点1,点2,控制点2,...... ,点N,控制点N,起点)。我们所见的inter-chrom 链接就可以用9个点组成一条闭合曲线(chord):
3
画图
当呈现方式就绪后,下一步就是做图了。
cytoband是用的UCSC的文件。
3.1 画染色体cytoband (barplot,颜色采用的是R里面的染色体配色)
3.2 画染色体空框(barplot, {'edgecolor':'k','linewidth':1,'linestyle':'-','fill':False})
3.3 画 ticks (每50M为间隔,刻度用M表示)
3.4 画染色体名字 (旋转)
3.5 画CNV amplification (fill_between, 低于cutoff用灰色表示)
3.5 画CNV deletion (fill_between, 负值,向内画,低于cutoff用灰色表示)
3.6 因为这里并用不到inter-chromosome interaction,我只是随便画了2个link作为例子。注:染色体内部的控制点我偷懒,直接用了半径,所以靠近染色体的弧线有些平(以后有空了改下)。
最终效果图: