欢迎关注”生信修炼手册”!
基因组结构元件的可视化有多种方式,比如IGV等基因组浏览器中以track为单位的展示形式,亦或以circos为代表的圈图形式,比如在细胞器基因组组装中,基因元件常用圈图形式展示,示例如下
在biopython中,通过BiolGraphics子模块可以对基因组结构进行可视化,支持线性和圈图两种可视化方式。其中,基因组结构信息存储在genebank格式的文件中,首先通过Bio.SeqIO读取结构信息,然后通过Bio.Graphics模块进行可视化。
以下列数据为例,先来看下可视化的用法
>https://www.ncbi.nlm.nih.gov/nuccore/NC_005816
首先是读取gb文件,代码如下
接下来提取gb文件中的feature信息,构建用于绘图的数据结构,代码如下
最后进行绘图即可,代码如下
输出结果如下
对于圈图,只需要修改简单修改绘图的参数即可,代码如下
输出结果如下
除了圈图之外,biopython还可以绘制染色体图。最简单的绘图,只需要提供染色体名称和对应的长度即可,代码如下
输出结果如下
更进一步,可以在染色体上添加注释,标记基因组结构元件在染色体上的分布,代码如下
输出结果如下
相比circos,biopython的track可能没有那么多种丰富的表现形式,但是也有其独特性。更重要的是,在染色体上标记特定元件的这种可视化方式,应用非常广泛,snp, ssr, cnv, genge等等都可以进行标记。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
领取专属 10元无门槛券
私享最新 技术干货