首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何识别BioPython中的基因编码框

如何识别BioPython中的基因编码框
EN

Stack Overflow用户
提问于 2016-03-04 18:46:52
回答 1查看 265关注 0票数 0

我正在使用BioPython遍历GenBank文件中的开放阅读框。更具体地说,我考虑了在GenBank中标注为“CDS”的特性。所以我的代码是这样的:

代码语言:javascript
运行
复制
from Bio import SeqIO
gbk_dat = SeqIO.read(genbank_filepath, 'genbank')

for feature in gbk_dat.features:
    if feature.type == 'CDS':
         # Identify coding frame

我想知道是否有可能确定一个基因相对于整个基因组在哪个编码框架中?即。如果一个基因从基因组的位置1开始,它就会在编码框架1中,如果它在2开始,在编码框架2中,如果在5,那么框架2也是如此。(我知道我可以相对容易地编写脚本,但我喜欢依赖BioPython,因为它在以后共享代码时往往更干净。)

EN

回答 1

Stack Overflow用户

发布于 2016-03-11 02:33:21

我不能100%确定这是你需要的,但在genbank文件中,CDS区域(与基因相关)将如下所示:

代码语言:javascript
运行
复制
 gene            1012..1356
                 /locus_tag="L_00015"
 CDS             1012..1356
                 /locus_tag="L_00015"
                 /inference="ab initio prediction:Prodigal:2.6"
                 /inference="protein motif:Pfam:PF05136.7"
                 **/codon_start=1** 
                 /transl_table=11
                 /product="Phage portal protein, lambda family"
                 /protein_id="C:L_00015"
                 /translation="MIGVFDKLEERVIGARGIIVEPQPLRKNGEMAAELAADIRRLWA
                 EWSVSPDVTGQYTRPVLERLLLRTWLRDGEVFAQMVSGAGNGLERTAECHSGLRRWSR
                 ILFPSPLMNPPD"

有一条线(/codon_start=1)告诉你基因的阅读框架。如果您想要自动捕获该信息,您可以使用以下代码来实现:

代码语言:javascript
运行
复制
from Bio import SeqIO
gbk_dat = SeqIO.read(genbank_filepath, 'genbank')

for feature in gbk_dat.features:
    if feature.type == 'CDS':
        print(feature.qualifiers.get('codon_start')))

对于重叠的issue...can,你发布了一个示例genbank文件吗?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35794047

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档