脚本简介:
本脚本用于从 GenBank(GBK)格式文件中提取蛋白质序列,并将结果输出为 FASTA 格式文件。主要功能包括:
该脚本适用于基因组注释分析、蛋白质功能预测等常见生物信息学任务。
安装biopython模块:
# 使用pip安装
pip install biopython
# 使用conda安装
conda install -c bioconda biopython查看脚本帮助文档:
python Gbk_extea_protein.py -h
脚本使用方法:
1)脚本准备文件如下图所示

2)注意事项
实战演习
# 只提取蛋白质序列和蛋白质ID
python Gbk_extea_protein.py -g NC_000913.gbk -a F -o NC_000913_protein.faa
# 提取蛋白质序列以及序列的注释信息
python Gbk_extea_protein.py -g NC_000913.gbk -a T -o NC_000913_protein.faa结果展示
