终止位置 得分,说明注释信息的可能性 位于参考序列的正负链 仅对类型为CDS有效,表示起始编码的位置 包含众多属性的列表
虽然数据有九列之多,但并不是所有都会用到,常用的有:
seq_id....有多种类型,如gene/transcript/exon/CDS/UTR等,它们之间有层级关系,一般gtf文件中多行数据对应一条基因的完整信息,以type为gene的行为起始;每条gene可以表示为树状结构...正负链可以作为过滤条件,假如一条read与多个基因有overlap,可以根据方向是否相同过滤掉部分基因
attributes....将gtf每行数据以gene_name为key,放入map>中,这样就将每条gene的数据分类好了
geneBuilder 是个iter<List<...并且与read同向
READS_WRONG_STRAND overlaped gene没有同向,只有反向
TOTAL_READS 处理的总reads数