前言
处理vcf文件的时候,需要多种切割,正则匹配,如果要自己写其实会比较麻烦,并且每次还得根据vcf文件格式或者需要读取的值不同要修改相应的代码。...因此我写了这个通用的读vcf的类,直接复制粘贴这部分代码就可以方便的用这个类进行vcf文件的读取,过滤,写出等操作。...使用说明
首先复制类的代码,后面就可以直接用了
import sys
import os
import subprocess
class Record(object):
'''
One...这是GT在vcf的存储形式,FORMAT对应着GT的值
GT:AD:AF:DP:F1R2:F2R1:OBAM:OBAMRC:OBF:OBP:OBQ:OBQRC:SB 0/1:21,2:0.120:23...:12,9,1,1 0/0:13,0:0.065:13:7,0:6,0:false:false:.:.:.:.:10,3,0,0
分别是FORMAT, tumor样本GT, normal样本GT对应的值