本文介绍如何tassel 和vcftools两个软件,将hapmap格式的数据转化为plink格式的数据。
环境:linux系统
2....3.2.1 .map格式
格式说明链接: http://zzz.bwh.harvard.edu/plink/data.shtml#map
map格式的文件, 主要是图谱文件信息, 主要包括染色体名称,...所在的染色体和所在染色体的坐标.
1, map文件没有行头
2, map文件包括四列: 染色体, SNP名称, SNP位置, 碱基对坐标
染色体编号为数字, 未知为0
SNP名称为字符或数字, 如果不重要..., 可以从1编号, 注意要和bed文件SNP列一一对应
染色体的摩尔未知(可选项, 可以用0)
SNP物理坐标
3, 如果只有SNP名称, 可以手动构建map文件, 第二列为SNP名称, 其它三列为0即可...格式的文件
run_pipeline.pl -fork1 -h test.sort.hmp.txt -export -exportType VCF
生成一个test.vcf文件
5.3 使用vcftools