首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >bcftools其实很好用

bcftools其实很好用

作者头像
用户7625144
发布于 2020-10-27 02:08:08
发布于 2020-10-27 02:08:08
1.4K1
举报
文章被收录于专栏:生信开发者生信开发者

*bcftools filter

*Filter variants per region (in this example, print out only variants mapped to chr1 and chr2)

bcftools filter -r1,2 ALL.chip.omni_broad_sanger_combined.20140818.snps.genotypes.hg38.vcf.gz

*printing out info for only 2 samples:

bcftools view -s NA20818,NA20819 filename.vcf.gz

*printing stats only for variants passing the filter:

bcftools view -f PASS filename.vcf.gz

*printing variants withoud header:

bcftools view -H

*printing variants on a particular region:

bcftools view -r chr20:1-200000 -s NA20818,NA20819 filename.vcf.gz

*print all variants except for the ones falling within region:

bcftools view -t ^chr20:1-30000000 ex_bams.samtools.20161231.vcf.gz >out.vcf

*view the positions passed in a file (accepted files are .vcf and .bed):

bcftools view -R 0002.vcf in.vcf.gz

*view the positions passed in a tsv file:

bcftools view -R 0002.tsv in.vcf.gz

# The format of 0002.tsv:

20 79000 80000

20 90000 100000

*printing out only the chr info:

bcftools query -f '%CHROM\n' filename.vcf

/

*now, print out the chr\tpos

bcftools query -f '%CHROM\t%POS\n' filename.vcf

/

*now, print out the AF INFO field

bcftools query -f '%INFO/AF\n'

/

#getting a particular annotation from the VCF

bcftools query -f '%QUAL\n' 0002.vcf

/

#printing chr pos and a particular annotation from a VCF:

bcftools query -f '%CHROM\t%POS\t%INFO/DP\n' in.vcf.gz

/

#printing out the sets assigned by GATK CombineVariants

~/bin/bcftools-1.6/bcftools query -f '%set\n' out_combine.vcf.gz |sort |uniq

/

0#printing a list of samples from a VCF:

bcftools query -l test.vcf

/

#also, the FORMAT annotations can be obtained by:

~/bin/bcftools/bcftools query -f '[%GT]\n' ../0002.vcf |wc -l #the GT in this case

/

*selecting snps from file:

~/bin/bcftools/bcftools view -v snps lc_bams.bcftools.20170319.NA12878.vcf.gz

/

*selecting the variants from a VCF (excluding 0|0 genotypes)

bcftools view -c1 input.vcf

/

*selecting the non-variants from a VCF(AC=0)

bcftools view -H -C0 concat.allchrs.sites.vcf.gz

/

#filtering:

/

#using one of the INFO annotations (IDV)

bcftools filter -sFilterName -e'IDV<5' input.vcf

/

#OR logical operator:

bcftools filter -sFilterName -e'DP>50000 | IDV<9' input.vcf

/

#filtering on FORMAT annotation:

bcftools filter -sFilterName -e'FORMAT/DP<5' input.vcf

/

#filtering on INFO annotation:

bcftools filter -sFilterName -e'INFO/DP<5' input.vcf

/

#printing out variants that pass the filter:

~/bin/bcftools/bcftools view -f.,PASS lc_bams.bcftools.20170411.exc.norm.SNP.filtered.vcf.gz

/

#bcftools stats and filtering:

~/bin/bcftools/bcftools stats -f "PASS,." file.vcf

/

#select only biallelic (excluding multiallelic) snps

bcftools view -m2 -M2 -v snps input.vcf.gz

/

#select only the multiallelic snps

bcftools view -m3 -v snps input.vcf.gz

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-10-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
作者你好,bcftools view -m2 -M2 这个命令你使用过吗? 想问一下关于这个命令的一些详细问题
作者你好,bcftools view -m2 -M2 这个命令你使用过吗? 想问一下关于这个命令的一些详细问题
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
Variant 分析阶段小结2- 变异寻找碎碎念
写在前面:『思考问题的熊』专栏上次更新还要追溯到4月19号的 Variant 分析阶段小结1-基础碎碎念,过去接近一个月的时间里我分别经历了两次长途出差和电脑无法连接特定网络的持续尴尬。特定网络正是所有以 qq.com 结尾的网站,当然包括微信公众平台,所以文章都编辑不了。身体和心理的双重袭击让我只能选择围笑:)
生信技能树
2018/07/27
4.2K0
Variant 分析阶段小结2- 变异寻找碎碎念
bcftools 高级用法
export BCFTOOLS_PLUGINS=/bi/software/bcftools-1.16/plugins;
用户7625144
2023/03/06
1.9K0
vcf文件
VCF 是生物信息分析中非常重要的一种格式。主要用来描述基因组突变的信息,无论是检测出来的 SNP,indel,cnv,还是 SV,都可以存储格式都为 vcf 格式。从比对生成的 bam 文件中,将潜在变异信息筛选出来,就是 vcf 格式。vcf 是一种列表格式,里面包含很多的内容。需要掌握每一列的信息,并能使用相对应的软件对 vcf 进行处理。处理 VCF 格式软件主要包括 bcftools,vcftools,gatk,python pyvcf,plink 等。
生信喵实验柴
2023/09/04
2.2K0
vcf文件
融合基因鉴定以及GATK寻找突变
上周的癌症样本全转录组数据的融合基因鉴定中我们拿到数据进行一系列比对过滤后使用star完成了基因组比对,并通过设置参数拿到了Chimeric.out.junction文件以便star-fusion进行融合基因的鉴定
生信菜鸟团
2023/09/08
2.4K1
融合基因鉴定以及GATK寻找突变
10X单细胞空间数据分析之SNP检测篇
Cellsnp-lite是在C/ c++中实现的,并执行每个细胞基因分型,supporting both with (mode 1) and without (mode 2) given SNPs。在后一种情况下,杂合snp将被自动检测。Cellsnp-lite适用于基于液滴的(例如10XGenomics数据)和well-based的平台(例如SMART-seq2数据)。
追风少年i
2023/04/29
9470
10X单细胞空间数据分析之SNP检测篇
Bioinfo|bedtools-操作VCF文件
初步设想在Bioinfo板块中分享一些常见的生信分析软件的使用,原则就是有现成的轮子就不去自己造了。
生信补给站
2020/08/06
2.7K0
bcftools学习笔记(二)
本篇主要介绍annotate, concat, merge, isec, stats这五个命令。
生信修炼手册
2020/05/11
5.5K2
bcftools学习笔记(二)
bcftools进行SNP calling
bcftools也可以进行SNP calling。在之前的版本中,通常都是和samtools的mpileup命令结合使用, 命令如下
生信修炼手册
2020/05/11
6.5K0
奇怪,HaplotypeCaller中AD之和不等于DP
在基因组分析中,处理流程从上游测序数据到下游突变分析,中间的关键就是call突变。
生信菜鸟团
2022/04/08
2.3K0
奇怪,HaplotypeCaller中AD之和不等于DP
annovar注释的进阶使用
菜鸟团公众号肯定讲过annovar的使用了。比如Nickier的vcf文件的注释及ANNOVAR的使用。
生信菜鸟团
2022/05/24
3.9K0
Variant 分析阶段小结1-基础碎碎念
所谓遗传变异是生物体内遗传物质发生变化而造成的可以遗传给后代的变异,这些变异导致了生物在不同水品上体现出遗传的多样性。生物信息学中各种基因组研究的基础就是遗传变异的研究,比如进化和各种表型的研究。
生信技能树
2018/07/27
1.7K0
Variant 分析阶段小结1-基础碎碎念
bcftools学习笔记(一)
本篇主要介绍index, view, query, sort, reheader这五个命令。
生信修炼手册
2020/05/11
5.3K0
Sentieon | 应用教程:Sentieon分布模式
本文档描述了如何利用Sentieon®基因组学工具的分片能力将DNAseq®流程分布到多台服务器上;将其他流程(如TNseq®)进行分布遵循相同原则,因为所有Sentieon®基因组学工具都具有相同的内置分布式处理能力。这种分布的目标是为了减少流程的总运行时间,以更快地生成结果;然而,这种分布也会带来一些额外的开销,使计算成本增加。 利用分布能力,流程的每个阶段被分成小任务;每个任务处理基因组的一部分,并可以在不同的服务器上并行运行。每个任务生成一个部分结果,需要按顺序合并为最终的单一输出;这种合并需要仔细进行,以确保考虑到边界并生成与没有分片运行的流程相同的结果。 分布的执行框架不在本文档的范围内,用户需要在保持正确的数据依赖关系的同时,分发数据/文件并启动正确的进程。
INSVAST
2024/07/15
1210
Sentieon | 应用教程:Sentieon分布模式
通过简单数据熟悉Linux下生物信息学各种操作4
原地址 几点说明 1.非简单翻译,所有代码均可运行,为了辅助理解,基本每步代码都有结果,需要比较的进行了整合 2.原文中的软件都下载最新版本 3.原文中有少量代码是错误的,这里进行了修正 4.对于需要的一些知识背景,在这里进行了注释或链接到他人博客
Y大宽
2019/07/03
8540
GATK4 最佳实践-生殖细胞突变的检测与识别
本篇主要关注生殖细胞突变的分析流程Germline SNPs+Indels。示意图如下:
生信修炼手册
2020/05/11
2.6K0
GATK4 最佳实践-生殖细胞突变的检测与识别
大肠杆菌全基因组重测序变异检测小实例(侧重变异过滤)
未找到原文所用数据,本文使用GATK4.0和全基因组数据分析实践(上)文章中的大肠杆菌基因组作为参考序列,使用wgsim软件模拟生成双端150bp测序数据
用户7010445
2020/03/03
1.9K0
vcf 文件如何修改染色体修改样本名称提取样本
数据使用GWAS-Cookbook中的GWASdat1中的数据,将数据变为vcf格式。
邓飞
2023/10/20
1.4K0
vcf 文件如何修改染色体修改样本名称提取样本
R语言做基因表达量和变异位点的关联分析eQTL
http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
用户7010445
2024/05/09
3750
R语言做基因表达量和变异位点的关联分析eQTL
如何使用bcftools
当然了,如何提问,就需要一点点背景知识啦, 比如知道什么是变异位点,什么是过滤,然后就可以很简单的两个提问即可:
生信技能树
2023/09/19
1.8K0
如何使用bcftools
ilus: 这是我写的一个轻量级全基因组(WGS)和全外显子(WES)最佳实践分析流程生成器
不知觉间,距离我写下第一篇关于 WGS 数据分析系列的文章已经过去了三年多(WGS系列文章),时间真的快啊。
黄树嘉
2021/08/13
2.7K0
ilus: 这是我写的一个轻量级全基因组(WGS)和全外显子(WES)最佳实践分析流程生成器
相关推荐
Variant 分析阶段小结2- 变异寻找碎碎念
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档