Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一文读懂基因组浏览器绘制文件 bigwig

一文读懂基因组浏览器绘制文件 bigwig

作者头像
生信菜鸟团
发布于 2021-12-10 03:39:30
发布于 2021-12-10 03:39:30
4.3K00
代码可运行
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团
运行总次数:0
代码可运行

一、特点及适用场景

  • 存放区间的坐标轴信息(如染色质可及性,转录因子结合区域)和相关评分(score)的文件,主要用于存储密集,连续的数据
  • 主要用于在基因组浏览器上查看数据的连续密度图
  • wig或bedGraph的索引二进制文件,也就是可以由这两种文件转换得到
  • 后缀名:.bw.bigwig
  • 在处理大型数据集时,bigWig文件的显示性能比常规的wig文件快得多
  • 数据必须是连续的并且由大小相等的元素组成,如果数据是稀疏或包含大小不同的元素时,请使用bedGraph格式

二、wig 转 bigwig

BigWig文件可以使用wigToBigWig程序从wiggle(wig)格式文件转换得到

1、 创建 wig 文件

wig 文件转换为bigWig文件时,必须为每个数据轨迹创建一个单独的 wig 文件。

从 wig 文件中删除任何现有的“ track”或“ browser”行,使其仅包含数据。

文件名命名为 input.wig

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 variableStep chrom=chr19 span=150
 49304701 10.0
 49304901 12.5
 49305401 15.0
 49305601 17.5
 49305901 20.0
 49306081 17.5
 49306301 15.0
 49306691 12.5
 49307871 10.0

2、创建chrom.sizes文件

wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/fetchChromSizes

fetchChromSizes hg38 > hg38.chrom.sizes

3、转换为 bigWig 文件

http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/wigToBigWig

wigToBigWig input.wig hg38.chrom.sizes BigWig.bw

4、将生成的 bigwig 文件放在web可访问的地址

这里提供了两种方式:

  • Track Hub 是官方提供 Web 可访问的基因组数据目录
  • 自己搭建个网站,把数据开放给外部,比如,我生成的bigwig文件链接放在这个url:http://bioinfo.ziptop.top/BigWig.bw

bigWig文件保留在本地可通过Web访问的服务器(http,https或ftp)上,并且仅将当前显示的染色体位置所需的部分,才会成为本地缓存的“稀疏文件”。 如果无权访问Web服务器并且需要bigWig文件的托管空间,请参阅Track Hub帮助文档的“ 托管”部分。

5、 选择菜单栏My DataCustom Tracks

6、将上面的代码粘贴到输入框,点 Submit

http://bioinfo.ziptop.top/BigWig.bw

7、点 go

8、在基因组浏览器中绘制的轨迹

可以看到参考基因组相应的位置,不同的值用不同颜色代表

9、定制轨迹线参数

默认情况下,将使用文件名来命名轨迹。要配置轨迹标签或其他可视化选项,必须创建一条轨迹

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 track type=bigWig name="My Big Wig" description="A Graph of Data from My Lab" bigDataUrl=http://bioinfo.ziptop.top/BigWig.bw

粘贴上面的代码,点 Submit

10、轨迹列表,点 go

其他参数

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 autoScale         <on|off>                             # default is on
 alwaysZero        <on|off>                             # default is off
 gridDefault       <on|off>                             # default is off
 maxHeightPixels   <max:default:min>                    # default is 128:128:11
 graphType         <bar|points>                         # default is bar
 viewLimits        <lower:upper>                        # default is range found in data
 viewLimitsMax     <lower:upper>                        # suggested bounds of viewLimits, but not enforced
 yLineMark         <real-value>                         # default is 0.0
 yLineOnOff        <on|off>                             # default is off
 windowingFunction <mean+whiskers|maximum|mean|minimum> # default is maximum, mean+whiskers is recommended
 smoothingWindow   <off|[2-16]>                         # default is off
 transformFunc     <NONE|LOG>                           # default is NONE

三、bedGraph 转 bigwig

bedGraphToBigWig程序比未压缩的bedGraph输入文件使用的RAM多大约25% 。

类似于上述过程,这里简写

wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/fetchChromSizes

fetchChromSizes hg38 > hg38.chrom.sizes

wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedGraphToBigWig

bedGraphToBigWig in.bedGraph hg38.chrom.sizes out.bw

如果报错染色体长度超出,需要先剪切bed 用到的工具:wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/bedClip bedClip input.bed hg38.chrom.sizes output.bed

四、其他工具

http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/

  • bigWigToBedGraph:将bigWig文件转换为 bedGraph 格式。
  • bigWigToWig:将bigWig文件转换为 wig 格式。注意:如果从bedGraph创建了bigWig文件,则bigWigToWig会将文件还原回bedGraph。
  • bigWigSummary :从bigWig文件中提取摘要信息。
  • bigWigAverageOverBed :计算每个 bed 上可能有内含子的bigWig的平均得分。
  • bigWigInfo :打印出有关bigWig文件的信息。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
生信文件格式 | bigwig,bw (基因组浏览器绘制)
BigWig文件可以使用wigToBigWig程序从wiggle(wig)格式文件转换得到
白墨石
2021/01/12
6.2K0
UCSC 基因组浏览器配置详解
查看复合组中的信号轨迹时,请使用group auto-scale功能,以使所有轨迹相对于当前视图中具有最大最大数据点的组中的一个轨迹进行缩放。
白墨石
2021/01/12
2.2K0
生信文件格式 | wig(基因组浏览器绘制)
Wig,BigWig,BedGraph,这是几种在基因组浏览器上绘制图形的数据格式。
白墨石
2021/01/12
1.9K0
从UCSC下载基因组的GTF文件
从UCSC下载基因组的GTF文件有两种方式,一种是利用table browser 浏览器,另外一种是通过FTP服务。
生信修炼手册
2020/05/08
6.7K0
从UCSC下载基因组的GTF文件
(14)不同基因坐标转换-生信菜鸟团博客2周年精选文章集
主流有3个,我只介绍了两个: 用crossmap代替liftover做基因组坐标转换 liftover基因组版本直接的coordinate转换 其实国际三大主流生物信息学数据库运营单位都出了自己的基因组坐标转换,它们分别是 (UCSC liftOver, NCBI Remap, Ensembl API) Ensembl’s Assembly Converter.是基于crossmap的,我觉得挺好用的,就介绍给大家!!! This online tool currently uses CrossMap, w
生信技能树
2018/03/08
3.8K0
(14)不同基因坐标转换-生信菜鸟团博客2周年精选文章集
一看就能学会的,不同基因组版本坐标转换方法
对于同一个物种而言,会存在不同的基因组组装版本,以human为例,UCSC有以下多个版本
生信修炼手册
2020/05/07
4.5K0
玩转基因组浏览器之tdf文件
将bam文件导入IGV之后,可以直观的查看测序深度的分布情况, 但是直接导入bam文件会占用比较大的内存,如果只是想要查看测序深度信息,有很多其他的代替方案。
生信修炼手册
2020/05/07
3.2K0
不同版本基因组文件如何位置相互转化?
大家好,我是邓飞。前一段时间有小伙伴在星球提问:想将不同版本的SNP数据合并,不想重新call snp,想把绵羊的V2和V4版本的数据合并,具体来说,是V2转为V4然后与V4合并。
邓飞
2023/11/17
9870
不同版本基因组文件如何位置相互转化?
UCSC genome browser 个人track 安装
处理基因组数据,很多时候我们会觉得直接看序列文件不够直观,如果绘图的话,把n多G把数据用画图出来不仅费劲,就算操作也不方便。因此我们可以用UCSC开发出的genome browser,可以直接把数据信息写成track,连上genome browser 上查看,它还支持安装到本地服务器上(genome browser in box ,简称GBIB),genome browser 支持的格式有bedGraph, GTF, PSL, BED, bigBed, WIG, bigGenePred, bigMaf, bigChain, bigPsl, bigWig, BAM, CRAM, VCF, MAF, BED detail, Personal Genome SNP, broadPeak, narrowPeak, and microarray (BED15),GFF和GTF文件必须tab分隔。 废话少说,直接入门。本文主要讲SAM,BAM,WIG,bigWig,VCF,BED文件上传及使用。
用户1680321
2022/03/10
1.5K0
UCSC genome browser 个人track 安装
本地安装UCSC基因组浏览器
UCSC基因组浏览器在大规模高通量数据的可视化和比较分析研究中发挥着重要的作用。拥有了本地浏览器,就可以对自己的测序数据进行更深入的分析和共享使用。本文详细介绍了如何一步步在本地安装、配置、高级使用UCSC浏览器。其详细介绍见 测序数据可视化 (三) - UCSC genomebrowser 安装UCSC浏览器 1. 安装mysql+apache #For Ubuntu user sudo apt-get install tasksel sudo apt-get install lamp-server #
生信宝典
2018/02/05
1.4K0
使用CIRCexplorer2识别环状RNA
CIRCexplorer是一款环状RNA预测软件,专门用于预测exonic circRNA,网址如下
生信修炼手册
2019/12/19
1.3K0
使用CIRCexplorer2识别环状RNA
制作BW文件的时候需要去除位于黑名单区域的信号
If you want to actually edit the heatmap then don't bother with --outFileNameMatrix, just gunzip the output from computeMatrix, remove the problematic line, change the group_boundaries so they limits are correct, and then gzip the results back up.
生信技能树
2018/10/25
1.3K0
制作BW文件的时候需要去除位于黑名单区域的信号
生信文件格式 | BedGraph(基因组浏览器绘制)
在第19号染色体的49,302,001到49,304,701区域的三个轨迹中指定9个独立的数据点。
白墨石
2021/01/12
2.8K0
RNA-seq(4):下载参考基因组及基因注释
那下载哪个基因组呢?先了解一下: https://bitesizebio.com/38335/get-to-know-your-reference-genome-grch37-vs-grch38/
Y大宽
2018/09/10
5.3K0
RNA-seq(4):下载参考基因组及基因注释
生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、sam、bam、wig、bigwig、bedgraph等,生成后我们一般会查看下内容了解文件每一列的含义,以此来决定需要提取哪些有用信息列来进行下一步分析。
生信宝典
2019/10/14
2.7K0
生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
获取参考基因组chrom.sizes文件的3种方式
在数据分析中,软件经常会要求参考基因组对应的chrom.sizes文件,该文件保存了基因组中的染色体名称已经对应的长度,内容示意如下
生信修炼手册
2020/05/07
2.3K0
使用UCSC基因组浏览器可视化测序深度分布数据
通过UCSC基因组浏览器,我们不仅可以查看别人已经公布的数据,还可以上传自己的数据进行查看,支持以下bed,vcf,bigwig等多种常见的文件格式,完整的格式列表请参考以下链接
生信修炼手册
2019/12/19
6.3K0
使用UCSC基因组浏览器可视化测序深度分布数据
本地安装UCSC基因组浏览器
UCSC基因组浏览器在大规模高通量数据的可视化和比较分析研究中发挥着重要的作用。 本文详细介绍了如何一步步在本地安装、配置、高级使用UCSC浏览器。 安装UCSC浏览器 1. 安装mysql+apache #For Ubuntu user sudo apt-get install tasksel sudo apt-get install lamp-server #For readhat or centos user yum install httpd mariadb-server mariadb 2. 新
生信宝典
2018/02/05
2.3K0
使用 Docker 分析高通量测序数据
做生信的童鞋想要学习 Docker,或者使用 Docker+Pipeline 封装自己的一套数据分析流程,相信一定不能错过胡博强老师在2017年写这篇《[Docker]使用阿里云 + Docker 分析高通量测序数据——RNA-Seq 与 ChIP-Seq. - Boqiang Hu》教程,这个教程同时也以推文的方式发布在了 2017-03-21 生信技能树公众号上,感兴趣的同学可以自己去翻一下。 根据教程+tangEpiNGSInstall 仓库提供的原始测试数据,本人这两天测试跑了一下,发现了一点点小问题。
章鱼猫先生
2021/10/15
5580
使用 Docker 分析高通量测序数据
单细胞基因组拷贝数变异流程
这里一步到位下载bowtie2的参考基因组:http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml
生信技能树jimmy
2020/03/27
1.5K0
相关推荐
生信文件格式 | bigwig,bw (基因组浏览器绘制)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验