Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ggplot2|玩转Manhattan图-你有被要求这么画吗?

ggplot2|玩转Manhattan图-你有被要求这么画吗?

作者头像
生信补给站
发布于 2020-08-06 03:23:26
发布于 2020-08-06 03:23:26
1.5K00
代码可运行
举报
文章被收录于专栏:生信补给站生信补给站
运行总次数:0
代码可运行

Manhattan图算是GWAS分析的标配图了,可参考Bio|manhattan图 进行绘制。

由于Manhattan点太多,后期AI/PS修改的话难度有点大,如果可以“个性化”绘制的话那是极好的!

一 载入R包,数据

1)载入数据处理的tidyverse包,使用qqman中gwasResults示例数据集

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#载入R包
#install.packages("qqman")
library(qqman)
library(tidyverse)
#查看原始数据
head(gwasResults)
 SNP CHR BP         P
1 rs1   1  1 0.9148060
2 rs2   1  2 0.9370754
3 rs3   1  3 0.2861395
4 rs4   1  4 0.8304476
5 rs5   1  5 0.6417455
6 rs6   1  6 0.5190959

我们知道Manhattan图实际就是点图,横坐标是chr,纵坐标是-log(Pvalue) ,原始P值越小,-log转化后的值越大,在图中就越高。

原始数据中重要的“元素”都有了 ,我们自己的数据也是只需要这四列就可以了。注意绘制前需要转化一下:

2)处理原始数据---计算SNP的累计位置
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 1)计算chr长度
chr_len <- gwasResults %>% 
  group_by(CHR) %>% 
  summarise(chr_len=max(BP))
# 2) 计算每条chr的初始位置
chr_pos <- chr_len  %>% 
  mutate(total = cumsum(chr_len) - chr_len) %>%
  select(-chr_len)
#3)计算累计SNP的位置
Snp_pos <- chr_pos %>%
  left_join(gwasResults, ., by="CHR") %>%
  arrange(CHR, BP) %>%
  mutate( BPcum = BP + total)

#查看转化后的数据
head(Snp_pos,2)

  SNP CHR BP         P total BPcum
1 rs1   1  1 0.9148060     0     1
2 rs2   1  2 0.9370754     0     2

数据准备完成,开始绘图。

二 ggplot2绘制Manhattan图

1 纵坐标为P值转-log10()

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(Snp_pos, aes(x=BPcum, y=-log10(P))) +
    geom_point( aes(color=as.factor(CHR)))

基本图形出来了,但是有点怪;不急,一点点改进:

  • 横坐标标签设置在每个chr中间位置;
  • 背景色去掉,线去掉等
  • 去掉点和X轴之间的 “gap” (很多地方可用)
  • 添加阈值线
2 绘制加强版Manhattan图

1) 准备X轴标签位置--在每条chr的中间

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
X_axis <-  Snp_pos %>% group_by(CHR) %>% summarize(center=( max(BPcum) + min(BPcum) ) / 2 )

2)绘制“改良版”Manhattan图

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
p <- ggplot(Snp_pos, aes(x=BPcum, y=-log10(P))) +
#设置点的大小,透明度
    geom_point( aes(color=as.factor(CHR)), alpha=0.8, size=1.3) +
#设置颜色
    scale_color_manual(values = rep(c("grey", "skyblue"), 22 )) +
#设定Xscale_x_continuous( label = X_axis$CHR, breaks= X_axis$center ) +
#去除绘图区和X轴之间的gap
    scale_y_continuous(expand = c(0, 0) ) +  
#添加阈值线
    geom_hline(yintercept = c(6, -log10(0.05/nrow(Snp_pos))), color = c('green', 'red'), size = 1.2, linetype = c("dotted", "twodash")) + 
#设置主题
    theme_bw() +
    theme(
      legend.position="none",
      panel.border = element_blank(),
      axis.line.y = element_line(),
      panel.grid.major.x = element_blank(),
      panel.grid.minor.x = element_blank()
    )

这时候是不是就可以了,?。

当然了既然是ggplot2绘制的Manhattan图(点图),那么关于点,线,坐标,主题的设置当然都可以设置了,看这里

ggplot2|详解八大基本绘图要素

ggplot2|theme主题设置,详解绘图优化-“精雕细琢”

3 玩转Manhattan图
1) 利用数据集自带的snpsOfInterest标示显著的位点,展示重要的基因信息
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(ggrepel)
#准备数据
data <- Snp_pos %>%
# 添加高亮和注释信息:snpsOfInterest中的rs编号和P值大于6的点
  mutate( is_highlight=ifelse(SNP %in% snpsOfInterest, "yes", "no")) %>%
  mutate( is_annotate=ifelse(-log10(P)>6, "yes", "no"))

#绘图

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
p1 <- ggplot(data, aes(x=BPcum, y=-log10(P))) +
    geom_point( aes(color=as.factor(CHR)), alpha=0.8, size=1.3) +
    scale_color_manual(values = rep(c("grey", "skyblue"), 22 )) +
    scale_x_continuous( label = X_axis$CHR, breaks= X_axis$center ) +
    scale_y_continuous(expand = c(0, 0) ) +  
    # 添加高亮点
    geom_point(data=subset(data, is_highlight=="yes"), color="orange", size=2) +
    # 添加高亮label,且防止重叠
    geom_label_repel( data=subset(data, is_annotate=="yes"), aes(label=SNP), size=2) +
    theme_bw() + 
    theme(
      legend.position="none",
      panel.border = element_blank(),
      panel.grid.major.x = element_blank(),
      panel.grid.minor.x = element_blank()
    )

如果我们自己的gwas结果数据是Gene的话,label更改即可标示基因。

2) 自定义重要的基因,标示

如果有某些“目的基因”,想查看这些基因的P值呢?

新加gene和gene_annotate列即可!

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#准备数据,使用基础函数
data <- Snp_pos
#根据目的基因的位置,新加gene和gene_annotate列
data$gene[data$CHR == 3 & data$BP == 366] <- "geneA"
data$gene_annotate[data$CHR == 3 & data$BP == 366] <- "yes"
data$gene[data$SNP == "rs4064"] <- "geneB"
data$gene_annotate[data$SNP == "rs4064"] <- "yes"
# 绘图
p2 <- ggplot(data, aes(x=BPcum, y=-log10(P))) +
    geom_point( aes(color=as.factor(CHR)), alpha=0.8, size=1.3) +
    scale_color_manual(values = rep(c("grey", "skyblue"), 22 )) +
    scale_x_continuous( label = X_axis$CHR, breaks= X_axis$center ) +
    scale_y_continuous(expand = c(0, 0) ) +  
    geom_label_repel( data=subset(data, gene_annotate=="yes"), aes(label=gene), size=4, col = "red") +
    theme_bw() + 
    theme(
      legend.position="none",
      panel.border = element_blank(),
      panel.grid.major.x = element_blank(),
      panel.grid.minor.x = element_blank()
    )
3)区域放大展示

重点展示某一区域的P值情况

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(ggforce)data <- Snp_pos %>%# 添加高亮和注释信息:snpsOfInterest中的rs编号和P值大于6的点
 mutate( is_highlight=ifelse(SNP %in% snpsOfInterest, "yes", "no")) %>%
 mutate( is_annotate=ifelse(-log10(P)>6, "yes", "no"))
  
  p3 <- ggplot(data, aes(x=BPcum, y=-log10(P))) +
   geom_point( aes(color=as.factor(CHR)), alpha=0.8, size=1.3) +
   scale_color_manual(values = rep(c("grey", "skyblue"), 22 )) +
   scale_x_continuous( label = X_axis$CHR, breaks= X_axis$center ) +
   scale_y_continuous(expand = c(0, 0) ) +   
   geom_point(data=subset(data, is_highlight=="yes"), color="orange", size=2) +facet_zoom(x = BPcum >= 3000 & BPcum <=3500)+
   theme_bw() + 
theme(
     legend.position="none",
     panel.border = element_blank(),
     panel.grid.major.x = element_blank(),
     panel.grid.minor.x = element_blank()
  )

可参考ggforce|绘制区域轮廓-区域放大-寻找你的“onepiece”

4)plotly 交互展示

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(plotly)
  data <- Snp_pos %>%
  mutate( is_highlight=ifelse(SNP %in% snpsOfInterest, "yes", "no")) %>% filter(-log10(P)>0.5) #过滤一些点,交互式压力小
# 准备SNP展示的text信息
data$text <- paste("SNP: ", data$SNP, "\nPosition: ", data$BP, "\nChromosome: ", data$CHR, "\nLOD score:", -log10(data$P) %>% round(2), "\nWhat else do you wanna know", sep="")

p4 <- ggplot(data, aes(x=BPcum, y=-log10(P), text=text)) +
    geom_point( aes(color=as.factor(CHR)), alpha=0.8, size=1.3) +
    scale_color_manual(values = rep(c("grey", "skyblue"), 22 )) +
    scale_x_continuous( label = X_axis$CHR, breaks= X_axis$center ) +
    scale_y_continuous(expand = c(0, 0) ) +
    ylim(0,9) +
    geom_point(data=subset(data, is_highlight=="yes"), color="orange", size=2) +
    theme_bw() +
    theme(
      legend.position="none",
      panel.border = element_blank(),
      panel.grid.major.x = element_blank(),
      panel.grid.minor.x = element_blank()
    )
ggplotly(p4, tooltip="text")

好吧,其实这个用处不太大,,,

以上就是ggplot2绘制一些常见的Manhattan图,好处当然就是兼容ggplot2的参数,也就可以根据需要自行设置。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信补给站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
盘一盘 Python 系列特别篇 - Collection
我们在【盘一盘 Python 下】一贴介绍过 5 种类型的容器型(container)数据,分别是字符串(string)、列表(list)、元组(tuple)、字典(dictionary)和集合(set)。
用户5753894
2020/04/10
6000
盘一盘 Python 系列特别篇 - Collection
盘一盘 Python 系列特别篇 - All 和 Any
逻辑很简单,对于一个数 n,只有从 2 到 n 做个循环,来检查 n 是不是被每个数能整除,如果是,那么 n 不是质数;如果不是,n 是质数。简单明了,代码如下。
用户5753894
2020/04/24
5470
盘一盘 Python 系列特别篇 - All 和 Any
盘一盘 Python 系列 1 - 入门篇 (下)
Python 里函数太重要了 (说的好像在别的语言中函数不重要似的)。函数的通用好处就不用多说了吧,重复使用代码,增强代码可读性等等。
用户5753894
2019/07/05
1.4K0
盘一盘 Python 系列 1 - 入门篇 (下)
python内置数据结构list、set、dict、tuple(二)
# 传值和传地址的区别 # 对于简单的数值,采用传值操作,即在函数内对参数的操作不影响外面的变量 # 对于复杂变量,采用传地址操作,此时函数内的参数和外部变量是同一份内容, # 任何地方对此内容的更改都影响另外的变量或参数的使用 def a(n): n[2] = 300 print(n) return None def b(n): n += 100 print(n) return None an = [1,2,3,4,5,6] bn = 9 print
ruochen
2021/02/24
4170
python内置数据结构list、set、dict、tuple(二)
Python | 一文看懂Python列表、元组和字符串操作
列表(List)是Python中非常重要的内置数据类型。列表由一系列元素组成,所有的元组被包含在一对方括号中。列表被创建将后,可以执行添加、删除、修改操作。
咸鱼学Python
2020/11/20
4.8K0
Python | 一文看懂Python列表、元组和字符串操作
100天精通Python丨基础知识篇 —— 04、变量和基础数据类型详解
数据类型解决了"存"的问题:它决定了使用这个类型需要开辟空间的大小,用什么样的体位优雅的在内存中进行存储;
不吃西红柿
2023/03/30
4910
100天精通Python丨基础知识篇 —— 04、变量和基础数据类型详解
听说你会玩 Python 系列 3
在 Python 中,当创建变量时,不用像 C 语言那样在前面加入变量类型,如下图所示:
用户5753894
2020/05/21
6330
【python篇】——python基础语法一篇就能明白,快速理解
整数类型 (int):整数类型用于表示没有小数部分的数值,正负均可。 Python 中的整数不受大小限制,可以表示任意大的数
用户11286421
2024/09/23
3570
【python篇】——python基础语法一篇就能明白,快速理解
Python入门2
定义:列表是最常用的python数据类型,一个列表中可以存储多个不同类型的数据。 语法:[]可以是number、string、bool等
潇洒坤
2018/09/10
7010
Python入门2
Python入门基础教程-数据类型
Python数据类型主要分为Numbers(数字)、String(字符串)、List(列表)、Tuple(元祖)、Set(集合)、Dictionary(字典)
小一不二三
2019/12/31
8340
Python入门基础教程-数据类型
盘一盘 Python 系列特别篇 - 两大利「器」
本文作为 Python 系列的特别篇第 3 篇,主要介绍 Python 里的两大利「器」,生成器 (generator) 和迭代器 (iterator)。
用户5753894
2019/10/17
7530
python入门:集合set
在前面的几篇Python的文章中,我们介绍了Python的多种不同类型的对象:字符串、列表、元组、字典。它们有各自的特点:
皮大大
2021/09/02
8560
python入门:集合set
Datawhale组队学习 -- Task 4: 列表、元组和字符串
    列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为 [元素1, 元素2, ..., 元素n]。
余生大大
2022/11/02
3.1K0
Datawhale组队学习 -- Task 4: 列表、元组和字符串
【五】Python基础之数据结构:元组
与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。
菲宇
2019/06/13
4370
Python入门:4000字讲透python数据类型元组
在前面介绍的python数据类型:列表list,我们发现list是可以进行修改的。但是有时候,我们需要创建一系列不可修改的元素,此时Python中另一种有序的数据类型-元组tuple就可以满足这种需求。
皮大大
2021/08/21
6280
Python入门:4000字讲透python数据类型元组
【Python入门】Python字符串的45个方法详解
Python中字符串对象提供了很多方法来操作字符串,功能相当丰富。必须进行全面的了解与学习,后面的代码处理才能更得心应手,编程水平走向新台阶的坚实基础。目前一共有45个方法,给大家分类整理,可以收藏查询使用。
黄博的机器学习圈子
2020/05/26
1.7K0
【Python入门】Python字符串的45个方法详解
Python_实用入门篇_08
数学上,序列是被排成一列的对象(或事件)这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字,也就是它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
py3study
2020/01/19
7920
Python_实用入门篇_08
盘一盘 Python 系列 2 - NumPy (上)
Numpy 是 Python 专门处理高维数组 (high dimensional array) 的计算的包,每次使用它遇到问题都会它的官网 (www.numpy.org). 去找答案。 在使用 numpy 之前,需要引进它,语法如下:
用户5753894
2019/07/05
2.6K0
盘一盘 Python 系列 2 - NumPy (上)
python3_03.数据类型
  Python中的字符串用单引号(')或双引号(")括起来,同时使用反斜杠(\)转义特殊字符。
py3study
2020/01/03
6940
Python编程思想(5):列表与元组的基础知识
列表(list)、 元组(tuple) 和字典(dict)是Python中非常常用的三种集合类型数据结构,这三种数据结构都可用于保存多个数据项,这对于编程而言是非常重要的。这是因为程序不仅需要使用单个变量来保存数据,还需要使用多种数据结构来保存大量数据,而列表、元组和字典就可满足保存大量数据的需求。
蒙娜丽宁
2020/05/19
1.4K0
相关推荐
盘一盘 Python 系列特别篇 - Collection
更多 >
交个朋友
加入腾讯云官网粉丝站
蹲全网底价单品 享第一手活动信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验