首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >跟着Nature学作图:R语言ggplot2频率分布直方图

跟着Nature学作图:R语言ggplot2频率分布直方图

作者头像
用户7010445
发布2023-01-06 19:09:10
发布2023-01-06 19:09:10
1.6K0
举报

论文

Graph pangenome captures missing heritability and empowers tomato breeding

https://www.nature.com/articles/s41586-022-04808-9#MOESM8

没有找到论文里的作图的代码,但是找到了部分组图数据,我们可以用论文中提供的原始数据模仿出论文中的图

今天的推文重复一下论文中的Figure2c 频率分布直方图

image.png

部分示例数据截图

image.png

作图数据用到的是R2那一列

读取数据集

代码语言:javascript
复制
library(readxl)

dat.fig2c<-read_excel("data/20220711/41586_2022_4808_MOESM6_ESM.xlsx",
                      sheet = "Fig2c",
                      skip = 1)
head(dat.fig2c)

这里第一行数据没有用,我们可以选择手动删除,或者设置读取数据时不读取第一行

作图代码

代码语言:javascript
复制
library(ggplot2)
library(latex2exp)

ggplot(data=dat.fig2c,aes(x=R2))+
  geom_histogram(aes(y=after_stat(count / sum(count)),
                     fill=Type),
                 bins = 150,
                 alpha=0.3)+
  scale_fill_manual(values = c("InDel-SV"="#a3cd5b",
                               "SNP-SV"="#8ea0cc"),
                    labels=c("InDel-SV"="InDel versus SV",
                             "SNP-SV"="SNP versus SV"))+
  theme_bw()+
  theme(panel.border = element_blank(),
        panel.grid = element_blank(),
        axis.line = element_line(),
        legend.position = c(0.1,0.9),
        legend.direction = "horizontal",
        legend.background = element_rect(fill="transparent"),
        legend.title = element_blank(),
        legend.justification = c(0,1))+
  scale_x_continuous(limits = c(0,1),
                     expand = expansion(mult = c(0,0)))+
  scale_y_continuous(limits = c(0,0.025),
                     expand = expansion(mult = c(0,0)),
                     breaks = seq(0,0.025,0.005),
                     labels = function(x){sprintf("%0.1f",x*100)})+
  labs(x=TeX(r"(\textit{R}$^2$)"),
       y="Frequency (%)")+
  geom_vline(xintercept = 0.7,lty="dashed") -> p1

p1

image.png

这里我个人认为把直方图的边框加上然后颜色深一些可能会好看一点

代码语言:javascript
复制
ggplot(data=dat.fig2c,aes(x=R2))+
  geom_histogram(aes(y=after_stat(count / sum(count)),
                     fill=Type),
                 bins = 150,
                 alpha=1,
                 color="black")+
  scale_fill_manual(values = c("InDel-SV"="#a3cd5b",
                               "SNP-SV"="#8ea0cc"),
                    labels=c("InDel-SV"="InDel versus SV",
                             "SNP-SV"="SNP versus SV"))+
  theme_bw()+
  theme(panel.border = element_blank(),
        panel.grid = element_blank(),
        axis.line = element_line(),
        legend.position = c(0.1,0.9),
        legend.direction = "horizontal",
        legend.background = element_rect(fill="transparent"),
        legend.title = element_blank(),
        legend.justification = c(0,1))+
  scale_x_continuous(limits = c(0,1),
                     expand = expansion(mult = c(0,0)))+
  scale_y_continuous(limits = c(0,0.025),
                     expand = expansion(mult = c(0,0)),
                     breaks = seq(0,0.025,0.005),
                     labels = function(x){sprintf("%0.1f",x*100)})+
  labs(x=TeX(r"(\textit{R}$^2$)"),
       y="Frequency (%)")+
  geom_vline(xintercept = 0.7,lty="dashed") -> p2

p2

image.png

拼图

代码语言:javascript
复制
library(patchwork)
p1+p2

image.png

这里新学到的知识点:使用latex2exp这个R包的TeX()函数来添加文本比expression()函数好用

比如这里设置 横坐标轴标题的斜体和上标的代码x=TeX(r"(\textit{R}

示例数据和代码可以自己到论文中获取

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 论文
  • 部分示例数据截图
  • 读取数据集
  • 作图代码
  • 拼图
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档