Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >R绘图笔记 | 二维散点图与统计直方图组合

R绘图笔记 | 二维散点图与统计直方图组合

作者头像
DoubleHelix
发布于 2020-11-11 02:00:28
发布于 2020-11-11 02:00:28
1.7K00
代码可运行
举报
文章被收录于专栏:生物信息云生物信息云
运行总次数:0
代码可运行

参考前文:R绘图笔记 | R语言绘图系统与常见绘图函数及参数


前面介绍了散点图柱状图直方图和核密度估计图,有时候散点图不能很直观的看的出数据的分布情况,这里介绍散点图与统计直方图组合绘制。


一.方法1

利用ggpubr包的ggscatterhist()函数进行绘制。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggscatterhist(data, x, y, group = NULL, color = "black", fill = NA,
  palette = NULL, shape = 19, size = 2, linetype = "solid",
  bins = 30, margin.plot = c("density", "histogram", "boxplot"),
  margin.params = list(), margin.ggtheme = theme_void(),
  margin.space = FALSE, main.plot.size = 2, margin.plot.size = 1,
  title = NULL, xlab = NULL, ylab = NULL, legend = "top",
  ggtheme = theme_pubr(), ...)

部分参数解释:

data是用于绘图的数据,x和y分别指定数据中的x轴和y轴,group指定一个分组变量,shape指定点的形状【参考:散点图】。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(ggpubr)

N<-300
x1 <- rnorm(mean=1.5, N)
y1 <- rnorm(mean=1.6, N)
x2 <- rnorm(mean=2.5, N)
y2 <- rnorm(mean=2.2, N)

data1 <- data.frame(x=c(x1,x2),y=c(y1,y2))
head(data1)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> head(data1)
           x         y
1  1.9237124 0.1088482
2  3.1930833 1.8434623
3  3.4372797 1.9396251
4 -0.1662552 1.9320601
5  1.4886753 0.7804415
6  1.7652103 0.4776553

margin.plot = "histogram"指定边缘的图是直方图,margin.params用来指定该图形的参数。看下面代码,比较一下就知道各参数什么意思。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggscatterhist(
  data1, x ='x', y = 'y', shape=21,fill="#7FFFD4",color = "black",size = 3, alpha = 1,
  #palette = c("#00AFBB", "#E7B800", "#FC4E07"),
  margin.params = list( fill="red",color = "blue", size = 0.3,alpha=1),
  margin.plot =  "histogram",
  legend = c(0.8,0.8),
  ggtheme = theme_minimal())

如果是散点图结合核密度估计图,将margin.plot 设置为 "density",多组数据,fill= "class",参数palette指定填充颜色,看一个案例。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
N<-200
x1 <- rnorm(mean=1.5, sd=0.5,N)
y1 <- rnorm(mean=2,sd=0.2, N)
x2 <- rnorm(mean=2.5,sd=0.5, N)
y2 <- rnorm(mean=2.5,sd=0.5, N)
x3 <- rnorm(mean=1, sd=0.3,N)
y3 <- rnorm(mean=1.5,sd=0.2, N)
data2 <- data.frame(x=c(x1,x2,x3),y=c(y1,y2,y3),class=rep(c("A","B","C"),each=200))
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> head(data2)
          x        y class
1 1.9221129 2.139207     A
2 2.1656947 1.778408     A
3 1.6277478 2.221711     A
4 1.1816189 2.006987     A
5 1.6467425 1.833635     A
6 0.4997666 2.033704     A
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggscatterhist(
  data2,  x ='x', y = 'y',  #iris
  shape=21,color ="black",fill= "class", size =3, alpha = 0.8,
  palette = c("#00AFBB", "#E7B800", "#FC4E07"),
  margin.plot =  "density",
  margin.params = list(fill = "class", color = "black", size = 0.2),
  legend = c(0.9,0.15),
  ggtheme = theme_minimal())

二.方法2

利用ggExtra包的ggMarginal()函数

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggMarginal(p, data, x, y, type = c("density", "histogram", "boxplot",
  "violin", "densigram"), margins = c("both", "x", "y"), size = 5, ...,
  xparams = list(), yparams = list(), groupColour = FALSE,
  groupFill = FALSE)

p:添加边缘地块的ggplot2散点图。如果p不提供,则必须提供所有数据,x和y。

data:用于创建边缘地块的数据。框架。如果p被提供并且边缘图反映相同的数据是可选的。

type:要显示什么类型的边缘图。其中之一是[密度,直方图,箱线图,小提琴,密度图(density, histogram, boxplot, violin, densigram)](“密度图”是指密度图覆盖在直方图上)。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
scatter <- ggplot(data=data1,aes(x=x,y=y)) + 
  geom_point(shape=21,fill="#00AFBB",color="black",size=3)+
  theme_minimal()+
  theme(
    #text=element_text(size=15,face="plain",color="black"),
    axis.title=element_text(size=15,face="plain",color="black"),
    axis.text = element_text(size=13,face="plain",color="black"),
    legend.text= element_text(size=13,face="plain",color="black"),
    legend.title=element_text(size=12,face="plain",color="black"),
    legend.background=element_blank()
    #legend.position = c(0.12,0.88)
  )

ggMarginal(scatter,type="histogram",color="black",fill="#00AFBB")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
scatter <- ggplot(data=data2,aes(x=x,y=y,colour=class,fill=class)) + 
  geom_point(aes(fill=class),shape=21,size=3)+#,colour="black")+
  scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  scale_colour_manual(values=c("#00AFBB", "#E7B800", "#FC4E07"))+
  theme_minimal()+
  theme(
    #text=element_text(size=15,face="plain",color="black"),
    axis.title=element_text(size=15,face="plain",color="black"),
    axis.text = element_text(size=13,face="plain",color="black"),
    legend.text= element_text(size=13,face="plain",color="black"),
    legend.title=element_text(size=12,face="plain",color="black"),
    legend.background=element_blank(),
    legend.position = c(0.9,0.15)
  )
ggMarginal(scatter,type="density",color="black",groupColour = FALSE,groupFill = TRUE)

三.方法3

利用grid.arrange()函数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(gridExtra)
#(a) 二维散点与统计直方图

# 绘制主图散点图,并将图例去除,这里point层和path层使用了不同的数据集
scatter <- ggplot() + 
  geom_point(data=data1,aes(x=x,y=y),shape=21,color="black",size=3)+
   theme_minimal()
# 绘制上边的直方图,并将各种标注去除
hist_top <- ggplot()+
  geom_histogram(aes(data1$x),colour='black',fill='#00AFBB',binwidth = 0.3)+
  theme_minimal()+
  theme(panel.background=element_blank(),
        axis.title.x=element_blank(), 
        axis.title.y=element_blank(),
        axis.text.x=element_blank(),
        axis.text.y=element_blank(),
        axis.ticks=element_blank())
# 同样绘制右边的直方图
hist_right <- ggplot()+
  geom_histogram(aes(data1$y),colour='black',fill='#00AFBB',binwidth = 0.3)+
  theme_minimal()+
  theme(panel.background=element_blank(),
        axis.title.x=element_blank(), 
        axis.title.y=element_blank(),
        #axis.text.x=element_blank(),
        axis.text.y=element_blank(),
        axis.ticks=element_blank())+
  coord_flip()

empty <- ggplot() +
  theme(panel.background=element_blank(),
        axis.title.x=element_blank(), 
        axis.title.y=element_blank(),
        axis.text.x=element_blank(),
        axis.text.y=element_blank(),
        axis.ticks=element_blank())
# 要由四个图形组合而成,可以用空白图作为右上角的图形也可以,但为了好玩加上了R的logo,这是一种在ggplot中增加jpeg位图的方法
# logo <-  read.jpeg("d:\\Rlogo.jpg")
# empty <- ggplot(data.frame(x=1:10,y=1:10),aes(x,y))+
#   annotation_raster(logo,-Inf, Inf, -Inf, Inf)+
#   opts(axis.title.x=theme_blank(), 
#        axis.title.y=theme_blank(),
#        axis.text.x=theme_blank(),
#        axis.text.y=theme_blank(),
#        axis.ticks=theme_blank())
# 最终的组合
grid.arrange(hist_top, empty, scatter, hist_right, ncol=2, nrow=2, widths=c(4,1), heights=c(1,4))
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 绘制主图散点图,并将图例去除,这里point层和path层使用了不同的数据集
scatter <- ggplot() + 
  geom_point(data=data2,aes(x=x,y=y,fill=class),shape=21,color="black",size=3)+
  scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  theme_minimal()+
  theme(legend.position=c(0.9,0.2))
# 绘制上边的直方图,并将各种标注去除
hist_top <- ggplot()+
  geom_density(data=data2,aes(x,fill=class),colour='black',alpha=0.7)+
  scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  theme_void()+
  theme(legend.position="none")
# 同样绘制右边的直方图
hist_right <- ggplot()+
  geom_density(data=data2,aes(y,fill=class),colour='black',alpha=0.7)+
  scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  theme_void()+
  coord_flip()+
  theme(legend.position="none")

empty <- ggplot() +
  theme(panel.background=element_blank(),
        axis.title.x=element_blank(), 
        axis.title.y=element_blank(),
        axis.text.x=element_blank(),
        axis.text.y=element_blank(),
        axis.ticks=element_blank())
# 要由四个图形组合而成,可以用空白图作为右上角的图形也可以,但为了好玩加上了R的logo,这是一种在ggplot中增加jpeg位图的方法
# logo <-  read.jpeg("d:\\Rlogo.jpg")
# empty <- ggplot(data.frame(x=1:10,y=1:10),aes(x,y))+
#   annotation_raster(logo,-Inf, Inf, -Inf, Inf)+
#   opts(axis.title.x=theme_blank(), 
#        axis.title.y=theme_blank(),
#        axis.text.x=theme_blank(),
#        axis.text.y=theme_blank(),
#        axis.ticks=theme_blank())
# 最终的组合
grid.arrange(hist_top, empty, scatter, hist_right, ncol=2, nrow=2, widths=c(4,1), heights=c(1,4))

参考资料:

1.R语言数据可视化之美,张杰/著

2.grid.arrange()函数帮助文档

3.ggMarginal()函数帮助文档

4.ggscatterhist()函数帮助文档

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
tSNE可视化
t-SNE是一种用于探索高维数据的非线性降维算法,非常适合将高维数据降到二维或者三维,在使用散点图等基本图表进行可视化。PCA是一种线性算法,他不能解释特征之间的复杂多项式关系,而t-SNE基于在领域图上随机游走的概率分布来找到数据内的结构。
爱学习的小明明
2020/10/08
1.6K0
tSNE可视化
基于 R 语言的科研论文绘图技巧详解(4)
在查阅文献的过程中,看到了几幅非常不错的出版图,今天就跟着小编一起学习下,他们是怎么使用 R 绘制出来的。
庄闪闪
2022/05/24
8390
基于 R 语言的科研论文绘图技巧详解(4)
ggplot2添加躺平版P_value
❝今天来主要介绍如何在常见的箱线图基础上水平添加显著性标记,也许恰好您正好有此特殊需求,希望对各位观众老爷有所帮助;下面来看具体案例; ❞ 加载R包 library(tidyverse) library(rstatix) library(ggprism) library(ggpubr) 定义主题 theme_niwot <- function(){ theme_test() + theme(axis.title.x = element_blank(), axis.line
R语言数据分析指南
2022/09/21
5740
ggplot2添加躺平版P_value
R可视乎|圆环图
对于饼图,上一次学习《R语言数据可视化之美》的时候主要利用graphics包和ggplot包(可见R可视乎|饼图)。这几天的学习中发现还有一个更加简便的方法——ggpie包。接下来做简单描述,然后进入圆环图的学习。
庄闪闪
2021/04/09
2.6K0
跟着Nature Communications学作图:R语言ggplot2堆积柱形图组合饼状图
https://www.nature.com/articles/s41467-024-45739-5
用户7010445
2024/03/22
3310
跟着Nature Communications学作图:R语言ggplot2堆积柱形图组合饼状图
R优雅的进行统计分析(1) T_test
❝本节来介绍如何使用R语言来做数据统计分析,通过「rstati」包进行t-test,完全使用tidyverse体系进行数据清洗及可视化 ❞ 安装并加载R包 package.list=c("tidyverse","rstatix","ggtext") for (package in package.list) { if (!require(package,character.only=T, quietly=T)) { install.packages(package) library(
R语言数据分析指南
2022/09/21
5210
R优雅的进行统计分析(1) T_test
[GBD数据库挖掘] 13.ggplot2绘制风险因素图
R语言数据分析指南
2023/11/23
5290
[GBD数据库挖掘] 13.ggplot2绘制风险因素图
【单细胞中性粒】慢性病毒性肝炎(复现fig1)
这里我画的确实不咋美观呢【此外,似乎原文的marker不是按照top基因来选的?】
生信菜鸟团
2024/06/11
1110
【单细胞中性粒】慢性病毒性肝炎(复现fig1)
R可视乎 | 散点图系列(2)
散点图(scatter graph、point graph、X-Y plot、scatter chart )是科研绘图中最常见的图表类型之一,通常用于显示和比较数值。散点图是使用一系列的散点在直角坐标系中展示变量的数值分布。在二维散点图中,可以通过观察两个变量的数据变化,发现两者的关系与相关性。
庄闪闪
2021/04/09
1.3K0
酷不酷炫!想不想学!带统计学的PCoA完美解决打样本量多组数据不好区分的问题!!
由于高通量测序的价格降的越来越低,现在很多人的研究已经从早期几个、十几个样品的研究发展到了几十、几百、甚至上千个样品,这种确实在以扩增子测序为基础的研究中越发明显。
DataCharm
2021/02/22
1.6K0
酷不酷炫!想不想学!带统计学的PCoA完美解决打样本量多组数据不好区分的问题!!
跟着Nature Biotechnology学作图:R语言pca分析并使用ggplot2可视化结果
https://www.nature.com/articles/s41587-022-01440-w#data-availability
用户7010445
2023/01/06
8060
跟着Nature Biotechnology学作图:R语言pca分析并使用ggplot2可视化结果
全网最全的R语言基础图形合集
直方图是一种对数据分布情况进行可视化的图形,它是二维统计图表,对应两个坐标分别是统计样本以及该样本对应的某个属性如频率等度量。
生信学习者
2024/06/12
950
全网最全的R语言基础图形合集
个性化气泡图:创意绘制新风尚
R语言数据分析指南
2024/05/17
1870
个性化气泡图:创意绘制新风尚
基于 R 语言的科研论文绘图技巧详解(1)
在查阅文献的过程中,看到了几幅非常不错的出版图,今天就跟着小编一起学习下,他们是怎么使用 R 绘制出来的。
庄闪闪
2022/05/24
1.5K0
基于 R 语言的科研论文绘图技巧详解(1)
基于 R 语言的科研论文绘图技巧详解(2)
在查阅文献的过程中,看到了几幅非常不错的出版图,今天就跟着小编一起学习下,他们是怎么使用 R 绘制出来的。
庄闪闪
2022/05/24
1K0
基于 R 语言的科研论文绘图技巧详解(2)
scRNA分析| Seurat堆叠小提琴图不满足? 那就ggplot2 堆叠 各种元素
单细胞常见的可视化方式有DimPlot,FeaturePlot ,DotPlot ,VlnPlot 和 DoHeatmap几种 ,Seurat均可以实现,但文献中的图大多会精美很多。比如
生信补给站
2023/08/25
4.6K0
scRNA分析| Seurat堆叠小提琴图不满足?  那就ggplot2 堆叠 各种元素
高维数据的展示
降维方法分线性降维和非线性降维两大类,其中线性降维包括主成分分析PCA,多为尺度分析MDS,非矩阵分解NMF等;非线性方法包括等距特征映射和局部线性嵌套,tSNE等。
爱学习的小明明
2020/10/08
1.2K0
高维数据的展示
qqboxplot--实现Q-Q plot和箱型图的整合!
箱形图(Box-plot)又称为盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。QQplot也就是Quantile-Quantile Plots。是通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法。
作图丫
2022/03/29
6230
qqboxplot--实现Q-Q plot和箱型图的整合!
文献组图
追风少年i
2025/01/07
620
文献组图
R数据可视化简单小例子~NBA球员薪水排行榜Top10
http://www.espn.com/nba/salaries/_/year/2020
用户7010445
2020/06/10
7010
R数据可视化简单小例子~NBA球员薪水排行榜Top10
相关推荐
tSNE可视化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验