这里介绍箱形图的绘制,这些图形在文章中是很常见的,也是必须要掌握的。比如下图中的E图(来自文献:DOI: 10.1002/jcp.30015 )
一.读入数据
如果你想获取该数据用于自己练习,下面是获取数据的地址:
https://docs.qq.com/sheet/DV0dxREV1YkJ0ZmVj
数据格式是这样的。
数据第A列是病人ID,B~E列是临床信息,其他列是病人的RNAseq数据。
你可以保存副本导出,然后自己读入。
假如我们需要绘制某基因在不同分期的表达情况。
先检查数据是否有缺失值,分期信息不知用N来表示,可以删除这些数据。
二.绘图
1.带误差线的箱形图
绘制箱型图用geom_boxplot函数。
notch参数:如果为假(默认),则制作标准盒图。如果为真,做一个缺口盒图。凹槽用来比较组;如果两个盒子的凹槽不重叠,说明中位数有显著差异。
notchwidth参数:如果指定notch参数为TRUE的话,指定切口宽度,默认0.5。
varwidth参数:如果为假(默认),则制作标准盒图。如果为真,那么方框的宽度将与组中观察值的平方根成正比。
将notch改为TRUE。
2.箱型与抖动散点组合图
有时候,数据量大,我们需要显示每一个数据点,可以很直观的看到数据的分布情况。在文章中这种图是很常见的。我们只需要在上面的箱形图中加入geom_jitter函数就可以啦。
参考资料:
R语言数据可视化之美,张杰/著
geom_boxplot函数帮助文档
领取专属 10元无门槛券
私享最新 技术干货