中南大学的一位读者提问:怎样绘制box-plot箱线图?
有这样一张文献图:
1.箱线图的知识
可能很多人不太理解什么是箱线图,谭编开始也不明白。下面简单介绍一下。
也可以查看之前推文:Graphpad Prism 8作图教程(6):箱型图,比较一下两个软件绘制箱型图的区别。
1.1箱线图的概念
箱线图(Box-plot)也称箱须图(Box-whisker Plot),它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围,可以粗略地看出数据是否具有对称性。
通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示各组数据的分布差异,为发现问题、改进流程提供线索。
1.2箱线图各项指标的计算方法
假设有n个实验值(乱序),按照从小到大排序得到一个序列,分别利用Q1、Q2、Q3、上限、下限的计算公式求出排列的位置及其相应的实验值。
(一)下四分位数Q1
(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数。
例中:
Q1所在的位置=(14+1)/4=3.75,
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
(二)中位数(第二个四分位数)Q2
中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。
例中:
Q2所在的位置=2(14+1)/4=7.5,
Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5
(三)上四分位数Q3
计算方法同下四分位数。
例中:
Q3所在的位置=3(14+1)/4=11.25,
Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。
(四)上限
上限是非异常范围内的最大值。
首先要知道什么是四分位距如何计算的?
四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR
(五)下限
下限是非异常范围内的最小值。
下限=Q1-1.5IQR
2.箱线图的绘图教程
前面普及了箱线图的基础知识,是不是我们也要按照那些公式计算呢?
大多数人利用Excel计算和画箱线图,教程大家可以百度一下。那么,利用Origin2018软件怎样绘制箱线图呢?
谭编以开始的那张文献图为例,详细讲解绘图教程
2.1数据的准备
准备一张数据表,删除X列,全部是Y列。分别是CSPbI3和CHI-CsPbI3的Jsc、Voc、FF、PCE的数据。
谭编没有这些实验数据,但是根据前文的那张文献图,利用随机函数生成了一系列数据。例如21左右的随机值:
F(x)=19+2*rnd()
为了在绘图中正常显示轴标签标题,在数据表头中Long name添加物理量的符号及其单位,例如Jsc(mA·cm-2)的上标\+(-2)下标\-(3)斜体\i(J)格式代码:
\i(J)\-(sc)(mA·cm \+(-2))
注意:在Units中好像不能使用上式中的格式转义符,所以只在Long Name中统一定义量符号及单位符号。
另外,在Comments中添加样品名称
CsPbI\-(3)CHI-CsPbI\-(3)
2.1箱线图的绘制
我们选择数据表的前两列数据(Jsc),点击菜单Plot找到箱线图。
得到下图:
但是,这里纵轴、横轴标题并不是我们想要的,我们需要将纵轴标题改为Jsc(mA·cm-2),横轴刻度标签改为CsPbI3和CHI-CsPbI3.
Y轴标题range似乎并不是与数据表同步更新的,因此我们双击Range,填入
%(?Y)
即可使之与数据表同步更新,我们只需要在数据表的表头中修改,绘图即可同步。
在添加上、右边框线后得到最终图,并保存为模板。如下图:
我们利用模板绘制出Voc曲线,通过隐藏左Y和显示右Y得到右Y箱线图,并保存为模板。
得到最终的右Y箱线图模板如下:
我们利用上面两个模板分别绘制FF、PCE图,共4张图。然后利用右边工具栏的Merge合并工具,将其合并为四屏图。
注意Merge方式选择Special自定义,将顺序重新调整好;然后调整水平和垂直间距均为0,确定;最后删除、隐藏那些多余的元素,调整好坐标刻度的疏密等美化。
最终效果图:
该模板的调用方式:
领取专属 10元无门槛券
私享最新 技术干货