以下部分是基于《Fundamentals of Data Visualization》学习笔记,最近可能会不定期连载哦!要是有兴趣还等不及更新的话,可以直接看原版书籍:https://serialmentor.com/dataviz/
我们经常需要把一个整体按照某一个标准来进行分组,进而来观察不同分组所占的比例。例如我们想要查看纳入的患者当中男女比例是多少。这里我们就来介绍一下关于比例可视化的集中常用的方案。
从1961年到1983年,德国议会(称为联邦议院)由CDU / CSU,SPD和FDP三个不同政党的成员组成。在这段时间的大部分时间里,CDU / CSU和SPD的座位数量大致相当,而FDP通常只占一小部分座位。例如,在1976年至1980年的第八届联邦议院中,基民盟/基社盟拥有243个席位,SPD 214和FDP 39,共496个席位。此类议会数据通常以饼图的形式可视化。
饼形图将一个圆圈分成多个切片,以使每个切片的面积与其所占总数的比例成比例。同样的,我们可以在矩形上执行相同的步骤,结果是堆积的条形图。我们可以根据矩形是垂直还是水平分为,垂直堆叠的条形图或水平堆叠的条形图。
进一步的,我们还可以将?的条形图的每一个小部分并排放置,而不是将它们堆叠在一起。这种可视化功能可以更轻松地对这三个组进行直接比较。但是,在并排的条形图中,每个条形与总数的关系在视觉上并不明显。
对于以上三种可视化比例的图形而言。基本上可以用下面的表格来说明其主要的适用标准。
我们在上面提到过说,对于并排的条形图在进行不同比例之间的变化的比较时以及时间序列比较时是具有优势的。这里我们就用一个例子来说明这样可视化的好处。
这里假如我们需要对五个公司三年的营业额来进行可视化。其中这五个公司的营业额大约都在20%左右。
这个时候,当我们使用饼图可视化此数据集时,很难确切看到发生了什么。
当我们切换到堆积条形图时,图片会变得清晰一些。现在,可以清楚地看到A公司的市场份额增长和E公司的市场份额萎缩的趋势。但是,仍然很难比较这五家公司每年的相对市场份额。而且由于条形跨年相对变化的关系,很难比较B,C和D公司跨年的市场份额,
对于此假设数据集,并排条形图是最佳选择。该可视化显示出,从2015年到2017年,A公司和B公司都增加了市场份额,而D公司和E公司都减少了市场份额。它还表明,市场份额在2015年从A公司到E公司依次增加,并在2017年同样下降。