Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。
注:所有代码均在IPython notebook中实现
heatmap 热力图
热力图在实际中常用于展示一组变量的相关系数矩阵,在展示列联表的数据分布上也有较大的用途,通过热力图我们可以非常直观地感受到数值大小的差异状况。heatmap的API如下所示:
下面将演示这些主要参数的用法,第一件事还是先导入相关的packages。
本次演示采用的数据集是Seaborn中内置的flights航班数据集:
如上图所示,dataframe中的数据代表了1949年-1960年每个月的航班乘客数量,接下来热力图就隆重登场啦!
热力图的右侧是颜色带,上面代表了数值到颜色的映射,数值由小到大对应色彩由暗到亮。从上面的heatmap中我们可以得到两层信息,一是随着时间的推移,飞机的乘客数量是在逐步增多的,二是航班的乘坐旺季在七月和八月份。下面就具体的参数进行演示。
:设置颜色带的最大值
:设置颜色带的最小值
可以看到右侧的颜色带最大最小值变了,而heatmap中颜色映射关系也会随之调整,将本图和上面的图进行对比便一目了然。
:设置颜色带的色系
好像变好看了?
:设置颜色带的分界线
细心的朋友可以察觉到颜色带上色彩两级的分界线变成了300
:是否显示数值注释
怎么回事?乱码了吗?其实数值注释默认显示的是科学记数法的数值,我们得把数值进行格式化,这就用到了下面的参数。
:format的缩写,设置数值的格式化形式
:控制每个小方格之间的间距
:控制分割线的颜色
:关于颜色带的设置
:传入布尔型矩阵,若为矩阵内为True,则热力图相应的位置的数据将会被屏蔽掉(常用在绘制相关系数矩阵图)
如果大家对上面的代码流程不大了解,可以把mask打印出来看看
参照mask和上面绘制的图,应该就很容易理解了,mask中为1的部分,就是要被盖掉的部分。演示到此为止,想更深入的学习可以自行查阅官方文档!
点击成为社区注册会员喜欢文章,点个在看
领取专属 10元无门槛券
私享最新 技术干货