正文共:1772 字 22 图 预计阅读时间: 5 分钟
前文推送
本文目录:
1. 前言
1.1 基本介绍
Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。
Pandas用于广泛的领域,包括金融,经济,统计,分析等学术和商业领域。Series 和 DataFrame 是Pandas 中最主要的数据结构,使用Pandas 就是使用 Series 和 DataFrame 来构造原始数据。
在时序分析中一般而言我们会将原始数据构造为 Series 数据结构,其中索引为时间序列的时间列,而值列则是相对应的数据结果,比如股票价格,订单数量等等。
为了在进行时序分析的过程中,方便地查看数据的变化过程,以及时序的特征,本文对 Series 的 plot 方法进行介绍。
Series 的 plot 方法直接调用的就是 matplotlib(最基础,最实用的绘图库) 的标准接口,实际上从该方法的设计初衷就可以发现,它就是为了简化使用 Pandas 进行数据处理时候对数据的可视化分析。
1.2 运行环境
2. 参数详解
参数 | 描述 |
---|---|
data | 数据序列Series |
kind | 图类型:折线图,柱形图,横向柱形图,直方图,箱线图,密度图,面积图,饼图 |
ax | matplotlib axes 对象,默认使用gca() |
figsize | 图像尺寸,tuple(宽度,高度),注意这里的单位是英寸 |
use_index | 是否使用索引作为x刻度标签 |
title | 标题 |
grid | 网格线 |
legend | 图例 |
style | 线的样式 |
logx | x轴使用对数刻度 |
logy | y轴使用对数刻度 |
loglog | x,y轴都使用对数刻度 |
xticks | x轴刻度标签 |
yticks | y轴刻度标签 |
xlim | 横轴坐标刻度的取值范围 |
ylim | 纵轴坐标刻度的取值范围 |
rot | 改变刻度标签(xticks, yticks)的旋转度 |
fontsize | 设置刻度标签(xticks, yticks)的大小 |
position | 柱形图的柱子的位置设置 |
table | 将数据以表格的形式展示出来 |
yerr | 带误差线的柱形图 |
xerr | 带误差线的柱形图 |
lable | 列的别名,作用在图例上 |
secondary_y | 双 y 轴,在右边的第二个 y 轴 |
mark_right | 双 y 轴时,在图例中的列标签旁增加显示 (right) 标识 |
**kwds | matplotlib plot方法的其他参数 |
3. 演示案例
引入包
简单查看plot方法帮助信息
构建一个时间序列
折线图
图例
坐标轴刻度
显示样式:网格,标题,画布,字体
折线图线型
其他参数
就是matplotlib中对图像控制的更多参数,因为Series的plot方法只是简单设置了常用控制参数,便于简单作图,如果需要输出为更美观的图像,需要做其他更多的参数控制。这里引入额外的color参数来控制线的颜色。
刻度线
表格显示
柱形图
柱形图带误差
横向柱形图
直方图
箱线图
密度图
选择 kde 和density 都是密度图,两者等价
面积图
需要特别注意,传入的所有值的符号要相同
饼图
需要特别注意需要传入的值都为正数
本文完整代码:
https://github.com/firewang/lingweilingyu/blob/master/pandas.Series.plot.ipynb