首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Pandas可视化综合指南:手把手从零教你绘制数据图表

Pandas可视化综合指南:手把手从零教你绘制数据图表

作者头像
量子位
发布于 2019-09-24 06:54:21
发布于 2019-09-24 06:54:21
2.7K00
代码可运行
举报
文章被收录于专栏:量子位量子位
运行总次数:0
代码可运行

数据可视化本来是一个非常复杂的过程,但随着Pandas数据帧plot()函数的出现,使得创建可视化图形变得很容易。

在数据帧上进行操作的plot()函数只是matplotlib中plt.plot()函数的一个简单包装 ,可以帮助你在绘图过程中省去那些长长的matplotlib代码。

最近,一位来自印度的小哥以2019年世界幸福指数的数据为例,详细讲述了在Pandas中plot()函数的各种参数设置的小技巧,熟练掌握这些技巧后,你也能绘制出丰富多彩的可视化图表。

导入数据

在绘制图形前,我们首先需要导入csv文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd
df=pd.read_csv(./world-happiness-report-2019.csv’)
df.head(3)

这个csv图标的内容是各个国家按照不同维度评价的幸福指数(数据下载地址见文末):

数据帧中一些列的名称比较冗长,可以重命名使其更加简洁:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.rename(columns={“Country (region): “Country”, “Log of GDP\nper capita”: “Log_GDP_per_capita”, “Healthy life\nexpectancy”:”Health_life_expect”},inplace=True)
df.columns

绘制柱状图、散点图等常见图形

从最近简单的柱状图开始,只统计腐败程度、自由度、宽容度、社会支持等几个维度

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
%matplotlib tk
df1=df[:5]
df1.plot(‘Country’,[‘Corruption’,’Freedom’,’Generosity’,’Social support’],kind = ‘bar’)

嫌直接写名称太麻烦?没关系,我们也可以用所在列的数字来绘制,比如上述4个列分别为7、6、8、5:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
%matplotlib tk
df1=df[:5]
df1.plot(‘Country’,[7,6,8,5],kind = ‘bar’)

在上面的代码中kind = ‘bar’,所以绘制的图形是柱状图,如果我们把参数改成kind = ‘line’,画出的就是线状图

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df1=df[:5]
df1.plot(‘Country’,[‘Corruption’,’Freedom’,’Generosity’,’Social support’],kind = ‘line’)

同样的,如果把参数改成kind = ‘line’,还能绘制出箱形图:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df[:5].plot(x=’Country’,kind=’box’)

对于散点图,设置kind=’scatter’,绘制出腐败程度与自由度之间的关系,用color=’R’将点定义为红色:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.plot(x=’Corruption’,y=’Freedom’,kind=’scatter’,color=R)

此外,Pandas中还有一个辅助函数pandas.plotting.table,它创建一个来自数据帧的表格,并将其添加到matplotlib Axes实例中。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from pandas.plotting import table
df1=df[:5]
df1=df.loc[:5,[‘Country (region),’Corruption’,’Freedom’,’Generosity’,’Social support’]]
ax=df1.plot(‘Country (region),[‘Corruption’,’Freedom’,’Generosity’,’Social support’], kind = ‘bar’, title =’Bar Plot’,legend=None)
table(ax, np.round(df1.describe(), 2),loc=’upper right’)

坐标轴的设置

取值范围

使用xlim和ylim两个参数可设置x和y轴的范围。在折线图中,我们要将x轴设置为0到20,y限制为从0到100。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df1=df[:20]
df1[‘Freedom’].plot(kind=’line’,xlim=(0,20),ylim=(0,100))

x、y轴刻度

有时候坐标轴上的刻度并不理想,我们希望在上面标上我们喜欢的数值。

比如对于x轴,我们想要标上0、10、15和20几个值;对于y轴,我们想要标上0、50、70、100几个值,可以在xticksyticks参数中悉数列出。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df[:20][‘Freedom’].plot(kind=’line’,xlim=(0,20),ylim=(0,100),color=’red’,xticks=([0,10,15,20]),yticks=([0,50,70,100]), title = ‘xticks’)

但是用列表来制定坐标刻度的方法,在数值太多的时候就比较麻烦了,因此我们还能通过指定刻度间隔的方法来绘制坐标轴,比如指定x轴间隔是1,y轴间隔是10:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df[:20][‘Freedom’].plot(kind=’line’,xlim=(0,20),ylim=(0,100),color=’red’,xticks=([w1 for w in range(20)]),yticks=([w10 for w in range(40)]))

如果我们不希望在坐标轴上看到数字,而是想要设置标签。我们还可以将x轴标签更改为文本标签“低、中、高”这种样式。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ax=df[:20][‘Freedom’].plot(kind=’line’,xlim=(0,20),ylim=(0,100),color=’red’,xticks=([0,10,20]),yticks=([w*30 for w in range(40)]))
ax.set_xticklabels([‘Low’,’Med’,’High’])

对数坐标

如果数据的跨度范围非常大,横跨好几个数量级,那么用线性坐标就无法很好地展示数据。这时候我们需要用到对数坐标,设置方法是将logx或者logy的值设置为Ture

如果我们只想设置x轴为对数坐标,y轴仍保持线性坐标,那么

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df[:20][‘Freedom’].plot(kind=’line’,xlim=(0,1000),ylim=(0,100),color=’red’,logx=True)

其他高阶用法

可以使用stacked参数来绘制带有条形图的堆叠图。在这里,我们绘制堆叠的水平条,stacked设置为True。

将grid参数设置为True,可以给图表加入网格。

有了subplot参数还可以绘制子图,根据需要指定行数和列数以及绘图的数量。

在上面的子图中,我们没有给子图添加标题。当subplot 设置为True 时,在设置一组title的值,即可在列表上方加入标题。

原文链接: https://kanoki.org/2019/09/16/dataframe-visualization-with-pandas-plot/

表格下载地址: https://www.kaggle.com/PromptCloudHQ/world-happiness-report-2019/version/1

作者系网易新闻·网易号“各有态度”签约作者

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
干货|教你一文掌握:Matplotlib+Seaborn可视化
Seaborn和Matplotlib是Python最强大的两个可视化库。Seaborn其默认主题让人惊讶,而Matplotlib可以通过其多个分类为用户打造专属功能。
1480
2020/03/09
5K0
干货|教你一文掌握:Matplotlib+Seaborn可视化
超硬核的 Python 数据可视化教程!
python中最基本的作图库就是matplotlib,是一个最基础的Python可视化库,一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。
龙哥
2020/09/04
5.3K0
超硬核的 Python 数据可视化教程!
Pandas可视化(一):pandas.Series.plot
Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。
fireWang
2019/04/24
2K0
Pandas可视化(一):pandas.Series.plot
你知道怎么用Pandas绘制带交互的可视化图表吗?
之前咱们介绍过Pandas可视化图表的绘制《『数据可视化』一文掌握Pandas可视化图表》,不过它是依托于matplotlib,因此无法进行交互。但其实,在Pandas的0.25.0版本之后,提供了一些其他绘图后端,其中就有我们今天要演示的主角基于Bokeh!
可以叫我才哥
2021/09/24
4.1K0
数据可视化之matplotlib绘制正余弦曲线图
在python里面,数据可视化是python的一个亮点。在python里面,数据可视可以达到什么样的效果,这当然与我们使用的库有关。python常常需要导入库,并不断调用方法,就很像一条流数据可视化的库,有很多,很多都可以后续开发,然后我们调用。了解过pyecharts美观的可视化界面 ,将pyecharts和matplotlib相对比一下。
兰舟千帆
2022/07/16
1.9K0
数据可视化之matplotlib绘制正余弦曲线图
NBA球员投篮数据可视化。
/ 01 / 篮球场 从网上找的篮球场尺寸图,如下。 其中单位为英尺,NBA的球场尺寸为94英尺长,50英尺宽。 下图是我用CAD绘制半场尺寸图,本次绘图就是按照下面这个尺寸来的。 有了尺寸,接下来
小F
2020/10/09
1.2K0
NBA球员投篮数据可视化。
手把手带你可视化分析NBA首轮球队表现及火勇对决前瞻!
NBA激战正酣,首轮除掘金和马刺的较量还没有结束外,其余对决都已经结束,本文将手把手带你可视化分析下各球队的首轮表现,同时将对次轮最受瞩目的火勇大战进行一个简单的前瞻分析!
石晓文
2019/05/13
6500
手把手带你可视化分析NBA首轮球队表现及火勇对决前瞻!
Python数据分析实战(3)Python实现数据可视化
数据可视化是指将数据放在可视环境中、进一步理解数据的技术,可以通过它更加详细地了解隐藏在数据表面之下的模式、趋势和相关性。
cutercorley
2020/08/31
4.7K0
Python3快速入门(十六)——Mat
Matplotlib是 Python 2D-绘图领域使用最广泛的套件,可以简易地将数据图形化,并且提供多样化的输出格式。 matplotlib有两个接口,一个是状态机层的接口,通过pyplot模块来进行管理;一个是面向对象的接口,通过pylab模块将所有的功能函数全部导入其单独的命名空间内。
py3study
2020/01/03
1.4K0
数据分析中的可视化-常见图形
import matplotlib.pyplot as plt import pandas as pd from pandas import Series, DataFrame
用户1332428
2018/07/26
1.5K0
数据分析中的可视化-常见图形
数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)
导读:我们介绍过用matplotlib制作图表的一些tips,感兴趣的同学可以戳→纯干货:手把手教你用Python做数据可视化(附代码)。matplotlib是一个相当底层的工具。你可以从其基本组件中组装一个图表:数据显示(即绘图的类型:线、条、框、散点图、轮廓等)、图例、标题、刻度标记和其他注释。
前端皮皮
2021/05/18
5.9K0
数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)
matplotlib 入门使用指南
1. pyplot模块 1.1. color的值 blue 1.2. Marker的值 point marker 1.3. LineStyles的值 solid line style 例子: 'b' # blue markers with default shape 'ro' # red circles 'g-' # green solid line '--' # dashed line with default color 'k^:' # black triangle_up mark
syy
2020/04/07
1K0
Python数据可视化工具:Matplotlib学习笔记(一)
大家好,我是小雨。 今天要跟大家分享的内容?是关于Python数据可视化方面的内容。Python在数据处理方面真的太厉害了,所以总结了部分笔记,分享给大家一起学习。 简介 matplotlib是什
小雨coding
2021/03/27
1.5K0
Matplotlib 系列之「绘制函数图像」
matplotlib 是 python 最著名的绘图库,它提供了一整套和 matlab 相似的命令 API,十分适合交互式进行绘图。
Python技术与生活认知的分享
2018/08/16
1.4K0
Matplotlib 系列之「绘制函数图像」
Matplotlib 学习笔记
在 matplotlib 中,整个图像为 Figure ,而一个 Figure 中可以有多个 axes。
zucchiniy
2020/05/22
5890
python数据可视化系列教程——matplotlib绘图全解
matplotlib是受MATLAB的启发构建的。MATLAB是数据绘图领域广泛使用的语言和工具。MATLAB语言是面向过程的。利用函数的调用,MATLAB中可以轻松的利用一行命令来绘制直线,然后再用一系列的函数调整结果。
全栈程序员站长
2022/07/02
3.4K0
python数据可视化系列教程——matplotlib绘图全解
Pandas可视化(一):pandas.Series.plot
Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。
fireWang
2019/04/08
9.1K0
Pandas可视化(一):pandas.Series.plot
纯干货:手把手教你用Python做数据可视化(附代码)
导读:制作提供信息的可视化(有时称为绘图)是数据分析中的最重要任务之一。可视化可能是探索过程的一部分,例如,帮助识别异常值或所需的数据转换,或者为建模提供一些想法。对于其他人来说,构建网络交互式可视化可能是最终目标。Python有很多附加库可以用来制作静态或动态的可视化文件,但是我将主要关注matplotlib和以它为基础的库。
IT阅读排行榜
2018/09/29
5.3K0
纯干货:手把手教你用Python做数据可视化(附代码)
《利用Python进行数据分析·第2版》第9章 绘图和可视化9.1 matplotlib API入门9.2 使用pandas和seaborn绘图9.3 其它的Python可视化工具9.4 总结
信息可视化(也叫绘图)是数据分析中最重要的工作之一。它可能是探索过程的一部分,例如,帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。另外,做一个可交互的数据可视化也许是工作的最终目标。Python有许多库进行静态或动态的数据可视化,但我这里重要关注于matplotlib(http://matplotlib.org/)和基于它的库。 matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。该项目是由John Hunter于2002年启动的,其目的是为Python构建一个MA
SeanCheney
2018/04/24
7.8K0
《利用Python进行数据分析·第2版》第9章 绘图和可视化9.1 matplotlib API入门9.2 使用pandas和seaborn绘图9.3 其它的Python可视化工具9.4 总结
手把手教你用Matplotlib画一个小清新配色的商业图表
导读:本文使用小清新配色对散点图和折线图进行另类的绘制,绘制出让人耳目一新的商业图表可视化作品。
IT阅读排行榜
2020/09/08
1.2K0
手把手教你用Matplotlib画一个小清新配色的商业图表
推荐阅读
相关推荐
干货|教你一文掌握:Matplotlib+Seaborn可视化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档