Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >干货 | Python爬虫实战(中):数据可视化-教你做出漂亮的图表

干货 | Python爬虫实战(中):数据可视化-教你做出漂亮的图表

作者头像
短短的路走走停停
发布于 2020-03-06 07:21:30
发布于 2020-03-06 07:21:30
1.4K00
代码可运行
举报
文章被收录于专栏:程序猿声程序猿声
运行总次数:0
代码可运行

文案代码 向柯玮 审核校对 邓发珩

前言

各位看客老爷们,我又来啦。上一期我们利用Python+百度地图POI抓取了一些高校之间的距离数据,传送门:

干货 | Python爬虫实战:两点间的真实行车时间与路况分析(上)

不知道上一期的爬取数据的内容大家都品尝的怎么样了呢。

今天给大家带来的是python中对数据进行可视化处理的内容。

可能大家并不是很懂这个可视化的意思,大家可以先在脑海里面脑补一下那种酷炫的数据分析图,脑补出来了吗?

嘿嘿,用Python究竟能做一些什么样的图表呢,可以肯定的告诉大家,只有你想不到,没有它做不到!吊了半天胃口,现在上图!

直角坐标系动态散点图

直角坐标系柱状图

3D柱状图

地图

对,我们要做的图就是和上面这几张图片一样!酷吧?

上面的效果图都是我们今天要介绍的主角pyecharts库制作的!当然,pyecharts的作图类型肯定不仅仅只有上述这些图形,它还有很多很多类型,在这里我就不多说了。

在这一期推文中呢,我们主要介绍的是第一种图形,柱状图的使用。

目录

  • pyecharts模块的下载
  • 模型的建立
    • 数据的导入
    • 图形的生成
    • 加点更炫的
  • 写在最后

pyecharts模块的下载

要使用这个模块,你必须要下载这个模块,打开自己电脑的cmd,输入pip install pyecharts就可以了,如果本来就有这个模块的话,就不用下载了。

当然,如果电脑没有pip这个模块的话,需要自己去下载一个这个模块,在后续的推文中,小玮会给大家带来一些python的基本配置应该做的相关推文,帮助大家解决python的安装问题。

在安装这个模块之后,我们就可以在编译器中引用这个模块了。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from pyecharts.charts import Bar

这里的Bar柱状图的意思。

pyecharts的库里面有很多很多东西,我们没有必要全部引用,那样会让本来简单的程序运行起来忒慢。

模型的建立

引入了这个模块当然还不够,我们还需要数据。

数据的导入

大家还记得我们上一篇推文中生成的csv文件吗?如果已经忘了,请回去再看看上一篇推文,然后运行程序把相应的csv文件生成出来。

那么,我现在就认为大家已经有这个csv文件了。在一个程序中,我们想要获得一个文件的数据,需要做什么?想一想。

没错,就是读取这个文件。那么大家还记得读取这个文件怎么办吗?没错,就是加入pandas模块,运用pandas的函数来进行文件的读取。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

具体怎么读取呢?和之前的也是一模一样。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
path_data=pd.read_csv(r'F:\my python\123.csv')

这些在上一篇推文中都已经很详细的介绍过了,这一次就不多说了。要是忘了记得回去看看奥-

图形的生成

做好了这些之后,我们正式的来介绍一下建立柱状图这个函数。

第一步,定义一个变量是bar型变量。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
bar=Bar()

这一句代码的意思就是使barBar型变量。接下里就是为这个变量赋x轴值和y轴值。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
bar.add_xaxis(path_data['地点'].tolist())
bar.add_yaxis('用时',path_data['time'].tolist())
bar.add_yaxis('距离',path_data['distance'].tolist())

让我们一句一句研究代码。第一句,函数为add_xaxis(),就是添加x轴数据,给x轴添加什么数据呢?Path_data中的‘出发时间’这一列数据。

在这个位置我们要注意,划重点,一定要注意,在后面加上.tolist()

因为path_data是最开始读取csv文件的,里面的数据储存形式和csv形式保持一致,所以我们要把她转化为python中列表的形式,即使用.tolist这个函数,否则的话在这个位置添加x轴值是不起任何作用的。

现在有了第一句的基础,理解第二句就不困难了,但是x轴和y轴的赋值形式任然有一些差别,这是为什么呢?

其实这是给我们赋的y值起一个名字,当然这个位置不起名字也可以,但是如果如果你有多个y值的时候就会产生意思分歧。

这是啥意思?看下面的图就知道了。

Pyecharts是支持使用多个y值的。

比如这个图里面,我们就使用了商家A商家B两个y值名称,为了便于分辨,所以我的建议是取一个名字。

在最后,x值赋好了,y值赋好了,输入代码。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
bar.render()

即可在当前python文件所在的目录下面看到一个html文件,点进去就可以看到我们所制作的图表了。

当然括号里面还可以填生成文件的名字和生成的地址,这些都是可以修改的。

因为当前我们只需要生成这一个文件,当前目录下也没有别的render文件,所以我们就省略了这个步骤。

现在回到我们当前的文件,打开新生成的文件,就可以看到我们刚刚做的图表啦。

刚刚生成的图

但是,大家看到自己的图表是不是感觉有一点空荡荡的,不够酷炫?

不要着急,继续往下面看,我们还有进阶教程~

加点更炫的

想要使用更加酷炫的功能,我们需要再加入两个模块。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from pyecharts import options as opts  # 导入配置模块
from pyecharts.globals import ThemeType

这两个模块是pyecharts专门提供给使用者对图表进行进一步完善。

比如说,你对这个图表的整体颜色有要求,不想是原来的白色,你可以在最开始建立bar的时候这样写。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
bar=Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION,width='1280px',height='720px'))

Init_opts=opts.InitOpts()函数是给这个图表设置一些初始参数,比如说背景的颜色,分辨率等等的。

想设置主题色就用以下代码。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
theme=themeType.xxxx

这个xxx就是主题的颜色,我在这里写的是紫色,当然还有其他的颜色,看客老爷可以自己去官网进行了解。后面分辨率的参数看客老爷可以根据自己需要进行调整。

这些是在建立图表的时候进行的一些配置,那么在输入数据以后,我们可以进行哪些步骤?

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
bar.set_global_opts(title_opts=opts.TitleOpts(title='武汉各高校之间的距离与乘车所需时间',subtitle='副标题'
),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=60)),datazoom_opts=[opts.DataZoomOpts()])

我们可以使用set_global_opts函数进行我们所需要的个性化设置。

比如说主标题啊,副标题啊,x值的旋转角度啊,是否有滑块,等等配置。那实例给大家举一下例子看看这些具体指的什么。

主副标题

在这个图表中左上角的就是我的主标题,下面的就是我的副标题。

x值的旋转角度

X值倾斜的角度我们在这个图片里也可以很清晰的看出来,当前旋转的角度是60度,这个角度的旋转范围是-90°到90°。

滑块功能

滑块就在最下面,那个可以滑动的东西。

因为有的时候可能数据太多,放在一个页面里看起来太拥挤,这是我们可以用滑块这个功能,使得我们的图形更加分散,便于观察。

最终的效果

写在最后

当然,关于pyecharts的使用实例还有很多很多,各位看客老爷如果有兴趣可以自己去pyecharts的官网进行学习,这个项目是百度研发的,官网是中文的,还有十分详细的教程免费提供,所以小玮在这里就不多说了。

在这个位置,我们已经完成了数据的爬取和做成图表。

当然,这和老师吩咐的任务完成还有一定的距离,我们没有统计时间,因为最近由于肺炎,道路没有发生拥堵,统计时间发现并没有明显的变化,最终结果趋于一根平行x轴的直线。

所以就不在这里讲解时间的统计和回归分析的步骤了。等一切恢复正常了以后,会专门再写一篇推文介绍。

最近的肺炎如此严重,各位看客老爷们一定要注意防护!

跟着小玮,带你一步一步走进数据结构和爬虫的世界。

代码可以在后台回复 PC02 获取

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序猿声 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python数据可视化(三)
在大数据时代,数据可视化成为了分析和展示数据的重要手段。在众多数据可视化形式中,柱状图以其直观性和易读性而广受欢迎。本章基于案例分析详细讲解了柱状图的不同类型,包括基础柱状图以及动态柱状图。
Heaven645
2024/08/02
1391
Python数据可视化(三)
数据可视化(pyecharts库的介绍)
序言:学校里不学python的,没有开设这门课程,暑假买了三本书,都是入门的书籍,连带看b站大佬的视频,就感觉还好,毕竟自己学过c和java了,虽然也都是基础。再来看其它编程语言时,你会发现,语言其实是相通的,许多地方很相似。 被python强大的库所吸引,库的强大带来许多的方便。有人说,只会在python里调用库的猿友们不是大佬,会看源码的猿友们可以称之为大佬。我有一个大佬梦,相信每个人都有,不管是否可以达到预期的目标。我们不管怎样,是否可以学到真正的东西,还是得靠持之以恒。 以上算是对我的一个鼓励吧,我总是在很多事情上说到做不到,我希望我在以后得经历中可以坚持做事。废话说的有点多,进入正题吧。 我们来介绍pyecharts库的基础入门。 1:pyecharts库简介: pyecharts分为两个版本,v0.5.X 和 v1,这两个版本是互不兼容的,有我没你的样子,v0.5.X这个版本支持python2.7,3.4+,而新版的v1只支持我们的python3.6+。更加悲催的是v0.5.X已经被开发团队抛弃了,像个没人管的孤儿了,现在的真正的骄子就是v1了。我们下面主要对v1进行简单介绍。 2:pyecharts库的安装: 我们还是老办法,首先装上这个库。来win+R打开控制台。具体如下图: 由于我的已经装好了,所以再次执行 此安装命令时,就会告诉我already satisfied.之前如果没装的猿友们会出现collect这种。然后会有一个进度条。
兰舟千帆
2022/07/16
3160
数据可视化(pyecharts库的介绍)
Python绘制柱状图之可视化神器Pyecharts
pyecharts是python与echarts链接,一个用于生成Echarts图标的第三方库,pyecharts分为v0.5.X和v1两个大版本,两者互不兼容,v1是一个全新的版本,经研发团队决定,前者将不再进行更新维护。
用户9925864
2022/07/27
6490
Python绘制柱状图之可视化神器Pyecharts
关于pyecharts可视化中国经济、人口等数据
首先pyecharts是个可视化的好工具,pyecharts已做了变更目前是1.6.2版本,但工具的灵活运用学习过程还是很痛苦的。
python与大数据分析
2022/03/11
1.2K0
关于pyecharts可视化中国经济、人口等数据
Python可视化神器1-Pyecharts绘图详细教程-初识Pyecharts
示例位于 https://gallery.pyecharts.org/#/README
北京-宏哥
2024/01/24
6.6K1
Python|数据可视化之公众号得分的柱状图
在日益发展的社会,人们每天都会产生大量的数据,很多工作中也常常涉及到对数据的处理。而众多的数据让人头昏眼花,所以需要对数据进行可视化。将数据转换为大脑更容易接受的图表形式。所以有了后来的excel表格,它在数据的可视化处理方面非常强大。但是随着数据量的增大,用excel往往都是重复之前的步骤。效率也就变得很低了,还容易枯燥。于是,python的可视化数据来了,在重复这件事上,相信没有谁可以比程序来得更快更好。所以今天小编就通过实例给大家简单展示下数据的可视化处理。
算法与编程之美
2020/08/20
5960
Python|数据可视化之公众号得分的柱状图
【Python可视化】超详细Pyecharts 1.x教程,让你的图表动起来~
pyecharts 是一个用于生成 Echarts 图表的Python库。Echarts是百度开源的一个数据可视化 JS 库,可以生成一些非常酷炫的图表。
Awesome_Tang
2020/02/25
3K0
【Python可视化】超详细Pyecharts 1.x教程,让你的图表动起来~
python可视化利器:pyecharts
前面我们提及ggplot在R和Python中都是数据可视化的利器,在机器学习和数据分析领域得到了广泛的应用。pyecharts结合了Python和百度开源的Echarts工具,基于其交互性和便利性得到了众多开发者的认可。拥有如下的特点:
TOMOCAT
2020/06/10
1.7K0
【硬核干货】分享几个Pyecharts技巧,助你画出更直观/炫酷的图表
想必大家应该也已经看到很多关于数据分析的内容了,今天小编就为大家来分享一下国产可视化库pyecharts在绘制图表时一些的技巧,帮助读者画出更加酷炫以及可读性更高的图,当然在这之前呢,我们首先需要导入相应的所要用到的模块
用户6888863
2022/04/13
4600
【硬核干货】分享几个Pyecharts技巧,助你画出更直观/炫酷的图表
大家很喜欢用的可视化神器——Pyecharts|可视化系列07
pyecharts是基于前端可视化框架echarts的Python可视化库。该库让我们在Python里也可以充分体验到快速出图和丰富交互的数据可视化体验。
蛰虫始航
2020/11/16
2.5K0
大家很喜欢用的可视化神器——Pyecharts|可视化系列07
Python利用猫眼票房接口及pyecharts制作图表
安装pip包 安装requests包 pip install requests 安装pyecharts包 pip install pyecharts 演示 柱状图: 折线图: 饼图: 代码实现 import requests from pyecharts.charts import Bar, Line, Pie from pyecharts.globals import ThemeType from pyecharts import options as opts def data_on
kenvie
2022/01/20
7930
Python利用猫眼票房接口及pyecharts制作图表
【Python数据分析】可视化图表分析拉钩网招聘数据
上次我们爬了拉钩网的数据,现在我们来分析下,看看哪些公司的招聘信息具体需求都是哪些,让我们用可视化图表展示
松鼠爱吃饼干
2021/10/26
7040
【Python数据分析】可视化图表分析拉钩网招聘数据
还在用Matplotlib? 又一可视化神器pyecharts登场
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
程序员小猿
2021/01/19
6780
还在用Matplotlib? 又一可视化神器pyecharts登场
Python爬取当当网书籍数据,并数据可视化展示
通过requests模块里面get请求方法,对于url地址发送请求,并且携带上面header请求头参数,最后用response变量接收返回数据
松鼠爱吃饼干
2022/01/24
4.1K1
Python爬取当当网书籍数据,并数据可视化展示
Python爬虫+数据可视化:爬取分析猫咪交易网站数据
昨天有朋友私信我,问我能用Python分析下网上小猫咪的数据,是想要送一只给女朋友,当做礼物。
松鼠爱吃饼干
2021/09/02
1.6K0
Python绘制柱状图之可视化神器Pyecharts
数据可视化在数据分析和展示中扮演着重要的角色。而柱状图是一种常用于展示离散数据的图表类型,可以清晰地展示数据之间的差异。在Python中,有许多数据可视化库可供选择,其中之一是Pyecharts。Pyecharts是一个基于Echarts的Python库,提供了丰富的图表类型和可定制性,使得绘制柱状图变得非常简单。本文将介绍如何使用Pyecharts绘制各种类型的柱状图,并深入探讨其功能和定制选项。
IT_陈寒
2023/12/13
5390
Python绘制柱状图之可视化神器Pyecharts
快速掌握数据可视化工具pyecharts
Python数据可视化库pyecharts介绍 文章目录 数据预处理 模块安装 导入模块 去重 对地理位置进行处理 对销售量进行处理 制作图表 2.1 词云 2.2 柱状图 2.3 饼图 2.3.1 玫瑰图 2.4 地图 2.5 水球图 整合图表 绘图工具: 使用百度开源的pyecharts库 可以参考它的官方文档 pyecharts官方文档 ---- 数据预处理 模块安装 pip install pyecharts 导入模块 import pandas as pd df = pd.r
北山啦
2022/11/27
3710
可视化工具不知道怎么选?深度评测5大Python数据可视化工具
相信很多读者学习Python就是希望作出各种酷炫的可视化图表,当然你一定会听说过Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh这五大工具,本文就将通过真实绘图来深度评测这五个Python数据可视化的库,看看到底这几种工具各有什么优缺点,在制作图表时该如何选择。
刘早起
2020/07/16
3.9K0
可视化工具不知道怎么选?深度评测5大Python数据可视化工具
使用pyecharts进行数据可视化
安装 pip install pyecharts 直接使用该命令安装的版本为最新版本为1.5。语法与之前版本大不一样,因此本文仅针对1.5及之后版本说明。若想使用之前版本请使用命令pip install pyecharts == 0.1.5.19 注:建议在jupyter notebook中coding,方便debug。
刘早起
2020/04/22
1.3K0
Python 数据可视化神器—Pyecharts
Echarts 是百度开源的一款数据可视化 JS 工具,数据可视化类型十分丰富,但是得通过导入 js 库在 Java Web 项目上运行。
Wu_Candy
2022/07/04
6240
Python 数据可视化神器—Pyecharts
推荐阅读
相关推荐
Python数据可视化(三)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验