首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >介绍一个助你事半功倍的数据挖掘神器!!

介绍一个助你事半功倍的数据挖掘神器!!

作者头像
用户6888863
发布2023-03-01 20:25:22
发布2023-03-01 20:25:22
4670
举报
文章被收录于专栏:AI篮球与生活AI篮球与生活

Pandas模块当中,对于表格数据的分组操作(groupby)和透视表(pivot_table)的制作一直都是比较常见的,今天小编为大家分享一个数据分析的利器,能够自动为我们完成上述提到的一系列操作,并且带有GUI界面,所以使用起来非常的方便。

PivotTableJS

看名字我们就能知道,该模块是专门用来生成透视表(pivot_table),而且是用JavaScript代码来构建的,由于其有GUI界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。

当然我们先用pip命令来安装该模块,代码如下

代码语言:javascript
复制
pip install PivotTableJS

加载数据集

那么首先,我们先来加载数据集,这里导入Pandas模块

代码语言:javascript
复制
import pandas as pd
df = pd.read_csv("employee_dataset.csv")

df.head()

output

牛刀小试

这里我们尝试来调用pivottablejs模块当中的pivot_ui方法,只需两行代码

代码语言:javascript
复制
from pivottablejs import pivot_ui

pivot_ui(df)

output

这里可能需要等待1-2分钟左右的时间来供其加载,随后我们就能看到如上图所示的窗口,窗口中包括了表格当中的每一列的字段、可视化图表的各种形式等等

同时我们也可以拖拽指定的列到空白的窗口中,对其进行分组统计以及透视表的制作,如下图所示

而要是我们想要进行可视化操作,只需要在下拉框中选中,例如我们想要绘制的是直方图,

分组统计

接下来我们进行分组(groupby)操作,例如我们想要查看一下员工状态(Employee_Status)的分组统计,只需要将该列拖拽至空白的区域即可

我们可以看到员工分为是全职员工以及实习生,分别是有791位和209位,当然除了计数(count)之外,我们还能够计算平均值、中位数、最大/最小值等一系列统计方法,例如我们想要计算一下全职员工和实习生的平均工资,就可以这么来操作

我们还可以更进一步,将上面的结果进行可视化展示,如下所示

透视表

对于透视表而言,pivottablejs模块实现起来也格外的简单,我们只需要在上述操作的基础之上,将列拖拽到右边空白的长方形区域当中,例如我们想要看一下分布在不同城市当中不同职位员工的分布,就可以这么来做

当然该模块给我们带来的便利和自身所具备的功能远不止此,大家可以安装一下该模块,然后在空余的时间中自行探索。

当然我们看来该模块还存在着一个小小的bug,大家可以尝试用其他版本来试一下,小编在这里用的是0.9.0

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 关于数据分析与可视化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • PivotTableJS
  • 加载数据集
  • 牛刀小试
  • 分组统计
  • 透视表
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档