本次复习的知识点如下:
numpy的reshape以及shape在实战中的运用
matplotlib饼图绘制
分析目标
观察上次的数据,数据中有的数据有会员与非会员两种用户类别。
这次我们主要分析一下两种类别用户在数据中占比。
数据读取与数据清洗
根据流程示意图我们主要遵循下面几个步骤:
图 | 源自网络
在过去两次的文章中已经有关于数据读取和数据分析操作的详细代码讲解,所以不再赘述。
此处代码为:
这里需要注意两点:
因为数据较大,我们没有数据文件具体数据量,所以在使用时我们可以使用这样numpy可以使用统计或的具体数值替换。
我们对数据的需求不再是获取时间的平均值,只需获取数据最后一列并使用方法堆叠到一起以便下一步处理。
数据分析
根据这次的分析目标,我们取出最后一列。
在上一步我们已经获取了全部的数值,在本部只需筛选统计出会员与非会员的数值就可以了。
我们可以先看下完成后的这部分代码:
同样,这里使用获取用户分类的具体数据。
结果展示
生成的饼图:
下面是生成饼图的代码:
总结
关于之前文章中numpy的大部分用法在这三篇的实战中都有提及,接下来还剩一篇numpy实战总结全文,之后会进入pandas的复习。
咸鱼普拉思
一只咸鱼在编程路上的摸爬滚打,记录摸索中的点点滴滴。
领取专属 10元无门槛券
私享最新 技术干货