你怀念昨天或期待明天,或是任何还呼吸还生存的每个最好的今天
——阿信
原创文章,转载请注明来源。
本文开头先安利一下五月天的《自传》,这张专辑里面有13首歌,其中11首进入了我的虾米年度歌单。听着这张专辑,就好像听着自己的故事一般。
由于本人近期在部门内做关于Python的分享,打算将分享的内容也同步到这个公总号中,因此在利用Excel做数据挖掘系列文章中会穿插一些与Python相关的内容。
Pandas 是一个非常好用的库,正如名字一样,人见人爱。之所以如此,就在于不论是读取、处理数据,用它都非常简单。(PC端阅读效果更佳)
上节内容中主要讲解了一下Pandas的两种数据结构Series和DataFrame的基本特征,以及如何利用Pandas对常用格式的数据进行导入和导出。
本节中,我将介绍一下Series和DataFrame相关的一些基本操作。
小结
关于Pandas模块的话题非常丰富,每个人使用Pandas的场景也各不一样。因为我打算以数据分析师的角度,带领大家迅速的了解这个库。
本期内容中,我们讲解了数据分析师常用到的一些关于Series和DataFrame的操作,主要包含以下6个内容:
一、重新索引与填充;
二、数据清洗(包含丢弃部分轴数据、处理none值和替换);
三、选取和过滤数据(Pandas在实际应用中最重要的环节);
四、函数应用和映射;
五、排序和排名;
六、处理重复值的方法。
本以为分两次能讲完Pandas模块的常用功能,但是这个模块的功能真是包罗万象,而且这些功能在数据分析中都特别实用。可能还需要一期的内容来结束这个模块的入门教程,感兴趣的小朋友敬请期待哦!
如过觉得这些内容对您有用,请点赞分享给更多的朋友吧,谢谢!
领取专属 10元无门槛券
私享最新 技术干货