本文总结了 pandas 的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成。作者认为,做完练习题,pandas 的基本操作没有问题了,以后碰到问题也可以查这些习题。(文末提供下载)
Pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
pandas 提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使 Python 成为强大而高效的数据分析环境的重要因素之一。
网上可以搜到大量的 pandas 教程和官方文档,但没有简单的方法来练习。教程是很好的资源,但要付诸实践。 只有实践,才能更好的加深学习。
本站从 github 搜索到了一些 pandas 的练习题,含完整数据集,并进行整理:
原代码作者:Guilherme Samora
本练习代码可以在 github 下载:
https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises
Pandas 练习题目录
1.Getting and knowing
2.Filtering and Sorting
3.Grouping
4.Apply
5.Merge
6.Stats
7.Visualization
8.Creating Series and DataFrames
9.Time Series
10.Deleting
使用方法
每个练习文件夹有三个不同类型的文件:
1. Exercises.ipynb
没有答案代码的文件,这个是你做的练习
2.Solutions.ipynb
运行代码后的结果(不要改动)
3.Exercise_with_Solutions.ipynb
有答案代码和注释的文件
你可以在Exercises.ipynb里输入代码,看看运行结果是否和Solutions.ipynb里面的内容一致,如果真的完成不了再看下Exercise_with_Solutions.ipynb的答案。
典型的例题如图所示:
练习题截图
总结
本文把pandas的常用操作做成练习题,练习题附答案,并且有完整数据集。希望初学者能认真完成练习题,以便提高数据分析技能。
本练习代码可以在 github 下载:
https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises