不管是想给自己起个不俗的英文名字,还是想让孩子的英文名字能赶上时代潮流,这个学习实例一定能让你信心满满的挑选自己中意的英文名。这篇学习实例中,用到了美国从1880年到2014年名字的数据库,通过Python解答你对名字的疑惑。
首先,是引用所需的功能包,和导入所需的数据。这里会用到常用的Numpy,pandas, 还有帮助数据可视化的matplotlib 和seaborn. 在Jupyter notebook中输入如下代码:
然后解压已经下载好的zip file: names.zip。 这个在美国人口普查网上是可以下载的。
解压后可以看到从1880年到2014年每一年的txt文件。上图还读取了2011年前面是行数据。不难看出,每行中包括名字,性别,和那一年有多少新生儿叫这个名字。一目了然。
确认读取正确后,可以将所有txt文件整合到一个列表中。
可以看到这个数据库里有3万多个名字。更有趣的是1880年一共就只有几千个名字,而到了2014年,发明创造和记录在案的名字竟然达到了三万多。 可见人民生活越来越有趣了。
接着我们将数据做个分类, 按照性别,名字,和被使用过的年份进行排序。
得到了一百多万条的大数据。
如果有心仪的名字,现在就可以使用"loc"调取,查看这个名字在历史上使用的人有多少。举个栗子:Oscar
可见这个名字是个有历史的名字,一百多年前就开始使用。不仅可以罗列名字的数据,还可以将名字情况绘制成图表:
History of Oscar
History of Max
History of Michael
History of Sean
History of Peter
History of Thor
History of Alex
History of Alfred
History of Wyatt
History of Edmund
History of Eduard
甚至可以将所有名字整合在一个表格中:
漫漫历史洪流中, 叫Michael的人真的很多很多。
最后附上TOP 10的英文名:
male
female
还有更多的功能和工具。期待进一步了解和分享。
PS:原数据和教程都来自Lynda。
领取专属 10元无门槛券
私享最新 技术干货