在这个充满母性光辉的日子,小X为大家推荐一款深受广大女性同胞喜爱的数据分析工具——Python。Python以其优秀的可读性、以及对统计分析的良好支持,在数据分析界越来越受欢迎。
今天,小X为大家介绍Python中最受欢迎的10大函数包,以及这些函数包的用处用法。
1. Numpy
Numpy是Python中做科学计算必不可少的函数包,它包含了很多科学计算需要的函数,可以支持向量矩阵的运算。它可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多。
这里附上一张Numpy的Cheatsheet链接:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Numpy_Python_Cheat_Sheet.pdf
2. Pandas
Pandas是panel data的简称,panel data主要是两个数据的类型:
time-series data; cross-sectional data。
Pandas可以让我们很方便的在一个数据表(data frame) 中增加或删除行、列;处理空值;以及很方便做聚合(aggregate grouping)运算。
一个series:
一个data frame:
这里附上一张Pandas的Cheatsheet链接:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Pandas_Cheat_Sheet_2.pdf
3. Matplotlib
Matplotlib是Python中常用的可视化工具之一,便于创建海量类型2D图表和一些基本的3D图表。
这里附上一张matplotlib的cheatsheet:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Matplotlib_Cheat_Sheet.pdf
4. Bokeh
Bokeh也是python中常用的数据可视化的函数包,它能很好的支持可交互式interactive 图表,它独立于matplotlib。
5. Scikit-learn
Scikit-learn 是基于scipy的数据处理上,支持machine learning的很多算法,让ML 算法流程化,scikit-learn有很好的文档支持,想要学习machine learning的同学,看看scikit learn的文档会获益匪浅。
6. Tensorflow
TensorFlow是Google在2015年11月份开源的人工智能系统,是之前所开发的深度学习基础架构DistBelief的改进版本,该系统可以被用于语音识别、图片识别等多个领域。
官网上对TensorFlow的介绍是,一个使用数据流图(data flow graphs)技术来进行数值计算的开源软件库。数据流图中的节点,代表数值运算;节点节点之间的边,代表多维数据(tensors)之间的某种联系。你可以在多种设备(含有CPU或GPU)上通过简单的API调用来使用该系统的功能。TensorFlow是由Google Brain团队的研发人员负责的项目。
7. NLTK
NLTK 是natural language toolkit的简写,NLTK可以支持自然语言文本分析,比如text tagging, classification, tokenizing, name entities identification等。
8. Scrapy
Scrapy 是一个针对网络爬虫的函数包,它也可以用来接入API拿得数据。
9. Statsmodels
从名字就可以看出statsmodels是用来做统计学模型分析的函数包,它包含了常用的linear regression, generalized linear models, discrete choice models, robust linear models, time series analysis models等等模型。
除此之外,statsmodels也包含了一些统计绘图的功能,在处理大型数据上,具有比较好的性能。
10. IPython
IPython是一种基于Python的交互式解释器。相较于原生的Python Shell,IPython提供了更为强大的编辑和交互功能。
最后附上一个热心网友整理的2017年python各大函数包在github上的数据,有哪些你喜欢的函数包在里面呢?
以上就是数据科学家经常使用的一些python函数包。如果你有值得推荐的函数包,可以和Xcourse其他小伙伴一起交流。
Xcourse旨在构建一个面向未来,面向市场的学习平台,让更多人进入大数据时代。关注我们的公众号,回复“讨论群”,即可加入讨论群,让大神带你飞,还有数据分析师相关的职位推荐哦!
课程信息
Introduction toData Analytics
Xcourse推出的特别课程——“16天玩转数据分析“,在几天的时间里,3月份的课程班就已全部报满! 课程将于本周六正式开启。
很多朋友咨询小X下一期的开课时间,为了帮助大家尽快起步,早日加入数据分析的队伍中,Xcourse将于4月推出同类型课程。
领取专属 10元无门槛券
私享最新 技术干货