导语:今天,优达娘要给大家送一叠“小抄”(cheatsheet),干货满满,非常实用,随时都可以翻看查阅,对 AI 和数据分析的初学者来说,简直是不可多得的学习资源~
文/ Kailash Ahirwar
编译/ 优达娘
来源/ startupsventurecapital.com
对于技术小白来说,初学数据挖掘技术以及人工智能算法有着相当大的阻碍。而现如今,Python 语言是学习数据分析以及机器学习深度学习的敲门砖。我们通过总结 Kailash Ahirwar 在 GitHub 主页搜集的小抄(cheatsheet),将最受数据科学家和 AI 算法工程师欢迎的 Python 工具总结起来,方便大家在平时的学习过程中查阅。
友情提醒,为了达到最佳阅读效果,请“点击看大图,手机横屏”,这样看最爽。
1. Numpy
Numpy 是一种科学计算工具箱。相对于 Python 自带的数组功能,它可以高效的处理线性代数,傅里叶变换等问题。它的后端是用 C++ 与 Fortan 语言所编写,所以拥有着很快的计算速度。一句话:该小抄对于 Python 数据分析和机器/深度学习来说,同样非常有帮助。
2. Pandas
Pandas 是一种强大的开源数据分析工具。其集成了数据分析所需要的多种功能,并且其与Numpy 工具箱完美兼容。也就是说,这两张小抄主要用于数据整理。
3. SciPy
SciPy 生态系统是 Python 中用于科学计算的开源软件的集合。其中包括核心包如 Numpy,Matplotlib,Pandas等等。
4. Matplotlib
Matplotlib 是一款 Python 绘图工具, 其生成的图像可以生成多种格式兼容多种硬件平台的打印。Matplotlib 可用于 Python 脚本,IPython shell,jupyter notebook,以及 Web 应用程序服务器等。
5. Scikit-learn
Scikit-learn 是一款简单高效,用于数据分析,数据挖掘,机器学习的开源工具包。其集成多种典型的机器学习方法,提供简单易懂的借口,供所有人使用。它基于 Numpy, SciPy 以及Matplotlib。
6. Tensorflow
TensorFlow 是一个使用数据流图进行数值计算的开源软件库。最初是由 Google 机器智能研究部门的 Google Brain 团队中的研究人员和工程师开发的,用于进行机器学习和深度神经网络研究, 但它是一个非常基础灵活的系统,因此也可以应用于众多其他领域。
7.Keras
Keras 是一个用 Python 语言编写的高级深度学习框架编程接口。其后端可以是 Tensorflow,Theano 以及 CNTK。一直以来,因其简单易懂,快速上手的优势为广大程序猿(媛)所喜爱。一句话:该小抄对于 Python 数据分析和机器/深度学习来说,非常有帮助。
8. Jupyter Notebook
Jupyter Notebook 是一个开源的 Web 应用程序,允许使用者创建和共享代码,方程,可视化图形,以及叙述文本的文档,并支持运行 40 多种编程语言。 其用途包括数据清理和转换,数值模拟,统计建模,数据可视化,机器学习建模等等。
9. PySpark
Apache Spark 通常被用于大数据的快速分析,机器学习以及图像处理。与当今其他工具相比,它可以使分析应用程序的速度提高数倍。 PySpark 是 Spark 应用于 Python 的接口。
除了以上这些,本文作者还搜集了其他的小抄,涉及到机器学习、深度学习以及数据分析,并且不断在更新中,小抄的意义就是集精华为一体,为了让大家方便查阅,温故而知新,如果你也有更好更实用的小抄,作者欢迎你去他的GitHub进行扩展,项目地址:kailashahirwar/cheatsheets-ai。
— 完 —
快点扫我~
请问蛤蛤看的是什么书?
领取专属 10元无门槛券
私享最新 技术干货