首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

超实用的机器学习&数据分析代码小抄,送你了!

导语:今天,优达娘要给大家送一叠“小抄”(cheatsheet),干货满满,非常实用,随时都可以翻看查阅,对 AI 和数据分析的初学者来说,简直是不可多得的学习资源~

文/ Kailash Ahirwar

编译/ 优达娘

来源/ startupsventurecapital.com

对于技术小白来说,初学数据挖掘技术以及人工智能算法有着相当大的阻碍。而现如今,Python 语言是学习数据分析以及机器学习深度学习的敲门砖。我们通过总结 Kailash Ahirwar 在 GitHub 主页搜集的小抄(cheatsheet),将最受数据科学家和 AI 算法工程师欢迎的 Python 工具总结起来,方便大家在平时的学习过程中查阅。

友情提醒,为了达到最佳阅读效果,请“点击看大图,手机横屏”,这样看最爽。

1. Numpy

Numpy 是一种科学计算工具箱。相对于 Python 自带的数组功能,它可以高效的处理线性代数,傅里叶变换等问题。它的后端是用 C++ 与 Fortan 语言所编写,所以拥有着很快的计算速度。一句话:该小抄对于 Python 数据分析和机器/深度学习来说,同样非常有帮助。

2. Pandas

Pandas 是一种强大的开源数据分析工具。其集成了数据分析所需要的多种功能,并且其与Numpy 工具箱完美兼容。也就是说,这两张小抄主要用于数据整理。

3. SciPy

SciPy 生态系统是 Python 中用于科学计算的开源软件的集合。其中包括核心包如 Numpy,Matplotlib,Pandas等等。

4. Matplotlib

Matplotlib 是一款 Python 绘图工具, 其生成的图像可以生成多种格式兼容多种硬件平台的打印。Matplotlib 可用于 Python 脚本,IPython shell,jupyter notebook,以及 Web 应用程序服务器等。

5. Scikit-learn

Scikit-learn 是一款简单高效,用于数据分析,数据挖掘,机器学习的开源工具包。其集成多种典型的机器学习方法,提供简单易懂的借口,供所有人使用。它基于 Numpy, SciPy 以及Matplotlib。

6. Tensorflow

TensorFlow 是一个使用数据流图进行数值计算的开源软件库。最初是由 Google 机器智能研究部门的 Google Brain 团队中的研究人员和工程师开发的,用于进行机器学习和深度神经网络研究, 但它是一个非常基础灵活的系统,因此也可以应用于众多其他领域。

7.Keras

Keras 是一个用 Python 语言编写的高级深度学习框架编程接口。其后端可以是 Tensorflow,Theano 以及 CNTK。一直以来,因其简单易懂,快速上手的优势为广大程序猿(媛)所喜爱。一句话:该小抄对于 Python 数据分析和机器/深度学习来说,非常有帮助。

8. Jupyter Notebook

Jupyter Notebook 是一个开源的 Web 应用程序,允许使用者创建和共享代码,方程,可视化图形,以及叙述文本的文档,并支持运行 40 多种编程语言。 其用途包括数据清理和转换,数值模拟,统计建模,数据可视化,机器学习建模等等。

9. PySpark

Apache Spark 通常被用于大数据的快速分析,机器学习以及图像处理。与当今其他工具相比,它可以使分析应用程序的速度提高数倍。 PySpark 是 Spark 应用于 Python 的接口。

除了以上这些,本文作者还搜集了其他的小抄,涉及到机器学习、深度学习以及数据分析,并且不断在更新中,小抄的意义就是集精华为一体,为了让大家方便查阅,温故而知新,如果你也有更好更实用的小抄,作者欢迎你去他的GitHub进行扩展,项目地址:kailashahirwar/cheatsheets-ai。

— 完 —

快点扫我~

请问蛤蛤看的是什么书?

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180117G10M5400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券