首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2018年最受欢迎的15个顶级Python库

导读:近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。如果本文有哪些遗漏,你可以在评论区补充。

作者:Goutham Veeramachaneni

译者:陈利鑫

来源:InfoQ(ID:infoqchina)

近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。如果本文有哪些遗漏,你可以在评论区补充。

▲根据 GitHub star 和贡献评选出的 2018 顶级 Python 库,形状大小与贡献者数量成正比

以下为 2018 年排名前 15 的 Python 库(数据截止 2018 年 12 月 16 日):

01 TensorFlow

贡献者:1757,贡献:25756,Stars:116765

TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图形节点表示数学运算,而图形边缘表示在它们之间流动的多维数据阵列(张量)。这种灵活的体系结构使用户可以将计算部署到桌面、服务器或移动设备中的一个或多个 CPU/GPU,而无需重写代码。

GitHub 地址:

https://github.com/tensorflow/tensorflow

02 pandas

贡献者:1360,贡献:18441,Stars :17388

pandas 是一个 Python 包,、供快速,灵活和富有表现力的数据结构,旨在让”关系“或”标记“数据使用既简单又直观。它的目标是成为用 Python 进行实际,真实数据分析的基础高级构建块。

GitHub 地址:

https://github.com/pandas-dev/pandas

03 scikit-learn

贡献者:1218,贡献者:23509,Stars :32326

scikit-learn 是一个基于 NumPy,SciPy 和 matplotlib 的机器学习 Python 模块。它为数据挖掘和数据分析提供了简单而有效的工具。SKLearn 所有人都可用,并可在各种环境中重复使用。

GitHub 地址:

https://github.com/scikit-learn/scikit-learn

04 PyTorch

贡献者:861,贡献:15362,Stars:22763

PyTorch 是一个 Python 包,提供两个高级功能:

具有强大的 GPU 加速度的张量计算(如 NumPy)

基于磁带的自动编程系统构建的深度神经网络

你可以重复使用自己喜欢的 Python 软件包,如 NumPy,SciPy 和 Cython,以便在需要时扩展 PyTorch。

GitHub 地址:

https://github.com/pytorch/pytorch

05 Matplotlib

贡献者:778,贡献:28094,Stars :8362

Matplotlib 是一个 Python 2D 绘图库,可以生成各种可用于出版品质的硬拷贝格式和跨平台交互式环境数据。Matplotlib 可用于 Python 脚本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 应用程序服务器和各种图形用户界面工具包。

GitHub 地址:

https://github.com/matplotlib/matplotlib

06 Keras

贡献者:856,贡者:4936,Stars :36450

Keras 是一个高级神经网络 API,用 Python 编写,能够在 TensorFlow,CNTK 或 Theano 之上运行。它旨在实现快速实验,能够以最小的延迟把想法变成结果,这是进行研究的关键。

GitHub 地址:

https://github.com/keras-team/keras

07 NumPy

贡献者:714,贡献:19399,Stars:9010

NumPy 是使用 Python 进行科学计算所需的基础包。它提供了强大的 N 维数组对象,复杂的(广播)功能,集成 C / C ++ 和 Fortran 代码的工具以及有用的线性代数,傅里叶变换和随机数功能。

GitHub 地址:

https://github.com/numpy/numpy

08 SciPy

贡献者:676,贡献:20180,Stars:5188

SciPy(发音为"Sigh Pie")是数学、科学和工程方向的开源软件,包含统计、优化、集成、线性代数、傅立叶变换、信号和图像处理、ODE 求解器等模块。

GitHub 地址:

https://github.com/scipy/scipy

09 Apache MXNet

贡献者:653,贡献:9060,Stars:15812

Apache MXNet(孵化)是一个深度学习框架,旨在提高效率和灵活性,让你可以混合符号和命令式编程,以最大限度地提高效率和生产力。 MXNet 的核心是一个动态依赖调度程序,可以动态地自动并行化符号和命令操作。

GitHub 地址:

https://github.com/apache/incubator-mxnet

10 Theano

贡献者:333,贡献:28060,Stars :8614

Theano 是一个 Python 库,让你可以有效地定义、优化和评估涉及多维数组的数学表达式。它可以使用 GPU 并实现有效的符号区分。

GitHub 地址:

https://github.com/Theano/Theano

11 Bokeh

贡献者:334,贡献:17395,Stars :8649

Bokeh 是一个用于 Python 的交互式可视化库,可以在现代 Web 浏览器中实现美观且有意义的数据视觉呈现。使用 Bokeh,你可以快速轻松地创建交互式图表、仪表板和数据应用程序。

GitHub 地址:

https://github.com/bokeh/bokeh

12 XGBoost

贡献者:335,贡献:3557,Stars:14389

XGBoost 是一个优化的分布式梯度增强库,旨在变得高效、强大、灵活和便携。它在 Gradient Boosting 框架下实现机器学习算法。XGBoost 提供了梯度提升决策树(也称为 GBDT,GBM),可以快速准确地解决许多数据科学问题,可以在主要的分布式环境(Hadoop,SGE,MPI)上运行相同的代码,并可以解决数十亿个示例之外的问题。

GitHub 地址:

https://github.com/dmlc/xgboost

13 Gensim

贡献者:301,贡献:3687,Stars :8295

Gensim 是一个用于主题建模、文档索引和大型语料库相似性检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。

GitHub 地址:

https://github.com/RaRe-Technologies/gensim

14 Scrapy

贡献者:297,贡献:6808,Stars :30507

Scrapy 是一种快速的高级 Web 爬行和 Web 抓取框架,用于抓取网站并从其页面中提取结构化数据。它可用于从数据挖掘到监控和自动化测试的各种用途。

GitHub 地址:

https://github.com/scrapy/scrapy

15 Caffe

贡献者:270,贡献:4152,Stars :26531

Caffe 是一个以表达、速度和模块化为基础的深度学习框架,由伯克利人工智能研究(BAIR)/ 伯克利视觉与学习中心(BVLC)和社区贡献者开发。

GitHub 地址:

https://github.com/BVLC/caffe

英文原文

https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html

据统计,99%的大咖都完成了这个神操作

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181230B1799G00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券