本文,我将为大家介绍深度学、NLP和CV领域应用最广泛的30个库。
话不多说直接上图,下图按类型表示了每个库,并按星级和贡献者对其进行了绘制,其符号大小反映了该库对Github的提交数量以对数标度表示。
(可以看出TensorFlow还是遥遥领先啊)
按星级和贡献者数量绘制; 相对大小(按提交的日志数)
1. TensorFlow
(https://github.com/tensorflow/tensorflow) star:149000,贡献:97741,贡献者:2754
TensorFlow是用于机器学习的端到端开源平台。它具有工具,库和社区资源的全面,灵活的生态系统,使研究人员可以推动ML领域的最新发展,并使开发人员轻松构建和部署ML支持的应用程序。
2. Keras
(https://github.com/keras-team/keras) star:50000,贡献:5349,贡献者:864
Keras是用Python编写的深度学习API,在机器学习平台TensorFlow上运行。
3. PyTorch
(https://github.com/pytorch/pytorch) star:43200,贡献:30696,贡献者:1619
具有强大GPU加速功能的Python中的张量和动态神经网络。
4. fastai
(https://github.com/fastai/fastai) star:19800,贡献:1450,贡献者:607
fastai使用现代最佳实践简化了快速而准确的神经网络的训练。
5. PyTorch Lighting
(https://github.com/PyTorchLightning/pytorch-lightning) star:9600,贡献:3594,贡献者:317
轻巧的PyTorch包装器,用于高性能AI研究。缩放模型,而不是样板。
6. JAX
(https://github.com/google/jax) star:10000,贡献:5708,贡献者:221
Python + NumPy程序的可组合转换:区分,矢量化,JIT到GPU / TPU等。
7. MXNet
(https://github.com/apache/incubator-mxnet) star:19100,贡献:11387,贡献者:839
具有动态,可感知突变的Dataflow Dep Scheduler的轻型,便携式,灵活的分布式/移动深度学习;适用于Python,R,Julia,Scala,Go,Javascript等。
8.Ignite
(https://github.com/pytorch/ignite) star:3100,贡献:747,贡献者:112
高级库可帮助您灵活透明地训练和评估PyTorch中的神经网络。
9. FastText
(https://github.com/facebookresearch/fastText) star:21700,贡献:379,贡献者:47
fastText是一个用于高效学习单词表示和句子分类的库。
10.spaCy
(https://github.com/explosion/spaCy) star:17400,贡献:11628,贡献者:482
使用Python和Cython的工业强度自然语言处理(NLP)。
11. Gensim
(https://github.com/RaRe-Technologies/gensim) star:11200,贡献:4024,贡献者:361
Gensim是用于大型主题的主题建模,文档索引和相似性检索的Python库。目标受众是自然语言处理(NLP)和信息检索(IR)社区。
12. NLTK
(https://github.com/nltk/nltk) star:9300,贡献:13990,贡献者:319
NLTK(自然语言工具包)是一套支持自然语言处理研究和开发的开源Python模块,数据集和教程。
13.Datasets(Huggingface)
(https://github.com/huggingface/datasets) star:4300,提交:568,贡献者:64
PyTorch,TensorFlow,NumPy和Pandas中用于自然语言处理的快速,高效,开放式数据集和评估指标。
14.Tokenizers(Huggingface)
(https://github.com/huggingface/tokenizers) star:3800,提交数:1252,贡献者:30
针对研究和生产进行了优化。
15.Transformers (Huggingface)
(https://github.com/huggingface/transformers) star:3500,提交:5480,贡献者:585
transformers:Pytorch和TensorFlow 2.0的最新自然语言处理。
16. Stanza star:4800,贡献:1514,贡献者:19
(https://github.com/stanfordnlp/stanza/)
斯坦福NLP官方Python语言库,支持多种人类语言。
17. TextBlob
(https://github.com/sloria/textblob) star:7300,贡献:542,贡献者:24
简单,Python式的文本处理-情感分析,词性标记,名词短语提取,翻译等。
18. PyTorch-NLP
(https://github.com/PetrochukM/PyTorch-NLP) star:1800,贡献:442,贡献者:15
PyTorch自然语言处理(NLP)的基本实用程序。
19. Textacy
(https://github.com/chartbeat-labs/textacy) star:1500,贡献:1324,贡献者:23
一个基于高性能spaCy库的Python库,用于执行各种自然语言处理(NLP)任务。
20. Finetune
(https://github.com/IndicoDataSolutions/finetune) star:626,贡献:1405,贡献者:13
Finetune是一个库,允许用户利用最新的经过预训练的NLP模型来执行各种下游任务。
21. TextHero
(https://github.com/jbesomi/texthero) star:1900,贡献:266,贡献者:17
文本预处理,表示和可视化。
22. Spark NLP
(https://github.com/JohnSnowLabs/spark-nlp) star:1700,贡献:4363,贡献者:50
Spark NLP是建立在Apache Spark ML之上的自然语言处理库。
23. GluonNLP
(https://github.com/JohnSnowLabs/spark-nlp) star:2200,贡献:712,贡献者:72
GluonNLP是一个工具包,可轻松进行文本预处理,数据集加载和神经模型构建,以帮助您加快自然语言处理(NLP)研究的速度。
24.Pillow
(https://github.com/python-pillow/Pillow) star:7800,贡献:10799,贡献者:303
25. OpenCV
(https://github.com/opencv/opencv) star:49600,贡献:29453,贡献者:1234
开源计算机视觉库。
26. scikit-image
(https://github.com/scikit-image/scikit-image) star:4000,贡献:12352,贡献者:403
Python中的图像处理。
27. Mahotas
(https://github.com/luispedro/mahotas) star:644,提交:1273,贡献者:25
Mahotas是在numpy数组上运行的快速计算机视觉算法(均以C ++实施以提高速度)的库。
28. Simple-CV
(https://github.com/sightmachine/simplecv) star:2400,贡献:2625,贡献者:69
SimpleCV是使用OpenCV和Python编程语言的开放源代码机器视觉的框架。
29. GluonCV
(https://github.com/dmlc/gluon-cv) star:4300,贡献:774,贡献者:101
GluonCV提供了计算机视觉中最先进的(SOTA)深度学习模型的实现。
30.Torchvision
(https://github.com/pytorch/vision) star:7500,贡献:1286,贡献者:334
Torchvision软件包由流行的数据集,模型架构和用于计算机视觉的常见图像转换组成。