在过去的一年里,我们比较了近 22000 个机器学习开源工具和项目,选出了前 49 个(约占 0.22%)。
这些工具和项目分为 6 个类别,如下:
计算机视觉(1~5)
强化学习(6~13)
自然语言处理(14~20)
生成对抗网络(21~26)
神经网络(27~35)
工具包(36~49)
这是一份极具竞争力的列表,它精心挑选了 2018 年 1 月到 12 月发布的最佳开源机器学习资源。Mybridge AI 通过考虑受欢迎程度、参与度和回头率来评估质量。为了让你对质量有直观的了解,Github 上平均颗数是 3566。
带有目录的文本版本请访问 Github:
https://github.com/Mybridge/amazing-machine-learning-opensource-2019
2018 年度热门机器学习年度文章请访问:
https://medium.mybridge.co/learn-machine-learning-from-top-50-articles-for-the-past-year-v-2019-15842d0b82f6
2017 年度热门机器学习开源资源(该博文在 Medium 上有 21000 个赞)请访问:
https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7
对程序员来说,开源项目非常有用。给你足够的时间让你去尝试过去一年里可能错过的机器学习开源项目。
学习建议
A)初学者:Python 下的机器学习、数据科学和深度学习。TensorFlow 和神经网络(http://bit.ly/2FbgIcv)【84632 个推荐,4.5/5 】
计算机视觉
【No 1】Detectron
用于对象检研究的 FAIR 研究平台,实现了 Mask R-CNN、RetinaNet 等流行算法。【在 Github 有 18913 颗】
地址:
https://github.com/facebookresearch/Detectron?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 2】Openpose
用于身体、面部和手部的姿态估计的实时多人关键点检测库。【在 Github 有 11052 颗】
地址:
https://github.com/CMU-Perceptual-Computing-Lab/openpose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 3】DensePose
一种将 2D RGB 图像中所有人类像素映射到基于 3D 表面的人体模型的实施方法。【在 Github 上有 4156 颗】
地址:
https://github.com/facebookresearch/Densepose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 4】Maskrcnn-benchmark
Pytorch 中语义分割和对象检测算法的快速模块化参考实现。【在 Github 上有 3888 颗】
地址:
https://github.com/facebookresearch/maskrcnn-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 5】SNIPER
一种高效的多尺度对象检测算法。【在 Github 上有 1963 颗】
地址:
https://github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
强化学习
【No 6】Psychlab
使用 Psychlab 平台(基于智能体人工智能的 3D 平台)实现的实验范例。【在 Github 上有 5595 颗】
地址:
https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 7】ELF
一个广泛的、轻量级的、灵活的游戏研究平台。我们用它创建了围棋游戏机器人 ——ELF OpenGo,以 14:0 的比分击败了全球前 30 名棋手中的四名。【在 Github 上有 2406 颗】
地址:
https://github.com/pytorch/elf?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 8】TRFL
一个有用的构件块库,用于编写 TensorFlow 中的增强学习智能体。【在 Github 上有 2312 颗】
地址:
https://github.com/deepmind/trfl?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 9】Horizon
第一个面向大规模产品和服务的开源强化学习平台。【在 Github 上有 1703 颗】
地址:
https://github.com/facebookresearch/Horizon?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 10】Chess-alpha-zero
通过 Alpha Zero 方法进行国际象棋强化学习。【在 Github 上有 1307 颗】
地址:
https://github.com/Zeta36/chess-alpha-zero?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 11】Dm_control
DeepMind 控制套件和控制包。【在 Github 上有 1231 颗】
地址:
https://github.com/deepmind/dm_control?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 12】MAMEToolkit
街机游戏强化学习 Python 库。【在 Github 上有 437 颗】
地址:
https://github.com/M-J-Murray/MAMEToolkit?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 13】Reaver
模块化深度强化学习框架。专注于星际争霸 II。支持 Gym、Atari 和 MuJoCo。匹配参考结果。【在 Github 上有 355 颗】
地址:
https://github.com/inoryy/reaver?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
自然语言处理
【No 14】Bert
为 BERT 提供 TensorFlow 代码和预训练模型。【在 Github 上有 11703 颗】
地址:
https://github.com/google-research/bert?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 15】Pytext
基于 PyTorch 的自然语言建模框架。【在 Github 上有 4466 颗】
地址:
https://github.com/facebookresearch/pytext?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 16】Bert-as-service
由 Google 开发的用于预训练语言表示的 NLP 模型。它利用了网上公开提供发的大量纯文本数据,并以无人监督的方式进行训练。【在 Github 上有 2055 颗】
地址:
https://github.com/hanxiao/bert-as-service?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 17】UnsupervisedMT
基于短语和神经无监督机器翻译 ——来自 Facebook 研究。【在 Github 上有 1068 颗】
地址:
https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 18】DecaNLP
自然语言十项全能:面向销售队伍的 NLP 多任务挑战。【在 Github 上有 1648 颗】
地址:
https://github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 19】Nlp-architect
Intel 人工智能实验室的 NLP 架构师:用于探索最先进的深度学习拓扑和技术的 Python 库。【在 Github 上有 1751 颗】
地址:
https://github.com/NervanaSystems/nlp-architect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 20】Gluon-NLP
使 NLP 变得容易使用。【在 Github 上有 1263 颗】
地址:
https://github.com/dmlc/gluon-nlp?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
生成对抗网络
【No 21】DeOldify
基于深度学习的项目,用于着色和恢复老照片。【在 Github 上有 5060 颗】
地址:
https://github.com/jantic/DeOldify?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 22】Progressive_growing_of_gans
渐进式增长的生成对抗网络,可以提高质量、稳定性和变异性。【在 Github 上有 4046 颗】
地址:
https://github.com/tkarras/progressive_growing_of_gans?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 23】MUNIT
多模态无监督图像到图像转换。【在 Github 上有 1339 颗】
地址:
https://github.com/NVlabs/MUNIT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 24】Transparent_latent_gan
使用有监督学习来阐明 GAN 的潜在空间,以进行受控生成和编辑。【在 Github 上有 1337 颗】
地址:
https://github.com/SummitKwan/transparent_latent_gan?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 25】Gandissect
基于 pytorch 的工具,用于可视化和理解 GAN 的神经元。【在 Github 上有 1065 颗】
地址:
https://github.com/CSAILVision/gandissect?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 26】GANimation
从一张图像中感知具有解剖学意义的面部动画。【在 Github 上有 869 颗】
地址:
https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
神经网络
【No 27】Fastai
它使用现代最佳实践简化了快速准确的神经网络训练。【在 Github 上有 11597 颗】
地址:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 28】DeepCreamPy
用深度神经网络去除成人漫画的马赛克。【在 Github 上有 7046 颗】
地址:
https://github.com/deeppomf/DeepCreamPy?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 29】Augmentor v0.2
用于机器学习的 Python 图像增强库。【在 Github 上有 2805 颗】
地址:
https://github.com/mdbloice/Augmentor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 30】Graph_nets
在 TensorFlow 中构建图网。【在 Github 上有 2723 颗】
地址:
https://github.com/deepmind/graph_nets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 31】Textgenrnn
Python 模块,可使用预训练的基于字符的递归神经网络轻松地生成文本。【在 Github 上有 1900 颗】
地址:
https://github.com/minimaxir/textgenrnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 32】Person-blocker
使用预训练的神经网络自动 “屏蔽” 图像中的人(如英国独立单元剧《黑镜》(Black Mirror))。【在 Github 上有 1806 颗】
地址:
https://github.com/minimaxir/person-blocker?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 33】Deepvariant
Deepvariant 是一个分析管道,使用深度神经网络调用来自下一代 DNA 测序数据的遗传变异。【在 Github 上有 1502 颗】
地址:
https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 34】Video-nonlocal-net
用于视频分类的非本地神经网络。【在 Github 上有 1049 颗】
地址:
https://github.com/facebookresearch/video-nonlocal-net?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 35】Ann-visualizer
用于可视化人工神经网络(Artificial Neural Networks ,ANN)的 Python 库。【在 Github 上有 922 颗】
地址:
https://github.com/Prodicode/ann-visualizer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
工具包
【No 36】Tfjs
一个 WebGL 加速的、基于浏览器的 JavaScript 库,用于训练和部署机器学习模型。【在 Github 上有 10268 颗】
地址:
https://github.com/tensorflow/tfjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 37】Dopamine
Google 出的强化学习算法快速原型化的研究框架。【在 Github 上有 7142 颗】
地址:
https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 38】Lime
解释任何机器学习分类器的预测。【在 Github 上有 5173 颗】
地址:
https://github.com/marcotcr/lime?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 39】Autokeras
一种用于自动机器学习(AutoML)的开源软件库。【在 Github 上有 4520 颗】
地址:
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 40】Shap
使用期望值和 Shapley 值解释任何机器学习模型的输出。【在 Github 上有 3496 颗】
地址:
https://github.com/slundberg/shap?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 41】MMdnn
一套用于帮助用户在不同深度学习框架之间进行互操作的工具。例如模型转换和可视化。在 Caffe、Keras、MXNet、TensorFlow 之间进行转换模型。【在 Github 上有 3021 颗】
地址:
https://github.com/Microsoft/MMdnn?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 42】Mlflow
用于机器学习生命周期的开源平台。【在 Github 上有 3013 颗】
地址:
https://github.com/mlflow/mlflow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 43】Mace
用于移动异构计算平台优化的深度学习推理框架。【在 Github 上有 2979 颗】
地址:
https://github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 44】PySyft
用于安全、私密的深度学习的 Python 库。PySyft 使用 PyTorch 的多方计算(Multi-Party Computation,MPC)将私有数据从模型训练中分离出来。【在 Github 上有 2595 颗】
地址:
https://github.com/OpenMined/PySyft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 45】Adanet
具有学习保证(learning guarantees)的快速灵活的 AutoML。【在 Github 上有 2293 颗】
地址:
https://github.com/tensorflow/adanet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 46】Tencent-ml-images
最大的多标签图像数据库;ResNet-101 模型;ImageNet 上的 80.73% 的 top-1 acc。【在 Github 上有 2094 颗】
地址:
https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 47】Donkeycar
开源软硬件平台,打造小型自动驾驶汽车。【在 Github 上有 1207 颗】
地址:
https://github.com/autorope/donkeycar?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 48】PocketFlow
自动模型压缩框架(Automatic Model Compression,AutoMC),用于开发更小、更快的人工智能应用。【在 Github 上有 1677 颗】
地址:
https://github.com/Tencent/PocketFlow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
【No 49】DALI
包含高度优化的构件块和用于深度学习应用中的数据预处理的执行引擎的库。【在 Github 上有 1013 颗】
地址:
https://github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
策划编辑:Natalie,作者:Mybridge
译者:Sambodhi,编辑:Vincent
来源:AI前线(版权归原作者及刊载媒体所有)
关于版权说明:
为分享前沿资讯及有价值的观点,智能前沿技术微信公众号转载此文,并经过编辑,素材版权归原作者所有。支持保护知识产权,转载请注明原出处及作者。如文中图片或文字侵犯了您的权益,请联系我们删除,谢谢!
领取专属 10元无门槛券
私享最新 技术干货