来源:PaperWeekly
本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。
Face Recognition
#世界上最简单的人脸识别库
本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。
项目链接:
https://github.com/ageitgey/face_recognition
MUSE
#多语言词向量 Python 库
由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。
无监督方法具体可参考 Word Translation without Parallel Data 这篇论文。
论文链接:
https://www.paperweekly.site/papers/1097
项目链接:
https://github.com/facebookresearch/MUSE
FoolNLTK
#中文处理工具包
本项目特点:
• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词
• 基于 BiLSTM 模型训练而成
• 包含分词,词性标注,实体识别,都有比较高的准确率
• 用户自定义词典
项目链接:
https://github.com/rockyzhengwu/FoolNLTK
Arnold
#最擅长玩《毁灭战士》的游戏AI
本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。
论文链接:
https://www.paperweekly.site/papers/1440
项目链接:
https://github.com/glample/Arnold
Bottom-Up Attention VQA
#2017 VQA Challenge 第一名
本项目是 2017 VQA Challenge 第一名团队两篇论文的 PyTorch 复现。
论文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
链接:https://www.paperweekly.site/papers/754
论文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge
链接:https://www.paperweekly.site/papers/1441
项目链接:
https://github.com/hengyuan-hu/bottom-up-attention-vqa
YOLOv2 - PyTorch
#PyTorch 版 YOLOv2
著名物体检测库 YOLOv2 的 PyTorch 版本,本项目还可以将训练好的 model 转换为适配 Caffe 2。
项目链接:
https://github.com/ruiminshen/yolo2-pytorch
Simple Railway Captcha Solver
#基于 CNN 的台铁订票验证码辨识
本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。
目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。
项目链接:
https://github.com/JasonLiTW/simple-railway-captcha-solver
AlphaZero-Gomoku
#用 AlphaZero 下五子棋
这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。
论文:AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
链接:https://www.paperweekly.site/papers/1297
论文:AlphaGo Zero: Mastering the game of Go without human knowledge
链接:https://www.paperweekly.site/papers/942
项目链接:
https://github.com/junxiaosong/AlphaZero_Gomoku
gym-extensions
#OpenAI Gym 扩展集
这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。
项目链接:
https://github.com/Breakend/gym-extensions
Myia
#Python 深度学习框架
Myia 是一个全新的 Python 深度学习框架,具有使用简单、自动微分和性能优化的特点。
项目链接:
https://github.com/mila-udem/myia