最近,普拉纳夫 · 达尔(Pranav Dar)发文总结了 2018 年 2 月份 Github 上最火的 5 个数据科学和机器学习项目。
Pranav Dar,Analytics Vidhya 的编辑。数据可视化和六西格玛从业者喜欢阅读和深入研究数据科学和机器学习艺术。始终在寻找新的方法来改善使用ML和AI的流程。
1.FastPhotoStyle(快速转换照片风格)
FastPhotoStyle 这个项目是英伟达(NVIDIA)开发的一个 Python 库。该模型将内容照片和风格照片作为输入。然后它将风格照片的风格转移到内容照片,即就是将内容照片的风格转换为我们输入的风格照片的风格。
开发人员举出了两个算法示例。首先,第一个是非常简单的迭代算法,只需要下载一张内容图和风格图,重新调整他们尺寸,然后运行图像风格化代码。第二个样例中,需要使用语义标签映射来创建程式化图像。
2.Twitter Scraper(Twitter 爬虫)
如果你在 Twitter 上发过文章,就知道 Twitter 自身的 API 有流速限制,当然,作为国内用户大多数人都没用使用过 Twitter ,这个 Python 库就是考虑到这一点,它没有 API 限流(不需要任何身份验证),也没有限制,并且速度非常快。开发人员可以用这个库爬取任何用户的任意一条 Twitter (推文)。
而且,这个项目可以用于制作马尔科夫链,但是目前它只能适用于 Python 3.6 及以上版本。
3.Handwriting Synthesis(手写体合成)
这个项目来自亚历克斯 · 格雷夫斯(Alex Graves)撰写的论文(Generating Sequences with Recurrent Neural Networks)《用 RNN 生成序列》,正如存储库的名称所示,您可以生成不同风格的手写,是其中手写体合成实验的实现,它可以生成不同风格的手写字迹。模型包括初始化和偏置两个部分,其中初始化控制样例的风格,偏置控制样例的整洁度。
作者在 GitHub 页面上呈现的样本的多样性真的很吸引人。他正在寻找贡献者来加强存储库,所以如果您有兴趣,可以研究去看看。
4.ENAS PyTorch(高效神经网络结构搜索)
该项目是对论文《参数共享的高效神经网络结构搜索(Efficient Neural Architecture Search (ENAS) via Parameters Sharing)》的实现。ENAS做什么?高效神经网络结构搜索,即 ENAS 减少了计算需求,将 NAS 的 GPU 计算时间减少了 1000 倍。他们通过共享大型计算图中的子图模型之间的参数共享来完成此操作。
如何使用它的过程已经在GitHub页面上得到了很好的展示。实现这个库的先决条件是:
5.Sign Language(手势语言识别)
这是一个相对简单但又十分吸引人的机器学习项目。在 Python 中使用卷积神经网络构造模型,可以识别手势并将其转换为机器上的文本。
该项目存储库的作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型,他特别详细地说明了他是怎么创建这个项目的,以及每一步是怎么进行的。
是不是感觉非常不错的,如果你对机器学习感兴趣,可以去这些开源项目中去研究和学习一下。另外,通过这几个开源项目,我们又一次了解了 Python 的重要性,所以,对于想学编程的读者或者初入职场的计算机学生,可以往 Python 方向学习一下。
俗话说,一切分享不给开源项目地址的分享,都是伪分享,所以,上述五个开源项目的地址依次如下: