首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

4月份最热门的数据科学和机器学习GitHub开源库和Reddit话题

作者|PRANAV DAR

编译|zongmumask

编辑|Debra

AI 前线导读:当涉及到数据科学和机器学习时,GitHub 和 Reddit 是最受欢迎的两个平台。 前者是代码分享和协同工作的绝佳工具,而后者则是与全球数据科学爱好者交流的最佳平台。今年,我们每个月都会讨论最热门的 GitHub 开源项目,从本月起,我们将包括 Reddit 上机器学习领域最有趣的话题。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

4 月份一些很酷的 Python 项目开源了。 从 Deep Painterly Harmonization,一个使合成图片很真实的库,到 Swift for TensorFlow,这篇文章涵盖了上个月最出色的开源项目。

我们来看看四月关于数据科学和机器学习最热门的开源项目和 Reddit 上最有趣的讨论。

下面链接可以查看过去三个月里最热门的开源项目:

二月

https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018/

三月

https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/

四月

https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/

GitHub 开源项目

Deep Painterly Harmonization

https://github.com/luanfujun/deep-painterly-harmonization

使合成图像看起来更加真实的技术已经发展了有些年头。 通过深度学习,这个任务将变得更有效率,合成效果也更真实。 开发人员提出新算法,可以使外部元素与手绘完美融合,最终合成效果几乎与原始绘图无法区分。

上面的三张图片 - 第三帧是最终输出,如果没有前面的两张图片,是很难知道气球是后来合成进来的。 该算法比手动合成更精细,迄今为止,其精细程度手动编辑也很难实现。

你可以在这里 AVBytes 了解关于 Deep Painterly Harmonization 的更多信息。

https://www.analyticsvidhya.com/blog/2018/04/add-objects-paintings-images-seamlessly-amazing-python-script/

Swift For TensorFlow

https://github.com/tensorflow/swift

在上个月的 TensorFlow 开发者峰会上亮相,现在已经在 GitHub 上向整个社区开源。 开发团队的目标是为 TensorFlow 提供一个新的平台,这建立在 TensorFlow 强大的功能基础上,同时将其可用性提升到一个全新的水平。

由于该项目仍处于初始阶段,还不适合用于构建深度学习模型。 团队承认截止到开源面向社区,该项目离设想中的目标还有一定距离。 但其中还有很多潜力尚未开发。

我们在这里

https://www.analyticsvidhya.com/blog/2018/04/swift-tensorflow-now-open-sourced-github/介绍了 Swift for TensorFlow 以供参考。

MUNIT: 多模态无监督图像转换

https://github.com/NVlabs/MUNIT

康奈尔大学的一个研究小组提出了多模态无监督图像到图像转换(MUNIT)框架,用于将图像从一个领域转换到另一个领域。 其目的是将图像转换成指定领域的新图像(例如,将狗的图像转换为猫)。

先前存在的方法能够仅执行给定图像的一对一映射,不能对同一张图像产生不同的输出。 然而,MUNIT 能够产生多个输出。 激动吧!

我们在 AVBytes 上

https://www.analyticsvidhya.com/blog/2018/04/framework-for-unsupervised-image-to-image-translation/ 介绍了它的工作原理。

GluonNLP

https://github.com/dmlc/gluon-nlp

深度学习在自然语言处理领域取得了长足进步。 在互联网上出现过的有很多文字可以追溯到几个世纪! GluonNLP 是一个工具包,旨在让 NLP 任务变得更简单。 通过海量数据和构建的深度学习神经模型让文字处理更加容易。 这使得 NLP 研究变得更加高效。

该库拥有一个很好的文档,以及详细的使用示例。 该库还有一个针对新手的 60 分钟速成课程。

PyTorch GAN

https://github.com/eriklindernoren/PyTorch-GAN

该库是一个金矿。 该库收集了已经发表的关于 GAN(或生成敌对网络)研究论文的 PyTorch 实现。 目前列出了 24 种不同的实现,每种实现都有其独特之处。 该列表包含 Adversarial Autoencoders,CycleGAN,Least Squares GAN,Pix2Pix 等实现。

Reddit 讨论话题

帮助用户理解研究论文

https://www.reddit.com/r/MachineLearning/comments/8b4vi0/d_anyone_having_trouble_reading_a_particular/

如果在理解任何研究论文时遇到困难,那么 Reddit 机器学习社区可以提供帮助。 这是一个非常棒的想法,它已经帮助很多人在快要放弃的时候找到了问题的答案并继续下去。

但是当你想要发帖时,要确保提供尽可能详细的信息,比如文章摘要,被卡住的地方,你自己发现了什么,等等。这条评论总结得很好 - “把自己当做写论文的研究小组成员,而不是等待别人给你答案”。

关于机器智能的声明

https://www.reddit.com/r/MachineLearning/comments/8fmtr9/d_statement_on_nature_machine_intelligence/

关于研究应该是开源还是封闭的争论已经持续了数十年。 最近,受欢迎的“自然”杂志宣布它将发布封闭式期刊。 这导致了一场针对他们的重大运动,许多有影响力的人(Jeff Dean, Ian Goodfellow 等)在一份请愿书中加入了他们的签名,声明他们不会向这样的出版物投稿。

关于研究结果是否应该开源给社区有不同的见解。 这是一个值得了解的话题,强烈建议阅读整个主题,看看 ML 社区对这个主题的看法。

Michael Jordan 关于 AI 现状的演讲

https://www.reddit.com/r/MachineLearning/comments/8daqki/d_very_sobering_presentation_on_the_current_state/

Michael Jordan 是伯克利的著名教授,在最近的一次演讲中他详细地谈了我们离真正的机器智能还有多远。 这是一个思路清醒的演讲,听完会让人对这个问题产生思考。

这个主题已经产生了超过 100 条评论,用户充分发表了他们关于 AI 现状的想法。 用户的深入讨论让这个话题变得更有意思。 这个话题仍在讨论中,加入他们吧。

科学家计划建立巨型欧洲 AI 中心与美国竞争

https://www.reddit.com/r/MachineLearning/comments/8ekmqy/scientists_plan_huge_european_ai_hub_to_compete/

这个问题里面也有很多干货。 来自欧洲和美国各地的数据科学家和机器学习研究人员参与了关于 ML 的结构以及薪资的激烈讨论。这里可以获得关于 ML 项目和潜在薪酬架构的很多观点。

测量目标景观的内在维度

https://www.reddit.com/r/MachineLearning/comments/8f9dvm/ruberai_measuring_the_intrinsic_dimension_of/

这个主题是从 Uber 的视频中发展出来的,它将内在维度发展为神经网络的基本属性。 如果你对视频中提供的内容有任何疑问,社区已经详细回答了这些问题。 最棒的似乎是人们喜欢将一篇研究论文转化为一段视频,这使得研究更容易理解。

AI前线

紧跟前沿的AI技术社群

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180507G1FCIB00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券