学界 | 李飞飞高徒Andrej Karpathy提醒你，小心搭建神经网络的六个坑

大数据文摘

发布于 2018-07-31 11:54:00

3240

发布于 2018-07-31 11:54:00

文章被收录于专栏：大数据文摘

大数据文摘编辑组出品

继Ian Goodfellow的推特小课堂之后，特斯拉的人工智能研究负责人、李飞飞斯坦福高徒Andrej Karpathy也在twitter上分享了他对神经网络的一些研究技巧。

昨晚，他连发几条twitter，细数了六种神经网络研究中的常见错误。引发了一波研究者们对于自己入过坑的吐槽。

来看一下Ian Goodfellow让你当心的这六个坑吧：

最常见的神经网络错误：

之后，在评论区，也有读者针对“对数据初始化”展开了讨论。

对此，Ian也进一步详细解释：

是的，有几次我重新打开数据，得到的损失值却一致，而且如果这样做会产生一个漂亮的损失曲线，这表明对数据初始化并不是明智的做法。我有时喜欢调整最后一层偏差，使之接近基础分布。

我喜欢先从最简单的开始，例如，先对所有未处理的数据进行训练，看看基本输出分布的表现如何，然后逐增加输入和扩大网络，确保每次都比以前的表现更好。

【今日机器学习概念】

Have a Great Definition

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-07-03，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自大数据文摘微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度