在一次关于AI的技术交流会上,认识了段勇。那个会议有两天,第一天只是短暂的见面,他没给我留下特别的印象。
第二天下午的交流议程,有一项是Recurrent neural network(RNN)。这个题目我也很感兴趣。神经网络有很多种,无论如何,RNN都是诸多神经网络模型中比较复杂的。一般的网络,都是无循环的,输入信息顺着网络向前传递进行推理。误差信息向后反馈进行训练。但是RNN是有循环的,n层的输出除了要向前给n+1层外,还要返回影响本层的输入。
记得在那次交流之前的几个月里,我经常与JIURL聊AI。一般是中午散步时候,我们聊AI的问题,对AI的看法,也聊到过RNN。简单说,RNN是解决网络记忆问题的一种方法。人类的大脑是有记忆的,但是目前的神经网络只是在训练时可以记忆,到了推理环境,无法记忆新的信息。虽然有这样的基本理解,但是我们都认为RNN比较难,不好理解,训练的难度更大。
因为此,看到有人要讲RNN,我就想听一下,谦虚点说,是想学习一下。不客气点说,是想看看这人到底啥水平,竟然敢讲RNN,看他讲的怎么样。
时间到了,段勇上台,RNN开讲。
他先举了一个栗子(^-^):the president of apple eats an apple。以NLP问题解说深度神经网络(DNN)需要记忆。找到了后来他给我的PPT,截图如下:
一个例子讲完,他又举了一个栗子。
通过两个例子把RNN的背景说清楚了。也让我觉得这个人可以的,不是照本宣科的等闲之辈。
接下来他直奔主题,抛出RNN的基本原理:使用记忆体来解决记忆问题。
记得他当时反复把记忆体比喻为记忆细胞。讲的时候表情很丰富,面带笑容,音调抑扬顿挫,讲的很有感情。
然后,他详细讲解了向记忆体存储知识,和从中读取知识的过程。并且回到第二个NLP例子,结合着讲了RNN如何使用记忆细胞解决NLP问题。
听了这场RNN演讲,我彻底认识了段勇。当晚一起吃饭聊天,知道了他也是交大毕业的,比我晚几年,于是我叫他段勇师弟。
后来知道,他也在创业。与我类似,辞掉了工作,专心做想做的事情。
再后来又知道,他也有讲课的经历。难怪那天听他讲RNN,感觉他讲台感很强,面对听众,驾轻就熟。
有一天,我请他到863。他来了,吃过午饭,一起在园区散步。闲聊时,讲到红火的区块链,他口若悬河般给我讲了一大通,让我获益很多。
那一天,我们又聊起交大校园,我问他住哪个宿舍,他说11栋,我说怎么和我当年的一样,我继续问他住几楼,他说6楼,我说当年我也住6楼啊,我继续问他住六零几。他说住602,终于有点差别了。和他在前一起,我们俩都喜欢哈哈大笑。这就是我的段勇师弟。前段时间,段勇师弟花了一年多时间精心创作的AI实验室上线了,就以这篇小文, 表示祝贺和我的敬意吧。
(段勇师弟A+实验室的二维码)
***********************************************************
正心诚意,格物致知,以人文情怀审视软件,以软件技术改变人生。
欢迎关注格友公众号
领取专属 10元无门槛券
私享最新 技术干货