从前面的学习笔记中,笔者和大家一起使用了一步一步从感知机开始到两层网络以及最后实现了深度神经网络的算法搭建。而后我们又讨论了改善深度神经网络的基本方法,包括神经网络的正则化、参数优化和调参等问题。这一切工作我们都是基于完成的,没有调用任何深度学习框架。在学习深度学习的时候,一开始不让大家直接上手框架可谓良苦用心,旨在让大家能够跟笔者一样,一步一步通过搭建神经网络的过程就是要让你能够更加深入的理解神经网络的架构、基本原理和工作机制,而不是黑箱以视之。
但学习到这个阶段,你已充分理解了神经网络的工作机制,马上就要接触更深层次的卷积神经网络(CNN)和递归神经网络(RNN),依靠纯手工去搭建这些复杂的神经网络恐怕并不现实。这时候就该深度学习框架出场了。针对深度学习,目前有很多优秀的学习框架,比如说笔者马上要讲的,微软的,伯克利视觉中心开发的,以及别具一格的和友好易用的,本系列深度学习笔记打算从开始,对三大主流易用的深度学习框架、和进行学习和讲解。选择这三个框架的原因在于其简单易用、方便编程和运行速度相对较快。
作为谷歌的深度学习框架,在深度学习领域可谓风头无二。其中可以理解为类似于的 N 维数组,名为张量;则意味着 N 维数组的流计算,而的数据流计算形式则为一个计算图的形式进行计算。这里重点提一下,如果大学本科期间的线性代数忘记了的话,我劝你赶紧回去翻一翻,线性代数和矩阵论是深度学习的基础,希望你能熟练掌握。
先看个简单的例子。
在上述代码中,我们首先定义了两个常量,然后定义了一个 loss(变量),之后对变量进行初始化,创建计算会话,最后执行会话计算并打印结果。所以我们可以看到运行的基本机制:
创建一些尚未被执行的张量——定义这些张量之间的运算操作——初始化这些张量——创建会话——执行会话
需要注意的一点是,创建会话后一定要执行这个会话,且看下面示例:
在上面的示例中,我们创建了两个和之间的乘积运算,但直接打印的结果却不是我们想要看到的 20. 原因则在于这里我们没有创建会话并执行,只是打印了两个张量运算之后的张量。创建会话并执行操作如下:
除了直接定义变量之外,我们还可以通过创建占位符变量来稍后为之赋值,然后在运行会话中传入一个,示例如下:
相信你已经大致明白了基于张量运算的的底层运行机制了。总结而言就是:创建张量、初始化张量、创建会话并执行。
下面展示几个的神经网络计算的基础函数示例。
线性函数
计算函数
计算损失函数
编码
参数初始化
一顿操作之后,我们已经将神经网络的一些基础运算利用定义好了。在下一期笔记中,我们将学习如何使用搭建神经网络。
参考资料:
https://www.coursera.org/learn/machine-learning
https://www.deeplearning.ai/
领取专属 10元无门槛券
私享最新 技术干货