1 . 神经元单元本质 : 一个 神经元 单元 , 其本质是 逻辑回归单元 ;
2 . 逻辑回归 与 线性回归 :
① 回归 : 用于预测连续的值 , 叫做回归 ; 预测离散的值叫做分类 ;
② 线性回归 : 确定若干变量之间的相互依赖关系 ; 回归分析中 , 自变量
, 因变量
,
, 自变量和因变量之间的关系是一条直线 , 叫做一元线性回归分析 ; 如果有多个自变量 , 自变量与因变量是线性关系 , 叫做多远线性回归分析 ;
③ 逻辑回归 : 是广义的线性回归 , 类似于多重线性回归分析 , 其模型都包含
; 多重线性回归将
作为因变量 ; 逻辑回归 通过函数
, 将
转为状态
, p 决定因变量的值 ,
函数如果是逻辑函数 , 该回归就是逻辑回归 ;
④ sigmod 激活函数 : 这里的 sigmod 激活函数就是逻辑回归函数 , 因此该回归也叫作逻辑回归 ;
⑤ 线性支持向量机 : 某种程度上是逻辑回归 ;
1 . sigmod 非线性变换函数的作用 : 目的是为了进行非线性变换 ;
没有逻辑回归后果 : 如果没有非线性变换 , 不管神经网络是多少层的 , 只能进行
个线性变换 ; 每一层的输出都是上一层的输出的线性变换结果 , 即使有
层 , 其变换还是线性的 , 无法拟合复杂的的函数变换 ;
sigmod 函数是非线性的激活函数 , 目的是将线性的计算 , 转为非线性的计算方式 ;
引入了非线性激活函数 , 使整个神经网络的模型更加 灵活 ;
2 . 线性计算 : 神经元单元 输入的计算方式是 将上一层单元的输出进行线性叠加 , 乘以一个权值 , 再加上偏置 , 这是线性计算 , 该操作执行
次也是线性操作 ;
3 . 非线性计算 : 神经元单元 输出的计算方式是 将输入的数值 , 经过 sigmod 激活函数 , 转为一个
的输出结果 , 该计算过程是非线性的操作 ;
神经元单元 逻辑 :
是上一层连接单元的输出 ;
指的是单元之间连接的权重 ;
指的是单元本身的偏置属性 , 可能是一个单元的偏置 , 如果有多个连接 , 就是多个单元的偏置之和 ;
就是将线性的
结果转为
区间值的隐藏状态 ;
是本层的输入 ;
函数是一个非线性的激活函数 , 这里指的是 sigmod 激活函数 , 将本层的输入转为本层的输出 , 该函数将全体实数映射到
之间 ;
是将上一层的输出 , 转为本层的输出 ;
1 . 单个 神经元单元 总结 :
① 线性回归转换成输入 : 计算中间层单元的输入时 , 通过上一层的输出值 乘以 连接权值 , 加上偏置 , 等一系列线性计算 , 得到输入值 , 这是线性回归变换 ;
② 逻辑回归转换成输出 : 将上述线性回归变换的结果 , 经过 sigmod 激活函数计算 , 将多个线性输入 , 转化成了
区间内的 单个输出 ,
2 . 通过线性回归将输出转为输入 ;
然后通过 sigmod 激活函数 , 将输入转换成了
区间的 输出值 ;
单层的 多个神经元单元 , 可以看做是同时并发运行的逻辑回归单元 ;
1 . 神经网络本质 : 神经元的本质是运行单个逻辑回归单元 , 神经网络的本质是 在每一层并行运行多个逻辑回归单元 , 先后运行多层 ( 输入层 / 隐藏层 / 输出层 ) ;
2 . 神经网络每层单元运行机制 ( 并行运行多个单元 ) : 对于神经网络中的每一层 , 有若干个神经元单元 , 该层的运行相当于若干个 神经元单元 并行运行 , 即 该层的神经元单元同时进行 输入计算 , 同时进行输出计算 , 然后根据输出 , 计算后一层的每个单元的输入值 ;
3 . 神经网络每层的输入输出 :
① 线性输入 : 神经网络每一层的输入 , 可以看做若干线性回归 计算 ;
② 逻辑输出 : 神经网络每一层的输出 , 可以看做若干逻辑回归 计算 ;
4 . 神经网络层计算本质 : 将 向量值 ( 多个单元的输入值 ) 传入一组逻辑回归函数 ( sigmod 激活函数 ) , 得到的也是向量值输出 ( 多个单元的输出值 ) ;
向量值就是多个变量组成的一维矩阵 ;
1 . 使用上一篇博客的示例 : 以计算下图中的
两个节点的输入 和 输出为例 ;
① 节点
输入计算
② 连接权值 :
是
条有向弧连接的权值 ; 如
是单元
与 单元
连接的权值 ;
③ 偏置 :
分别是 单元
的偏置 ;
④ 上层单个单元输出对应的输入值 :
对应单元
输出到单元
的输入值 ;
对应单元
输出到单元
的输入值 ;
对应单元
输出到单元
的输入值 ;
对应单元
输出到单元
的输入值 ;
对应单元
输出到单元
的输入值 ;
对应单元
输出到单元
的输入值 ;
2 . 隐藏层 输入 计算的矩阵形式 :
隐藏层输入计算 :
隐藏层输出计算 :
①
矩阵 : 上一层单元 与 本层单元 连接的 权值矩阵 , 共有
个连接 , 如
代表单元
和单元
的连接 ;
②
矩阵 : 代表上一层单元的输出值 矩阵 ,
代表单元
的输出 ,
代表单元
的输出 ,
代表单元
的输出 ;
③
矩阵 : b 代表上一层单元的偏置矩阵 ;
④
矩阵 : 代表隐藏层输入值矩阵 , 使用上面的
三个矩阵计算出的结果也是矩阵 , 结果是线性计算输入的值组成的矩阵 ;
⑤
矩阵 : 代表隐藏层的
个单元的输出值 ;
即 :
3 . 矩阵形式 展开 :
① 隐藏层输入计算 :
② 隐藏层输出计算 :
③ 隐藏层输入计算矩阵形式展开后为 :
④ 隐藏层输出计算矩阵形式展开后为 :