本文结构:
神经网络就是按照一定规则将多个神经元连接起来的网络
例如全连接(full connected, FC)神经网络,它的规则包括:
不同的神经网络,具有不同的连接规则
神经元和感知器的区别也是在激活函数: 感知器,它的激活函数是阶跃函数,神经元,激活函数往往选择为 sigmoid 函数或 tanh 函数等
其中 sigmoid 函数的公式和图表示如下:
想了解更多还可以看这篇:常用激活函数比较
先向前计算,再向后传播
例如上面神经网络的结构
输入层,首先将输入向量的每个元素的值,赋给输入层的对应神经元
隐藏层,前一层传递过来的输入值,加权求和后,再输入到激活函数中,根据如下公式,向前计算这一层的每个神经元的值
用矩阵来表示
这个公式适用于每个隐藏层和输出层,就是 W 的值和 f 的形式会不一样,
其中 W 是某一层的权重矩阵,x 是某层的输入向量,a 是某层的输出向量
模型要学习的东西就 W。
诸如神经网络的连接方式、网络的层数、每层的节点数这些参数,不是学习出来的,而是人为事先设置的,称之为超参数。
训练它们的方法和前面感知器中用到的一样,就是要用梯度下降算法:
完整的推导可以看这篇,一步一步很详细: 手写,纯享版反向传播算法公式推导
part 4. 代码实现 下次再写
学习资料: https://www.zybuluo.com/hanbingtao/note/476663
关于神经网络,写过的文章汇总:
Neural Networks | Are | Cool |
---|---|---|
理论 | ||
神经网络的前世 | ||
神经网络 之 感知器的概念和实现 | ||
神经网络 之 线性单元 | ||
手写,纯享版反向传播算法公式推导 | ||
常用激活函数比较 | ||
模型 | ||
图解何为CNN | ||
用 Tensorflow 建立 CNN | ||
图解RNN | ||
CS224d-Day 5: RNN快速入门 | ||
用深度神经网络处理NER命名实体识别问题 | ||
用 RNN 训练语言模型生成文本 | ||
RNN与机器翻译 | ||
用 Recursive Neural Networks 得到分析树 | ||
RNN的高级应用 | ||
TensorFlow | ||
一文学会用 Tensorflow 搭建神经网络 | ||
用 Tensorflow 建立 CNN | ||
对比学习用 Keras 搭建 CNN RNN 等常用神经网络 |
END.
来源:极客X养成计划
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有