Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT(附思维导图)

李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT(附思维导图)

作者头像
石晓文
发布于 2019-06-04 09:46:07
发布于 2019-06-04 09:46:07
5.7K0
举报
文章被收录于专栏:小小挖掘机小小挖掘机

作者:慢慢的燃烧

https://blog.csdn.net/u010164190/article/details/72633245

《1 天搞懂深度学习》,300 多页的 ppt,中国台湾李宏毅教授写的,非常棒。不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。

这份 300 页的 PPT,被搬运到了 SlideShare 上,下面是 SlideShare 的链接:

https://www.slideshare.net/tw_dsconf/ss-62245351?qid=108adce3-2c3d-4758-a830-95d0a57e46bc&v=&b=&from_search=3

废话少说,先上干货,整个 PPT 的思维导图如下:

一、深度学习概论

1. 介绍深度学习

作者非常浅显的指出机器(深度)学习过程非常简单,分为定义方法、判断方法的优劣、挑选出最佳的方法。

对于深度学习,首先第一步定义方法 - 神经网络。深度学习顾名思义是指多层的神经网络。

神经网络的思想来源于对于人脑的生理上的研究,人脑由数亿个神经元组成,神经元通过轴突互相连接通信。神经网络和人脑类似,存在多个层级(layer),每个层级都有多个节点(神经元),层级和层级之间相互连接(轴突),最终输出结果。

对于神经网络的计算能力可以理解为通过一层层Layer的计算归纳,逐步的将抽象的原始数据变的具体。以图片识别为例,输入是一个个像素点,经过每层神经网络,逐步变化成为线、面、对象的概念,然后机器有能力能够识别出来。

第二步,评估方法的优劣。

Loss function是用于评估方法优劣,通常我们用学习出来的参数对测试数据进行计算,得出对应的预测(y)然后和真实的测试数据的目标值(t)进行比对,y和t之间的差距往往就是Loss。那么评估一个算法的好坏,就是要尽可能的降低Loss。

第三步,如何获得最佳的学习方法。

获得最佳的学习是采用梯度下降算法,作者也提到梯度下降算法存在局部最优解的问题。人们往往认为机器无所不能,实际上更像是在一个地图上面拓荒,对周边一无所知。神经网络计算梯度的算法是反向传播算法,简称BP。

2. 为什么要足够“深”?

作者首先指出越多的参数往往带来越好的预测能力,所以神经网络往往参数越多越好。那么如果是同样的参数情况下,为什么层级较多的表现会更好呢?

作者认为深度网络可以带来模块化的好处,随着网络的层级,神经网络会将像素元素逐渐归纳出一些基本的特征,进而变成纹理,进而变成对象。

二、训练方法

作者总结下来训练过程中会发现了两种情况:

  • 没有办法得到很好的训练结果 —> 重新选择训练方式
  • 没有办法得到很好的测试结果 —> 往往由于过度拟合导致,需要重新定义方法

优化训练方法的手段:

  • 选择合适的Loss function:使用Cross Entropy效果要优于Mean Square Error
  • Mini-batch: 每次训练使用少量数据而不是全量数据效率更高
  • Activation Function:使用ReLU替代Sigmoid可以解决梯度消失的问题,可以训练更深的神经网络
  • Adaptive Learning Rate:可以随着迭代不断自我调整,提高学习效率
  • Momentum: 可以一定程度上避免陷入局部最低点的问题

避免过度拟合(overfitting)的方法:

  • Early Stopping:使用cross validation的方式,不断对validation data进行检验,一旦发现预测精度下降则停止。
  • Weight Decay:参数正则化的一种方式?
  • Dropout:通过随机去掉一些节点的连接达到改变网络形式,所以会产生出多种网络形态,然后汇集得到一个最佳结果
  • Network Structure: 例如CNN等其他形态的网络

三、神经网络变体

1. 卷积神经网络(CNN)

通常情况下,一个CNN包含多次的卷积、池化,然后Flatten,最终再通过一个深度神经网络进行学习预测。CNN在图像、语音识别取得非常好的成绩,核心的想法在于一些物体的特征往往可以提取出来,并且可能出现在图片的任何位置,而且通过卷积、池化可以大大减少输入数据,加快训练效率。

2. 循环神经网络(RNN)

RNN的想法是可以将hidden layer的数据存储下来,然后作为输入给下一个网络学习。这种网络的想法可以解决自然语言中前后词语是存在关联性的,所以RNN可以把这些关联性放到网络中进行学习。

四、其它前沿技术

Ultra Deep Network:

2015年出现了152层的Residual Net实现了图片3.57%错误率。

Reinforcement Learning:

通过奖励机制强化学习,并且做出相应的动作。

Unsupervised Learning:

1. Deep Style

2. 生成图片

3. 无需人工介入理解文字的含义

那么这份 300 页的 PPT 有没有离线版的呢?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小小挖掘机 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
深度学习概述
目前,关于神经网络的定义尚不统一,按美国神经网络学家Hecht Nielsen 的观点,神经网络的定义是:“神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算机系统,该系统靠其状态对外部输入信息的动态响应来处理信息”。
Ai学习的老章
2021/04/20
1.1K0
深度学习概述
深度学习笔记
焦红平
2017/07/27
2.5K0
深度学习笔记
深度学习基础--神经网络概述
神经网络的基本组成部分包括神经元模型、网络结构、前向传播、反向传播和梯度下降等概念。神经元是最基本的成分,一个神经元有多个输入和一个输出。神经网络可以分为三种主要类型:人工神经网络(ANN)、卷积神经网络(CNN)和循环神经网络(RNN)。 在深度学习中,神经网络通过构建大量的处理单元和层级结构来实现自动特征提取,这使得深度学习能够对复杂的模式和概念进行学习和表达。深度学习是机器学习的一个重要分支,其核心在于利用神经网络的层级结构和参数优化来解决复杂的问题。 神经网络的训练或学习主要目的是通过学习算法得到解决指定问题所需的参数,这些参数包括各层神经元之间的连接权重以及偏置等。深度学习与神经网络之间的关系是,深度学习依赖于神经网络的层级结构和参数优化,而神经网络是深度学习的基础。 综上所述,神经网络是深度学习的核心,通过构建复杂的层级结构和优化参数,能够处理各种复杂的任务。深度学习通过模拟人脑的机制来解释数据,例如图像、声音和文本,从而在人工智能领域取得了突破性的进展。
用户11315985
2024/10/16
5110
深度学习基础--神经网络概述
深度学习教程 | 深层神经网络
本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。
ShowMeAI
2022/04/14
6740
深度学习教程 | 深层神经网络
重磅! | 神经网络浅讲:从神经元到深度学习
神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。 本文以一种简单的,循序的方式讲解神经网络。适合对神经网络了解不多的同学。本文对阅读没有一定的前提要求,但是懂一些机器学习基础会更好地帮助理解本文。 神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。 那么机器学习中的神经网络是如何实现
用户1332428
2018/03/08
2.3K0
重磅! | 神经网络浅讲:从神经元到深度学习
关于深度学习,这57个专业术语,你必须得知道
本文整理了一些深度学习领域的专业名词及其简单释义,同时还附加了一些相关的论文或文章链接。本文编译自 wildml,作者仍在继续更新该表,编译如有错漏之处请指正。
IT阅读排行榜
2018/08/16
1.1K0
深度学习入门:几幅手稿讲解CNN
作者:岳翰 电子科技大学|数学科学学院 来源自 JohnHany的博客 量子位 已获授权编辑发布 学习深度神经网络方面的算法已经有一段时间了,对目前比较经典的模型也有了一些了解。这种曾经一度低迷的方法现在已经吸引了很多领域的目光,在几年前仅仅存在于研究者想象中的应用,近几年也相继被深度学习方法实现了。 无论是对数据的分析或是生成,无论数据形式是图像、视频、音频、文本还是其它复杂维度,也无论是下棋、玩游戏还是无人驾驶汽车导航,似乎总有人会发掘出这种强大工具的新用途。人类刚刚将仿生学运用到“如何创造智能”这个问
量子位
2018/03/27
1.1K0
深度学习入门:几幅手稿讲解CNN
深度学习教程 | 深度学习概论
本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。
ShowMeAI
2022/04/14
3.1K0
深度学习教程 | 深度学习概论
专栏 | 深度学习中的Normalization模型
我们先从 Mini-Batch SGD 的优化过程讲起,因为这是下一步理解 Batch Normalization 中 Batch 所代表具体含义的知识基础。
机器之心
2018/09/20
7410
专栏 | 深度学习中的Normalization模型
深度学习效果不好?试试 Batch Normalization 吧!
Batch Normalization(简称BN)自从提出之后,因为效果特别好,很快被作为深度学习的标准工具应用在了各种场合。BN大法虽然好,但是也存在一些局限和问题,诸如当BatchSize太小时效果不佳、对RNN等动态网络无法有效应用BN等。针对BN的问题,最近两年又陆续有基于BN思想的很多改进Normalization模型被提出。BN是深度学习进展中里程碑式的工作之一,无论是希望深入了解深度学习,还是在实践中解决实际问题,BN及一系列改进Normalization工作都是绕不开的重要环节。
崔庆才
2018/10/08
3.8K0
深度学习效果不好?试试 Batch Normalization 吧!
【干货】AI 实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……
来源:towardsdatascience.com 编译:马文 文强 【新智元导读】本文总结了10个强大的深度学习方法,包括反向传播、随机梯度下降、学习率衰减、Dropout、最大池化、批量归一化、长短时记忆、Skip-gram、连续词袋、迁移学习等,这是AI工程师可以应用于他们的机器学习问题的。 过去10年,人们对机器学习的兴趣激增。几乎每天,你都可以在各种各样的计算机科学课程、行业会议、华尔街日报等等看到有关机器学习的讨论。在所有关于机器学习的讨论中,许多人把机器学习能做的事情和他们希望机器学习做的事
新智元
2018/03/21
6730
【干货】AI 实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……
从 0 到 1:深度学习模型,重构世界的数字蓝图
深度学习模型自萌芽始,借 C++ 构建并优化,从基础理论到多领域实践。于计算机视觉、医疗、金融等发挥作用,重构世界数字蓝图。虽面临数据、解释性等挑战,但其未来创新与跨领域融合发展,仍值得期待。
羑悻的小杀马特.
2025/03/23
2770
从 0 到 1:深度学习模型,重构世界的数字蓝图
【机器学习】——神经网络与深度学习:从基础到应用
神经网络是一类仿生算法,通过连接不同的节点(即神经元),实现信息的传递和处理。每个神经元都能接收多个输入信号,经过加权求和后通过激活函数产生输出。神经网络最早于20世纪40年代提出,但直到深度学习技术兴起,才得以广泛应用。
用户11286421
2024/10/10
9980
从业务角度理解深度学习及其应用
近几年,深度学习在图像、音频处理等领域得到了广泛的应用并取得了骄人的成绩,本文根据笔者的工作实践,谈谈对深度学习理解,以及我们的应用和经验。文章涉及的很多结论,是笔者个人的理解和不充分实验的结果,所以难免谬误,请读者不吝指正。 机器学习就是学习对象的表示 “机器学习/深度学习模型依靠左右互搏,可以迅速达到很高的智能水准。”、“人工智能/深度学习能毁灭人类的奇点即将来到!” 网络上经常出现这类观点,让笔者非常惊讶。而让笔者更惊讶的是,很多人居然相信了。那么,什么是机器学习呢? 机器学习的对象是我们生活中所接触
用户1737318
2018/06/06
5070
深度学习的57个名词解释及相关论文资料
一、激活函数(AcTIvaTIon FuncTIon) 为了让神经网络能够学习复杂的决策边界(decision boundary),我们在其一些层应用一个非线性激活函数。常用的函数有sigmoid
企鹅号小编
2017/12/27
2.2K0
深度学习的57个名词解释及相关论文资料
Deep Learning Tutorial 李宏毅(一)深度学习介绍
大纲 深度学习介绍 深度学习训练的技巧 神经网络的变体 展望 深度学习介绍 深度学习介绍 深度学习属于机器学习的一种。介绍深度学习之前,我们先大致了解一下机器学习。 机器学习,拿监督学习为例,其本质上是要找到一个函数映射:输入数据(也就是训练样本)通过函数映射(也就是我们的机器学习算法)到输出空间上(也就是目标值,如果是分类问题,映射到某一类上)。 $$Meachine Learning \approx LookingFor A Function.$$ 那么我们如何从一个函数空间里找到目标函数呢?这里
用户1631856
2018/04/12
1.3K0
Deep Learning Tutorial 李宏毅(一)深度学习介绍
独家 | 一文读懂深度学习(附学习资源)
Figure1. Deep learning导图 前言 深度学习(deep learning)的概念最早可以追溯到1940-1960年间的控制论(cybernetics),之后在1980-1990年间发展为连接主义(connectionism),第三次发展浪潮便是2006年由人工神经网络(Artificial neural network)扩展开来并发展成为今天十分火热的深度学习(Figure 2)。实际上,深度学习的兴起和发展是非常自然的,人们在应用经典的机器学习方法时,需要对具体的问题或者数据相
数据派THU
2018/01/30
2.1K0
独家 | 一文读懂深度学习(附学习资源)
浅说深度学习之一-从到
本文介绍了深度学习的发展历程、技术原理、模型架构、应用领域以及未来前景。
企鹅号小编
2017/12/28
1.2K0
浅说深度学习之一-从到
[深度学习概念]·深度学习简介
我们生活在这样一个世界:无论好坏,我们总是被深度学习算法所包围。从社交网络过滤到自动驾驶汽车,再到电影推荐,金融欺诈检测,药物发现……深度学习影响着我们的生活和决策。
小宋是呢
2019/06/27
8920
[深度学习概念]·深度学习简介
深度学习(一)基础:神经网络、训练过程与激活函数(1/10)
深度学习作为机器学习的一个子领域,近年来在人工智能的发展中扮演了举足轻重的角色。它通过模仿人脑的神经网络结构,使得计算机能够从数据中学习复杂的模式和特征,从而在图像识别、自然语言处理、游戏等领域取得了突破性的进展。
正在走向自律
2024/12/18
1.2K0
深度学习(一)基础:神经网络、训练过程与激活函数(1/10)
推荐阅读
相关推荐
深度学习概述
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档