首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

带你通俗易懂的理解人 工智能算法1

勋章计划

我们所谓的人工智能算法就是一个机器嵌入了这个算法后,这个机器就拥有了人所具有的基本能力,比如观察、思考、学习、创造等,本文要说的就是这个算法。

人工智能算法主要由两部分组成:深度学习(Deep Learning)和强化学习(Reinforce Learning)

深度学习

深度学习就是多层人工神经网络。

它主要包括三个部分:输入层、隐藏层、输出层。输入层就是机器的输入数据,比如我们问它:"你吃了吗?",而隐藏层就是对这句话的特征提取和分析的过程,机器想我今天到底有没有吃,然后输出层就是结果,比如机器人说 :"吃了",就是输出层。

强化学习

强化学习相当于建立了一个机器与环境交互的过程。

强化学习主要包括两个部分,一个是Agent,就是机器。一个是Environment环境。对于Agent来说,外面的任何事物包括天气、光线、张三、李四都是环境。比如今天Environment很冷,就是Enviroment当前时刻的State是“冷”,现在Agent机器知道了有点冷,它就执行了一个Action动作,把衣服脱了。然后环境就知道了机器把衣服脱了,天冷了脱衣服不对啊,所以Enviroment环境就给了Agent一个负的Reward,因为它的Action不对。然后Environment又给了Agent当前时刻的State:“冷”,这时候Agent吸取上次的教训,就把衣服穿上了。Environment知道Agent把衣服穿上了,是个正确的行为,所以就给了Agent正的Reward。所以以后环境冷的时候,Agent就知道要穿衣服了。

神经网络基本实现

神经网络的基本单元:神经网络的基本单元就是神经元,第一层的神经元是我们的输入数据,是已知的。第二层每个神经元相当于一个函数,它接收输入值x,经过函数映射得到输出值y,然后把y作为下一层的x。这样依次类推,到最后一层,得到最后一层的值。

神经网络的本质:就是一个分类算法,所谓的分类算法就是一个公式,根据不同的输入X,经分类算法映射得到的y就是分类结果。就像我们输入猫的图片,得到的就是一个猫的标签或者狗的预测,这就是分类。

神经网络的简化表达:y = AX+b,y是分类结果,同时y也被称为预测值,X是输入值,A和b是公式参数。

神经网络的目标:调整A,b的值,使预测值和真值越来越接近,直到它们的差值小于等于我们设定的阈值。其中真值就是上面说的图片的标签,预测值就是公式的结果y。

神经网络的实现主要两个步骤:一是网络的搭建,二是网络的训练。

网络的搭建就是我们的神经网络要设计成几层,每层有多少个神经元,层与层之间是怎么连接的。我们理解的当然层数越多,神经元越多,这个神经网络越强大。但是当太多的时候会出现一个过拟合的现象。就是随着层数增多,效果不一定就越好,要根据激活函数、正则项、层与层的连接方式等结合起来考虑。

网络怎么训练呢,我们就拿已经贴好标签的猫狗的图片来训练。猫的图片我们就贴标签“猫”,狗的图片我们就贴标签为“狗”。首先我们把猫的图片输入到神经网路中,如果神经网络判断这个图片是猫,那就不去管神经网络里面的参数,如果神经网络判断猫的图片是狗,那就使用反向传播算法更新神经网络的参数。更新原则就是最小化真值和预测值之间的差值。

网络搭建好,神经网络的模型训练好之后,就可以拿模型来识别是猫狗的图片了。

其实个人观点是,深度学习还是在强化学习的范畴内的。现阶段来看强化学习仍然是人工智能的top-level算法,至于对抗生成网络,去年火起来,今年进展不大,倒是基于强化学习的AlphaGo突飞猛进。至于什么时候能够开发出超强的人工智能算法,让我们拭目以待吧!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171211A0XJNO00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券