最近成为头条新闻的一个更复杂和被误解的主题是人工智能。像埃隆·马斯克这样的人警告说,有朝一日机器人可能会摧毁我们所有人,而其他专家则声称我们处于人工智能冬季的边缘,技术无处可去。对它进行正面或反面都很困难,但最好的起点是深度学习。这是你需要知道的。
由于深度学习的兴起,人工智能已成为全球科技界的焦点。计算机视觉和自然语言处理的根本发展是AI最重要和最有用的功能之一,它与人工神经网络的创建直接相关。
出于本文的目的,我们将人工神经网络简称为神经网络。但是,重要的是要知道计算机的深度学习技术是基于人类和其他动物的大脑。
科学家认为,生物的大脑通过使用生物神经网络来处理信息。人类大脑有多达100万亿个突触 - 神经元之间的间隙 - 在激活后形成特定的模式。当一个人想到某个特定的东西,记住一些东西,或者用一种感官来体验某种东西时,就会认为特定的神经模式会在大脑内“点亮”。
想象一下:当你学习阅读时,你可能不得不发出声音,这样你就可以大声聆听它们并引导你的年轻大脑得出结论。但是,一旦你读了足够多的单词cat,你就不必放慢速度并发出声音。在这一点上,你可以访问大脑中与记忆相关的部分,而不是解决问题,因此你可以训练你的生物神经网络来识别单词“cat”,从而触发一组不同的突触。
在深度学习领域,神经网络由一系列层组成,其工作方式与活体大脑的突触非常相似。我们知道,研究人员通过喂养尽可能多的猫的图像,教会计算机如何理解猫是什么 - 或者至少是猫的图片。神经网络采用这些图像并试图找出使它们相似的所有东西,以便它可以在其他图片中找到猫。
科学家利用神经网络教授计算机如何为自己做事。以下是神经网络的一些示例:
正如您所见,神经网络解决了各种各样的问题。为了理解它们是如何工作的 - 以及计算机如何学习 - 让我们仔细研究三种基本类型的神经网络。
有许多不同类型的深度学习和几种类型的神经网络,但我们将关注生成对抗网络(GAN),卷积神经网络(CNN)和循环神经网络(RNN)。
首先,GAN。Ian Goodfellow是谷歌人工智能大师之一,于2014年发明了GAN。用外行人的话来说,GAN是一个由两个争论方组成的神经网络 - 一个发电机和一个对手 - 它们之间相互斗争,直到发电机获胜。如果你想创造一个模仿艺术风格的人工智能,比如毕加索的作品,那么你就可以给GAN喂一些他的画作。
网络的一方将试图创造新的图像,欺骗对方认为他们是由毕加索绘制的。基本上,人工智能会通过检查每幅图像的各个像素来学习毕加索作品的一切。它的一面会开始创作一幅图像,另一面则会确定它是否是毕加索。一旦AI愚弄了自己,结果就可以由一个人来查看,他可以确定算法是否需要调整以提供更好的结果,或者是否成功模仿了所需的风格。
GAN用于各种各样的人工智能,包括由Nvidia制造的这种令人惊叹的GAN,它创造了人们凭空而来。
不要与新闻媒体混淆的CNN是卷积神经网络。这些网络至少在理论上已经存在,自20世纪40年代以来,但由于先进的硬件和高效的算法,它们现在才变得有用。在GAN试图创建愚弄对手的东西的地方,CNN有几个层,通过这些层将数据过滤成类别。这些主要用于图像识别和文本语言处理。
如果您有十亿小时的视频要筛选,您可以构建一个CNN,尝试检查每个帧并确定发生了什么。人们可以通过喂养已被人类标记的复杂图像来训练CNN。AI通过查看人类已标记的图片,将图像中的像素与其理解的标签进行比较,然后将其看到的所有内容组织到已经训练过的类别中,学会识别停车标志,汽车,树木和蝴蝶等物品。
CNN是最常见和最强大的神经网络之一。研究人员将它们用于无数的事情,包括在诊断某些疾病方面表现优异的医生。
最后我们有RNN或递归神经网络。RNN主要用于AI,需要细微差别和上下文来理解其输入。这种神经网络的一个例子是解释人类语音的自然语言处理AI。只需要看看谷歌的助手和亚马逊的Alexa就可以看到一个RNN的实例。
为了理解RNN是如何工作的,让我们设想一个基于人类输入产生原创音乐作品的AI。如果你发挥音符,人工智能试图“产生幻觉”下一个音符应该是什么。如果您播放另一个音符,AI可以进一步预测该歌曲的声音。每个上下文都为下一步提供信息,RNN根据其持续输入不断更新自身 - 因此名称的重复部分。
至少还有十几种其他类型的神经网络,这里介绍的三种神经网络比本文的范围要细致得多。但是,如果你已经做到这一点,你应该对神经网络是什么以及它们的作用有一个对话的理解。如果您想了解更多信息,请将您的机器学习教育提升到新的水平:
关于神经网络世界正在发生的所有最大新闻,请查看我们的 人工智能部分。
领取专属 10元无门槛券
私享最新 技术干货