人工智能将加强数据安全
虽然机器学习和深度学习模型具有前所未有的预测精度,但有些目前仍容易受到质疑。例如,在受监督的机器学习中,模型学习标记数据的某些特征,训练和测试数据被假定来自相同的数据分布。
如果数据在这个假设中失真,那么模型的预测精度就会受到很大的影响。以垃圾邮件过滤为例——如果将随机文本和图像添加到消息中,消息可能会绕过垃圾邮件检测系统。这就是为什么你的收件箱里塞满了垃圾邮件,尽管有一个系统可以阻止它。
人工智能深度学习发展的三个阶段如下。
第一,模型初步。
2006年前后,深度学习模型初见端倪,这个阶段主要的挑战是如何有效训练更大更深层次的神经网络。2006年,Geoffery Hinton提出了深度信念网络,一种深层网络模型。使用一种贪心无监督训练方法来解决问题并取得良好结果。
该训练方法降低了学习隐藏层参数的难度且训练时间和网络的大小和深度近乎线性关系。这被认为是深度学习的开端,Hinton也被称为“深度学习之父”。
第二,大规模尝试。
2011年年底,大公司逐步开始进行大规模深度学习的设计和部署。“Google大脑”项目启动,由时任斯坦福大学教授的吴恩达和Google首席架构师Jeff Dean主导,专注于发展最先进的神经网络。
初期重点是使用大数据集以及海量计算,尽可能拓展计算机的感知和语言理解能力。该项目最终采用了16 000个GPU搭建并行计算平台,以YouTube视频中的猫脸作为数据对网络进行训练和识别,引起业界轰动,此后在语音识别和图像识别等领域均有所斩获。
第三,遍地开花。
2012年,Hinton带领的研究团队赢得ILSVRC-2012 ImageNet,计算机视觉的识别率一跃升至80%,标志了人工特征工程正逐步被深度模型所取代。
此外,强化学习技术的发展也取得了卓越的进展。2016年Google子公司DeepMind研发的基于深度强化学习网络的AlphaGo,在与人类顶尖棋手李世石进行的“世纪对决”中最终赢得比赛,被认为是深度学习具有里程碑意义的事件。
为了抵御这些技术,McAfee公司的工程师们一直在研究对抗机器学习,并组建一个先进的防御研究团队来为这些漏洞创建解决方案。要真正抵御这种攻击,唯一的办法是建立一种更为普遍的学习模式,甚至能找出最微小的异常。在这方面,一些有趣的研究正在进行中。
安全部门巨头McAfee公司认为,将数字安全考虑在内,2018年勒索软件和其他数字威胁(比如对全球社会造成恐慌的“WannaCry”)越来越多地利用机器学习和深度学习技术。具体来说,这些模型将威胁到检测模型,从检测模型的防御反应中学习,并利用发现的漏洞来破坏检测模型,其速度比防御者修补漏洞的速度更快。
领取专属 10元无门槛券
私享最新 技术干货