最近,AI成为数码发展新亮点,智能识图的功能也成为很多手机的“卖点”。诚然,智能识图在识别很多商品、特征明显的物品时,给我们带来很大便利。但相比于我们的预期,要想实现万能识图,还远远不够。
加州大学伯克利分校计算机科学博士生、论文作者Dan Hendrycks提供了一组连最强大的视觉AI也无法准确识别的图片。这些照片都经过精心挑选,专门用来“欺骗”图像识别技术,来自一套专门的数据集,其中的7000张照片由加州大学伯克利分校、华盛顿大学以及芝加哥大学的研究人员们共同整理完成。
这说明目前的(机器学习)模型还不够完善。虽然已经有不少研究尝试利用人工数据提升模型的能力,但我们发现,这些模型在面对某些真实数据(来自真实照片)时往往会出现严重且高度一致的错误判断。
过去几年以来,图像识别工具已经变得越来越好,识别速度也越来越快。这在很大程度上要归功于斯坦福大学创建的,并且其规模仍在持续拓展的开放数据集ImageNet。这个庞大的数据库成为人工智能重要的训练素材集合,也可以作为新AI系统的参考基准,用于训练系统进行图像识别。
然而,解决这最后5%的准确度缺口是个巨大的挑战。正因为如此,研究人员们才尝试探索其中的原因——即计算机为什么无法解析某些特定图像。通过这套新的图像集合,研究人员们以手工方式搜索Flickr,寻找可能会令AI软件陷入混乱的照片,将其添加到这套名为ImageNet-A的新数据集内。这个数据集中,世界上最先进的视觉AI模型确实无法正确识别其中98%的照片。
构建ImageNet-A数据集,正是为了“欺骗”AI。利用ImageNet-A,研究人员们成功从视觉AI当中找到7000个盲点。但简单将更多照片添加到机器学习数据集当中,无法解决AI模型在逻辑层面的核心缺陷。如何解决这最后5%的准确性空白?则需要在现代机器学习范围之外开发出新的方法,从而创建起更加复杂的AI系统。而这将会是一个艰辛而漫长的过程。
领取专属 10元无门槛券
私享最新 技术干货