首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

万物互联:计算机视觉的盲点

来源:悦智网;作者:Stacey Higginbotham

━━━━

如今,计算机视觉可以像人一样准确地追踪车辆、人脸以及生产过程。当有大量的数据需要筛选时,计算机视觉模型是比人工更好的选择。

然而,其仍然存在局限性。在识别人物和动作方面,计算机的效率落后于人工。计算机无法在多个摄像机之间追踪同一个人或物,无法自行定义看到的东西,也很容易被欺骗。想要摄像头在制造业和智慧城市中发挥更大的作用,工程师们必须打破这些局限。

通常情况下,摄像机能够以大约30帧/秒的速度进行推理,利用算法将传入的图像与预先定义的模型进行匹配。它们的处理速度取决于计算机视觉算法的复杂程度。从根本上说,所有的推理都是各种变量之间的权衡,这些变量包括成本、运行速度、内存以及精确度。一个能够快速做出推理的摄像头也许会牺牲一部分精确度,或者需要更大的内存,而这会导致成本上升。

在犯罪行为发生后,30帧/秒的速度足以让计算机在音乐会的观众中识别出罪犯的脸。但是,在更为复杂的计算机视觉任务中,比如找出生产过程中的错误,计算机需要更快的处理速度,否则生产线将面临降速的风险,Xnor.ai公司的运营总监苏菲•莱布雷希特(Sophie Lebrecht)如是说。作为一家主攻计算机视觉软件的公司,Xnor.ai的目标是实现60帧/秒的图像追踪速度。

提升计算机处理图像的帧速率只是第一步,公司接下来的任务是开发一款能够在同一网络不同摄像头之间进行目标追踪的软件。比如,一旦目标人物被一个监控摄像头发现,当他从其他摄像头前经过时,整个网络都将实时自动对他进行追踪。

这需要能够快速处理图像的复杂模型,以及能够在整个摄像头网络中运行并识别图像的软件。我们的目标是,在一个单一的网络中实现这种模式而无需向云端上传数据。这就要求算法能够将不同的人区分开来,并在物理空间中对目标人物进行追踪。此外,软件需要覆盖所有的摄像头。这或许会需要一种新的通信协议。

摄像头还需具备防范“对手攻击”的能力,这涉及一个全新的研究领域。正如人类会被视错觉欺骗一样,各种伎俩也能扭曲正常的图像,从而误导计算机视觉。这样造成的后果是,程序会作出错误的判断,识别到并不存在的事物。

也许,最困难的任务是开发一款能够使计算机对所见事物进行定义的软件。对于摄像头来说,识别出人在爬行是一回事,判断出在地上爬行的人究竟是需要帮助还是在躲避摄像头的侦查就是另一回事了。

因此,摄像头及其软件都需要具备做出下一步行动判断的能力。要实现这一功能,我们还有很长一段路要走,但在利用计算机算法实现定义这一方面,Alphabet的研究人员为此付出的努力让人赞叹。也许有一天,计算机的视觉能力会超过人类,并且能够对视觉进行管理,更好地为人类服务。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190215B15S7M00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券