深度学习,一直与人工标注“紧密关联”。
一直以来,大部分人工智能公司为了训练算法,必须分析样本数据,所有这些都需要由人工进行分类和标记。
对于机器学习和深度学习等算法来说,数据量越大、质量越好,算法模型就表现越好。但标注工作本身是一个劳动密集型工种。
在中国,也有大量的“数据标注者”每天对着电脑,标记供自动驾驶汽车学习的图像,以便训练他们识别自行车和行人。
国内某互联网平台曾在去年发布了一项金额高达数千万元的人工标注众包项目,这些大大小小的标注项目,也催生了众多标注公司。
效率低、交付质量参差不齐的人工标注方式亟待改善。一方面,人工标注方式增加了企业的研发成本,另一方面,存在不可避免的标注错误,同时造成最终的算法模型过渡依赖标注库。
比如,目前正在开发的自动驾驶汽车都是经过了大量的“数据训练”,以及模拟仿真来通过运行数千甚至数万种场景来识别和响应道路条件的变化。
而作为软件工程师来说,剩余的1%(现有的算法模型已经可以处理99%的场景)仍然必须解决“边缘案例”的问题,这是在路上可能遇到的极其罕见的事件,但足够造成重大事故风险。
尽管这些事件很少见,但仍必须解决它们,以提高自动驾驶汽车的安全性。而现有的深度学习算法还没有针对它在现实世界中可能遇到的每一种道路情况进行训练。
这样的局面,是否会得到改变?
谷歌AI团队去年曾推出了一款新型图像标注方式——“流体标注”,即采用机器学习来注释分类标签并勾勒出图片中的每个对象和背景区域。
谷歌官方表示其可将标记数据集的速度提高三倍。但该模型尚不完美,谷歌称,物体边界标记问题、界面操作速度以及类别扩展等仍需进一步研究或完善。
不过,这样的需求的确已经成为行业亟需解决的难题,尤其是随着自动驾驶车辆测试带来的庞大道路数据,显然纯人工标注并非最理想的解决方案,而且也无法做到穷尽所有边缘情况。
近日,以色列Cortica公司表示,已与汽车行业的一些企业合作,成立了一家服务自动驾驶的人工智能企业。新公司名为Cartica AI,总部位于特拉维夫,其合作伙伴包括丰田、宝马、大陆集团等汽车行业巨头。
几家公司没有透露它们在Cartica AI上的投资金额,但它们将帮助共同开发和分销。Cartica AI瞄准的就是不使用人工标记的数据进行深度学习。
该公司表示,它的人工智能引擎会在数百万个未标注的视频中进行筛选,在没有人工干预的情况下,找到共同的元素,来决定车辆如何针对不同路况做出最佳反应。
目前,大多数AI公司通过手工输入数百万张图像,让机器学习识别和区分物体。这个过程是劳动密集型的,也需要很高的计算能力。
Cartica AI公司的技术基于大脑中的神经元学习机制,被称之为非监督学习,一种实时的、来自真实世界数据的学习方式,目前已经拿到了近200多项专利。
而对于自动驾驶来说,这种非监督学习的直接好处就是应对边缘情况和具有挑战性的场景。Cortica公司表示,该技术所需的计算能力也只有传统监督学习方式的十分之一。
投资方之一的宝马公司相关负责人表示,Cartica AI为自动驾驶领域引入了一系列重要的技术创新,包括低计算要求和低功耗。
这家公司早期通过在一只老鼠的大脑皮层测试,把电极连接到皮质上,并发送音频和图像的电信号。他们发出的每一个信号都有一个特定的神经反应,也就是所谓的“数字签名”。
“每个物体都有自己的特征,”该公司相关负责人表示,通过将这些签名转换成数学算法,并将它们存储在数据库中。随后,计算机可以参考这些存储的签名,识别出物体或噪声。
如果他们接触到新的特征,他们会自动学习,并将新的输入与存储在记忆中的数据进行比较,并找到相似的签名。这也意味着他们能够通过找到相似的特征进行无监督学习。
上述负责人表示,“我们的系统非常擅长识别物体,并建议下一步应该做什么。”相配套的预测算法也模仿了人类等哺乳动物,根据它们之前的经验学习预测接下来会发生什么。
该算法知道特定情况下的典型反应是什么,这使它能够在极短时间内创建一系列事件的反应场景,并试图避免“负面”的情况。
而现有的深度学习是一种缺乏透明度的“黑匣子”,这种透明度对于分析涉及自动驾驶汽车的事故原因至关重要。
“更关键的是系统的更新可以在几分钟内完成,而不需要重新运行大量的训练数据,比如基于传统神经网络的方法。”上述负责人表示。
目前,Cartica已经在特拉维夫招聘了45名员工,团队将于11月迁至特拉维夫的新办公室,并进一步扩大至约100名规模。新公司还将在德国慕尼黑开设办事处,方便与汽车行业客户对接。
也有业内人士表示,近年来层出不穷的AI公司,已经充斥了大量的泡沫。
比如,一家名为Engineer.ai的印度创业公司就是这么干的。借着AI名头,该公司还拿到了以日本软银等机构近3000万美元的投资。
这家公司实际上并没有使用人工智能来构建应用,而是作为幌子,都是“印度码农”在做技术工作,用造假来“骗取”融资。
该公司声称,可以借助AI技术帮助客户从零开始开发一款移动应用程序80%以上的工作,并且能在1小时内完成。
这就好似去年炒的沸沸扬扬的科大讯飞AI同传造假事件,虽然最后被证实为“一次闹剧”,但的确让行业更为理性看待AI技术。
不过,Cartica的母公司进展顺利,也使得这项技术本身充满了想象力。
Cortica成立于2007年,在特拉维夫和纽约雇佣了约120名员工。今年1月,该公司第一次公开亮相就是宣布了重磅消息,将开始与瑞萨电子合作,将基于人工智能的自动驾驶技术植入后者开发的前置摄像头SoC芯片V3H中。
瑞萨还声明,植入芯片的Cortica技术“只需要Mobileye芯片所需处理能力的十分之一”,可满足L2、L3需求。
最新的消息,该技术已经经过数百万英里的测试,这款芯片将于今年三季度量产,博世是其首批客户之一,将在明年搭载新车型上市。(点击了解更多详情>>)
领取专属 10元无门槛券
私享最新 技术干货