【新智元导读】Facebook的图像机器学习处理Lumos日前进行了系统更新,在原来对照片和视频进行分类的基础上,运行速度更快,自动识别图像边界,能解释图中人物行为,并且利用以往的知识。Lumos 依靠Facebook的图像文本转换系统和 FBLearner Flow,Facebook表示其目标是使其达到像素般精确。
Facebook去年在Web Summit会议上公布了Lumos平台。它是一个可扩展的系统,用于对照片和视频进行分类。它可以扫描照片,快速训练A.I.识别新照片,查看照片中的对象并描述对象,从而向视觉障碍用户描述照片的信息,或者方便用户语言搜索照片。
Lumos的背后是Facebook的图像文本转换(Automatic Alt Text for Photos)系统和 FBLearner Flow机器学习系统。这些系统在图像分类方面取得了12处改进,而 Lumos是它们在图像分类方面的前端。在数据标注方面,Facebook 使用人类雇员为13万张包含人的Facebook照片撰写描述。
Facebook Lumos 新进展
更容易使用:没有经过深度学习和计算机视觉训练的人也能用它进行工作。
能够解释行为:本周四,该系统取得重大升级,它不仅可以描述照片中的对象,而且可以解释其中的人正在做什么。Lumos 现在可以使用12个新的动作短语来描述图片,例如“人们在走路”,“人们在玩乐器”或“人们在跳舞”。
识别边界:经过更新后,Lumos可以更好地识别图像中的跳跃和边界。
速度提升:与去年相比,Facebook每个月都能多执行六倍的相关A.I.实验。通过FBLearner Flow系统的训练,Facebook已经让训练A.I.的过程比以往更简单,工程师能够轻松地进行代码更改,而不必做大量繁琐工作。
能够利用以往知识:训练者可以使用先前教导过的图片描述来加速学习过程,例如,如果A.I已经知道马是什么样,它就可以过滤掉所有的非马照片,这样训练A.I.识别骑马的人就会更容易。
Facebook 为什么要推进 Lumos
Facebook的应用机器学习总监Joaquin Quiñonero Candela说:“当你思考你最喜欢的记忆时,很难记起是什么时候发生了什么事情。 ……我们希望建立一个搜索系统,利用图像理解来对大量的图像信息进行分类,并快速、轻松地取得那些最相关的照片。” Candela还说,作为社交媒体巨头,Facebook的目标是“将AI编织到Facebook的工程结构之中”。
在Facebook的第四季度财报电话会议上,CEO Mark Zuckerberg则说:”我认为 AI 将为用户带来极好的社区体验。我们正在努力尝试几种类型的系统,一个是关于视觉内容,另一个是关于语言。对于视觉内容,我们希望AI能够查看照片并了解其内容,以及该内容是否是用户会感兴趣的内容。同样,AI可以查看视频并理解这是否是用户会感兴趣的东西。你可以想象,今天我们会把你所关注的朋友、页面或者朋友喜欢的东西放在你的消息推送中。然而,我们没有理由不去把用户可能感兴趣的成千上万的内容与用户匹配起来,我们还没有这么做仅仅是因为还没有AI技术能实现这一点。因此,要是能够理解人们发出的消息、阅读人们想要看的文章,看懂视频和照片,这样的技术组合将是伟大的。“
Lumos 和 FBLearner的工作量和近期目标
数十个团队已在Lumos上进行了训练和部署了超过200个视觉模型。这些部署用于令人反感内容的检测,垃圾邮件识别和自动图片字幕等等。
Facebook每月在FBLearner Flow上运行120万次AI实验。
Lumos通过新标记数据和来自应用程序的注释信息进行改进。
Facebook表示,当前目标是提高该机器学习系统的精度(precision)和召回率(recall),使其达到像素般的精确。
编译来源: