2015年11月11日,微软宣布其Oxford项目将开放一个可用于情绪识别的API。微软一位负责技术与研究的人员表示该API可帮助市场营销人员评估顾客对商店展示效果、电影或食物的反应。商家可以用这个软件来创造一个客户工具,例如一个可以从照片中识别情绪并根据不同情绪给出不同选项的应用。根据微软介绍,该API应用该公司的云端情感识别算法来确定特定时刻某张照片中人的情绪。
微软表示,该API以一张图片作为输入,从其中每张人脸的多个表情中找到表情,并利用人脸识别应用程序画出人脸的边界框。这些情绪与面部表情相关,而表情是超越文化和国界的,且可以被情感应用程序识别。在解释情感应用程序接口得到的结果时,应该以得分最高的表情作为结果,其中的分数被归一化。为满足需求,开发人员可以设置更高的置信度阈值。目前该API的测试版已公开。
将这个工具应用到移动端或云端程序,可以用来识别某些俚语,如'gonna',以及一些品牌名称、通用名称错误和某些难以定位的错误,如'four' 和 'for'。其中还增加了一些新造和流行的品牌名称与名词。用于支持How-Old.net网站的技术也得到了升级。Oxford项目中现有的人脸识别工具也将被升级为包含面部毛发和微笑预测工具。经过改进,该工具已经具有视觉年龄估计和性别鉴定功能。
Oxford项目计划在2015年末公布三项应用的测试版本,分别是视频识别、说话人识别和其他定制智能识别服务。Oxford视频识别项目部分基于微软的摄影应用Hyperlapse的工作,可以用于分析视频并自动编辑视频。说话人识别根据人的独特声音特征来完成识别过程。定制的智能识别服务(CRIS)可以提供在吵闹环境和其他有挑战性的环境中的语音识别功能。