编辑 | KING
发布 | ATYUN订阅号
不论环境如何,建立、监控和完善机器学习系统从来都不是一件简单的事情。要想保证数据准确无误,工程师们必须把控好每一个细节,在复杂的应用程序中发现问题。为了在一定程度上减轻开发者的负担,苹果公司开发了Overton框架,该框架旨在通过抽象的文本内容来生成一个对应的模型。例如,给定查询“美国的总统有多高”,Overton生成一个能够提供答案的模型。(目前它只支持文本处理,但苹果正在开发图像和视频的处理。)
苹果的研究人员表示,Overton已经在多个应用程序实时数据查询和后台处理方面得到应用。在此期间,基于Overton的应用程序已经用多种语言回答了数十亿个问题,处理了数万亿组数据。Overton的相关负责人表示:“Overton能够通过操作数据文件来构建、维护和监控他们的应用程序,包括深度学习框架。我们的愿景是工程师们不需要编写任何代码就可以构建基于深度学习的应用程序。
Overton将支持两种模式作为输入:数据有效载荷(描述用于训练新的或现有的人工智能模型的输入数据)和模型任务(描述模型需要完成的任务)。此外,模式定义了目标机器学习模型的输入、输出以及数据流。
Overton将这个模式编译成许多版本的人工智能开发框架,比如google的tensorflow、apple的coreml或facebook的pytorch,然后搜索适当的架构和超参数(直接影响模型训练效果的可调变量),就可以在其他框架下使用Overton。Overton还采用了模型切片技术,使用户可以识别对产品至关重要的输入数据子集,并将其作为误差最小化的参考依据。此外,它本身支持多任务学习,这样Overton可以同时预测模型的所有任务。
Overton的开发者说道:“总之,Overton代表了一个机器学习生命周期管理系统,它专注于监控和提高应用程序质量”。
其实不仅仅是苹果,其他公司也在做类似的努力。databricks上个月刚刚发布了一个用于模型构建和部署的工具包,它可以自动执行超参数调整、批处理预测和模型搜索等操作。ibm的watson studio autoai承诺实现企业人工智能模型开发的自动化,微软最近增强的azure机器学习云服务和谷歌的automl套件都是为了机器学习而研发。但是Overton在许多方面,都要领先它们。
END