并非所有的深度学习系统都适合。也就是说,由分层节点组成的系统,它们可以摄取数据,对其进行转换,输出并传递它们,这都是相同的。没有算法适用于每个任务,找到最佳任务可能是一个漫长而令人沮丧的练习。幸运的是,有希望了!IBM开发了一个自动化流程的系统。
IBM爱尔兰研究院的数据科学家Martin Wistuba在最近的博客文章和随附的论文中描述了该方法。他声称它比其他方法快50,000倍,错误率很小。
“在IBM,工程师和科学家从大量候选人中选择最佳的深度学习模型架构。今天这是一个耗时的手动过程; 然而,使用更强大的自动化AI解决方案来选择神经网络可以节省时间并使非专家能够更快地应用深度学习,“他写道。“我的进化算法旨在将正确的深度学习架构的搜索时间缩短到几个小时,从而使深度学习网络架构的优化成为每个人都能负担得起的。”
上图:显示单个神经网络经历的突变的图表。
图片来源:IBM
这里是Wistuba的“神经进化”系统的关键:卷积神经网络架构被视为“神经细胞”的序列,它们会变异,即获得或失去层直到一个结构能够改善其在给定数据集和任务中的性能被识别出来。他写道,这些突变不会影响网络的预测,而且大大加快了培训时间。
为了测试该方法的功效,他用它来为CIFAR-10和CIFAR-100数据集选择图像分类算法(标记图像由多伦多大学公开提供)。那么结果如何呢?
“在训练的前10个小时内,准确度迅速提高,然后进展缓慢但稳定,”他写道。“与最先进的人工设计架构,基于强化学习的架构搜索方法的结果以及基于进化算法的其他自动化方法的结果相比,我的算法具有稍高机率的分类错误,但需要的时间要少得多。”
Martin希望将来将该系统集成到IBM的云服务中,并将其扩展到更大的数据集和其他领域,如自然语言处理。
自动算法选择并不新鲜,这是谷歌用于改善智能手机面部识别和物体检测的方法之一- 但如果Wistuba的系统与广告一样有效,它可能代表着该领域的重大进步。
领取专属 10元无门槛券
私享最新 技术干货