人工智能应该是这几年发展最快、最显眼最受瞩目的领域了。特别是机器学习,这种已经比较成熟的子领域,基本算是深入渗透到了从专业科研到大众生活的各个领域。即便如此,AI领域的从业者,往往还是都具备有很高的专业知识。AI的应用开发和使用门槛一直都不低,更别说研发了。AI在加速其他领域和社会的自动化,而反过来看AI本身,其实同样也在自动化中变革。机器学习的自动化,就是如此。
而这次带来成果的,是清华大学朱文武教授带领的团队。他们发布了全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning)。该工具支持在图数据上全自动进行机器学习,并且支持图机器学习中最常见的两个任务:节点分类任务(node classification)与图分类任务(graph classification)。
作为首个开源的自动图学习工具包,AutoGL主要面对的或者解决的是什么问题呢?当然从名字中我们可以看出来,自动学习可以实现机器学习过程的自动化,也就是在提升机器学习的效果的情况下,还能降低机器学习使用门槛。当然机智客看资料显示,其实更重要的是AutoGL重点考虑了图数据的特殊性,设计了优秀的图自动机器学习模型。AutoGL面对的,图机器学习模型。
图机器学习存在于很多不同领域的研究问题中。它贯穿医药学领域民生领域生物学领域物理学领域新闻领域金融领域等等大小领域,成为现代人工智能的一个重要方向。因为图结构丰富且具有与生俱来的导向能力,优点多多的同时,又异常复杂,不仅难以进行大规模扩展应用,而且不同的图数据在结构、内容和任务上千差万别,所需要的图机器学习模型也可能相差甚远,这就导致不同任务的模型自动化面临巨大挑战。
而清华大学这款AutoGL工具包正是解决这样的问题的。AutoGL工具包首先使用 AutoGL Dataset维护图机器学习任务所需数据集。继而导入大规模图表示学习工具包CogDL和图神经网络库PyTorch Geometric(PyG)中的数据集模块,并添加对OGB数据集的支持,同时还添加了一些支持以便集成auto solver框架。
目前,AutoGL支持多种算法,可以极大方便开发人员进行对应的图学习算法设计和调优。而且,针对不同的图机器学习任务,AutoGL通过不同的AutoGL Solver解决。AutoGL Solver 使用四个主要模块自动化解决给定任务,分别是特征工程(Feature Engineering)、图学习模型(Graph Learning Model)、超参数优化(HPO),以及模型自动集成(Auto Ensemble)。每个部分在设计时都引入了对图数据特殊性的考虑。文不能尽意,现在,这个AutoGL的开源项目已经在GitHub社区里公开,另外清华大学团队也已经将这款AI工具包发布到了清华大学的官网上。有兴趣的朋友可以去浏览学习。
领取专属 10元无门槛券
私享最新 技术干货