Loading [MathJax]/jax/output/CommonHTML/jax.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ICDM’21 | ACE-HGNN:自适应曲率探索的双曲图神经网络

ICDM’21 | ACE-HGNN:自适应曲率探索的双曲图神经网络

作者头像
Houye
发布于 2021-12-28 00:35:36
发布于 2021-12-28 00:35:36
1.7K0
举报
文章被收录于专栏:图与推荐图与推荐

本文主要介绍我们在ICDM‘2021发表的工作,ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network。

Paper: https://arxiv.org/pdf/2110.07888.pdf Code: https://github.com/RingBDStack/ACE-HGNN

摘要

图神经网络(GNNs)在各种图数据挖掘任务中得到了广泛的研究,但是大多数现有的工作都是基于欧式空间嵌入,难以自然的捕捉图数据的非欧式结构。因此,近年来一些基于非欧几何空间的工作在机器学习领域快速增长,其中双曲几何空间的图神经网络(Hyperbolic Graph Neural Networks,HGNNs)将GNNs扩展到双曲空间,从而在节点表示学习中更有效地捕捉图的树状/层次结构。然而现实中复杂多样拓扑结构的图数据,HGNNs对于具有异质拓扑结构的图数据往往性能不佳。为了能够为HGNNs自适应的探索到合适的双曲嵌入空间,我们首次引入了强化学习的学习框架到HGNNs中,提出了ACE-HGNN自适应曲率探索的双曲图神经网络,根据输入图和下游任务自适应学习最优曲率。我们将曲率的探索和图的表征学习视作一个同时进行的多目标优化问题,使用多智能体强化学习(MARL)分别设计用于学习曲率和节点表示的ACE-Agent和HGNN-Agent,并通过Nash-Q学习算法协同学习,通过使智能体达到纳什均衡来求解问题。在多个真实图数据集上进行的大量实验表明,在模型质量方面具有显著且一致的性能改进和良好的泛化能力。

研究背景

图常被用来建模复杂关系,通过图表示学习可以有效的学习到数据的顺序、拓扑、几何等关系特征。众所周知,图是非欧几里得结构的,因此非欧几里得几何嵌入受到了机器学习领域的关注,被引入来提高对图的拓扑结果的学习能力。并且,复杂网络领域的研究表明,现实的网络数据中大量存在着无标度性质(scale-free),意味着现实中普遍存在着树状(tree-like)/层次结构。其中,双曲几何在传统网络科学领域被视作树状/层次结构的底层连续表达,最近涌现出大量优秀的工作。在双曲几何中,双曲空间的曲率是几何空间弯曲的度量,不同的曲率可以控制双曲几何流形来近似图的不同程度树状/层次结构(如下图)。

Tree-like 结构

然而,现有的HGNNs方法对于现实中结构复杂图数据和多样的下游任务往往性能不佳,主要由以下两点缺陷导致:

适应性问题:数据方面,现实的图数据通常是具有异质拓扑结构(即,同时存在树、环或网格结构);任务方面,不同的下游任务对特征信息和拓扑信息的要求不同,而层次结构这样的特殊拓扑结构对任务的重要性是未知的。 最优曲率问题:现有的工作对于曲率选择主要有两种方式。将曲率作为超参数,启发式的使用经验或利用采样估计算法估计;将曲率直接作为神经网络参数在训练过程中学习。前一种方法仅依靠对原始图的拓扑来估计曲率,不能适应不同下游任务;后一种方法严重依赖节点表征的梯度下降方向,模型只会对曲率进行微调来保证节点表征的快速收敛,难以探索到最优的曲率。

因此一个自然而然的问题是,"我们能否基于不同图的树状/层次结构和下游任务驱动,自适应的找到最优曲率的双曲几何空间并利用双曲图神经网络学习到更好的节点表征?” 为了解决上述问题,我们提出了一个新的自适应曲率探索双曲图神经网络名为ACE-HGNN。主要贡献如下:

  • 对双曲空间中不同层次结构的HGNN的适应性问题进行观察和分析,将嵌入空间适应性问题转化为双曲空间的最佳曲率探索问题。
  • 我们首次在双曲几何机器学习中引入强化学习,提出了一种新的端到端架构,即自适应曲率探索双曲图神经网络(ACE-HGNN),以指导选择最优的双曲几何空间。
  • 对五个典型真实数据集的广泛实验表明,模型适应性和竞争性能显著且得到改进。我们可视化了ACE-HGNN的结果,直观地展示了我们方法捕获图结构的能力。

双曲几何中的曲率与图的层次结构

双曲几何嵌入在复杂网络领域中已经被广泛研究和应用,一个双曲几何空间(流形)能够直接理解为一颗连续近似的树,其中曲率度量了这个弯曲流形(双曲空间)的弯曲程度。现有的工作表明,具有不同结构(例如,环或树结构)的图在嵌入到欧式或双曲几何空间时具有不同的信息失真。下图(Figure 1)说明了双曲曲率和图层次结构之间的内在联系。它表明,不同的曲率显著影响双曲曲空间中的距离指标。曲率降低时,双曲的嵌入距离会更反映树的结构,因为它接近两个节点的最短路径长度(即双曲曲线图距离)。当曲率接近于零时,双曲的嵌入距离接近欧几里德嵌入距离,导致层次结构的信息丢失。

为了保证曲率这一度量能达成我们的目的,首先我们需要进行定性分析。以往的工作通常使用嵌入空间中测地距离(geodesic)和拓扑距离(shortest path)的积性失真来度量信息损失,侧重考虑拓扑信息保持能力的度量。而在图表示学习场景下,节点的特征信息与结构信息都十分重要。如下图(Figure 2 (a),(b))所示,我们利用嵌入距离d和图距离g来度量图嵌入到双曲空间中的失真程度。嵌入距离d可以认为是两个节点之间的语义距离或特征相似度;图距离g图中两个节点之间最短路径的长度。对于双曲曲率 ,当 时,三角形的内角和小于 ,并且随着曲率参数 的减小而减小。另外,对于树状图,两个节点之间的最短路径导航趋向于靠近中心,随着曲率参数 的减小,这一性质得到增强。根据双曲空间树状图的上述性质,我们可以观察到当 时的

为了更直观地解释,上图(Figure 2 (c))给出了不同曲率的双曲面流形中的一个简单结构,该结构可以很容易地推广到任何环/网格结构,在现实中可能用于描述简单家庭关系的三角形,或者交通网络的环路。通过测量嵌入距离和图距离,我们可以直观地看到不同曲率下的嵌入失真。在此基础上,进一步分析了曲率是影响模型表达能力的主要因素。最后,将双曲图表示学习的适应性问题转化为曲率探索和模型优化的多目标优化问题。

多目标优化问题定义

我们的目标是最小化嵌入失真,同时学习HGNN的最优图节点表示。因此,我们将最优曲率选择与HGNN优化的结合作为一个多目标优化问题。给定一个label为 的图 ,问题可以定义为:

然而,在多目标优化中,通常没有唯一的全局最优解。在大多数情况下,搜索整个帕累托最优是不可行的,幸运的是,当前的深度强化学习范式为我们提供了启示。我们尝试引入多智能体作为交互式决策者,有效地解决特定下游任务的多目标优化问题。

自适应曲率探索双曲神经网络

下图(Figure 3)显示了我们与两个智能体的协作强化学习框架,以解决多目标优化问题,其中自适应曲率探索智能体(ACE-Agent)探索曲率以获得更好的双曲面表示空间,而双曲图神经网络智能体 (HGNN-Agent)学习了特定曲率的双曲曲空间中的节点表示。

ACE-Agent:自适应曲率探索智能体

由于hyperbolic logarithmic mapping 和Riemannian optimization的特性,在保证节点表征的梯度下降方向的前提下,曲率更新的范围非常小(我们在实验中证实了这一现象),在HGNN模型中使用反向传播来学习曲率很容易使曲率陷入局部最优。因此我们的目的是独立设计一个智能体来负责自适应的曲率探索。ACE-Agent的形式化定义如下:

  • 状态

我们直接使用曲率表示双曲的嵌入空间,并把强化学习终止时的状态作为探索的最佳曲率。由此,对于 层的HGNN模型,我们将第 个epoch的状态定义为

  • 动作

为了最大限度地减少嵌入失真,并探索最佳曲率,我们使用经典的Parallelogram Law偏差方法来估计图曲率 。对于每个节点,我们执行上述采样 次,并将平均值作为新的估计曲率。然后,我们将HGNN-Agent在 个epoch中的嵌入 结合新的曲率 输入到双曲流形,给定估计曲率的权重参数 和原点切线空间 ,动作 的形式化定义如下:

  • 奖励

我们根据与上次状态相比的具体任务的效益直接定义智能体的奖励,对于双曲表征向量 和下游任务的评价反馈 ,奖励 的定义如下:

HGNN-Agent:双曲神经网络智能体

双曲图神经网络智能体旨在双曲空间中学习节点表示融合图结构和特征的信息。这里我们可以嵌入任意的双曲图神经网络模型,本文使用了HGCN(NeurIPS 2019,Stanford)。HGNN在原点 的切线空间 中模型的每一层转换并聚合前一层的邻居隐藏特征,然后将结果映射到具有不同曲率的双曲空间中:

其中 , 分别是曲率为 的Möbius向量加法和乘法操作, 是双曲非线性激活函数, 是双曲邻居聚合函数。HGNN-Agent的形式化定义如下:

  • 状态

HGNN-Agent目标是学习具有给定曲率的双曲空间中的最佳节点表示。给定第t-1个epoch的曲率 和HGNN模型的层数 ,其状态定义为:

  • 动作:

HGNN-Agent的动作定义为是否通过获取新的曲率来更新已学到的嵌入。定义为:

  • 奖励

与 ACE-Agent相同,HGNN-Agent的奖励也基于与上次状态相比特定任务的性能改进来定义:

多智能体强化学习MARL和纳什均衡

我们利用博弈论来为多个智能体求解。具体来说,我们需要对HGNN-Agent和 ACE-Agent的协作学习来进行正和博弈,目标是将两个智能体的学习融合到纳什均衡(即所有智能体不能独立更新学习结果以提高下游任务的协作性能)。我们利用Nash Q-learning来更新两个智能体,并在采取行动时采用具有探索概率的贪婪策略。ACE-Agent和 HGNN-Agent共享一个全局状态S,Nash Q-learning优化符合Bellman优化方程如下:

其中 -function, 是学习率, 是学习因子。如果HGNN-Agent和ACE-Agent已达到纳什平衡,则强化学习算法将停止,曲率参数 将在下一个培训过程中保持固定。

其中, 分别是两个智能体的最佳策略,上式可以找到最优曲率。

整体算法如下:

实验验证

我们在包括引文网络(Cora 、Citeseer 和 Pubmed)、超文本网络 (WebKB)和蛋白质网络(PPI)进行全面的验证,对比的baseline方法包括欧式空间和双曲空间的神经网络(MLP,HNN)、欧式空间的GNNs(GCN,GAT,GraphSAGE)和双曲空间的HGNNs(HGCN,κGCN)。总的来说,我们可以得到以下结论:(1)我们的 ACE-HGNN 具有很好的性能,并在所有数据集中达到最佳平均性能;(2)一般来说,之前的双曲模型(HNN、HGCN 和 kGCN) 在具有较高双曲性的数据集上表现更好,但在具有较低双曲性的数据集上表现差。观测表明,有必要对层次拓扑和特征信息进行自适应融合。与其将曲率作为超参数(如κGCN)或学习参数(如HGCN),ACE-HGNN中的自适应曲率探索机制收益更好。

我们进一步分析嵌入失真、曲率探索和注意力权重,以研究ACE-HGNN的表征能力。

嵌入失真: 如图所示ACE-HGNN在这些模型中的平均嵌入失真率最低,这表明我们ACE-HGNN 的自适应曲率探索可以有效地保留不同图的层次结构。

曲率探索: 在学习过程中,κGCN的曲率是预先估计的并保持固定的。与HGCN相比(几乎是轻微震荡的直线),我们的ACE-HGNN可以在学习过程中探索更大的曲率范围。此外,ACE-HGNN 学到的曲率最终接近估计的最佳曲率,并自动微调以实现更好的性能。我们还观察到,两层双曲图卷积层(ACE-HGNN 1和ACE-HGNN 2)的曲率存在着竞争与合作的关系:(1)在几个连续的epoch中,两个HGNN层的曲率经常同时选择相反的动作或同时保持不变;(2)但就整个训练过程的规模而言,两层的整体趋势是相同的。

可视化和注意力机制: 下图(Figure 7)表示了Cora数据集中节点嵌入的可视化,ACE-HGNN 在不同类别之间和类内相似性有更清晰的区分。我们能直观的观察到,曲率不适当的双曲空间会产生"欠拟合"或"过拟合",这可能会降低下游任务的性能。为了进一步说明曲率对聚合邻居信息的影响,我们可视化不同δ的数据集上 HGNN-智能体邻居聚合的注意力权重。下图(Figure 8)显示了较低δ的数据集上,中心节点更关心他们父节点(关注层级关系)。

总结

在本文中,我们提出了ACE-HGNN,一种新的自适应曲率探索双曲图神经网络。我们是首个将强化学习引入到双曲图表示学习中的工作,并获得了ICDM'2021 Best Paper Candidate的提名。对于具有不同层次结构的图和各种下游任务,多智能体强化学习方法可以搜索具有最佳曲率的适当双曲空间,并同时学习良好的节点表示。此外,自适应曲率探索还可以直观地对模型学习进行合理的解释,反映了模型对图特征或结构信息学习的偏好。

傅星珵

fuxc@act.buaa.edu.cn

北京航空航天大学计算机学院

大数据科学与脑机智能高精尖创新中心

研究兴趣

图数据挖掘,图表征学习,复杂网络

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 图神经网络与推荐系统 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从欧几里得到双曲空间,融入视觉 Transformer 增强层次关系建模 !
现代机器学习的基础是表示学习,使得模型能够从原始数据中提取有意义特征(Bengio等人,2014年)。尽管传统上欧几里得空间被用来模拟数据关系,但许多实际数据集(包括图像)表现出比欧几里得空间更好的层次结构,这种结构在非欧几里得空间中更易捕捉(Bronstein等人,2017年)。
未来先知
2024/11/05
8910
从欧几里得到双曲空间,融入视觉 Transformer 增强层次关系建模 !
图如何双曲建模?弗吉尼亚理工Amazon最新WWW2022「双曲神经网络:理论、架构和应用」教程
---- 新智元报道   来源:专知 【新智元导读】TheWebConf即将召开,来自弗吉亚理工和亚马逊等学者的《双曲神经网络》教程,值得关注! TheWebConf是中国计算机学会(CCF)推荐的A类国际学术会议,由国际万维网会议委员会(IW3C2)和主办地地方团队合作组织,每年召开一次,今年是第31届会议,本年度论文录用率为17.7%, 图是普遍存在的数据结构,广泛应用于许多数据存储场景,包括社交网络、推荐系统、知识图谱和电子商务。这导致了GNN架构的兴起,用于分析和编码来自图的信息,以便在下游
新智元
2022/05/09
8070
图如何双曲建模?弗吉尼亚理工Amazon最新WWW2022「双曲神经网络:理论、架构和应用」教程
当深度强化学习(DRL)遇见图神经网络(GNN)
将图神经网络(GNN)与深度强化学习(DRL)相结合。新的DRL+GNN体系结构能够在任意网络拓扑图上学习、操作和生成。
不去幼儿园
2024/12/03
5260
当深度强化学习(DRL)遇见图神经网络(GNN)
图神经网络的困境,用微分几何和代数拓扑解决
选自towardsdatascience 作者:Michael Bronstein 机器之心编译 编辑:Juniper 微分几何和代数拓扑在主流机器学习中并不常见。在本系列文章中,作者展示了如何使用这些领域的工具重新解释图神经网络并解决一些常见困境。 本文的作者是 Twitter 首席科学家、DeepMind 人工智能教授 Michael Bronstein。以下是博客原文。 对称,无论从广义还是狭义的角度讲,都是人类一直以来试图理解和创造秩序与美的一种观念。 ——Hermann Weyl Herma
机器之心
2022/03/28
8060
北邮王啸:挖掘图神经网络中的「万物真理」
北京邮电大学副教授、青源会会员王啸是国内图学习领域的佼佼者。回顾他的科研历程,从探寻网络研究的本质,到在物理学家的论文中寻找灵感,他对图神经网络研究的热情未曾衰减。未来,他还将继续从基础理论入手,深入探索图神经网络中的不变性。 王啸,北京邮电大学副教授。研究方向为图神经网络、数据挖局与机器学习。天津大学博士,美国圣路易斯华盛顿大学联合培养博士,清华大学计算机系博士后,曾入选ACM中国新星提名奖,以及AI2000学者榜单。 采访&整理丨李梦佳、熊宇轩 1 跟随马克纽曼的步伐 在物理研究中寻找灵感 当前,在蓬勃
AI科技评论
2023/04/12
9020
北邮王啸:挖掘图神经网络中的「万物真理」
图神经网络2-图表征学习
图表征学习(Graph Representation Learning,也称之为图表示学习)是专门针对图数据域的技术,旨在将图结构中的节点转化为具有连续数值的向量表示,以便在这些表示上进行进一步的机器学习任务,如分类、聚类、链接预测等。
皮大大
2023/11/23
8110
图神经网络学习1:表征学习
最近开始看一本之前出版社老师赠送的书《图神经网络-基础、前言与应用》,开始系统地了解下图神经网络。
皮大大
2023/11/09
4400
MuRP | 双曲空间下知识图谱链路预测新方法
今天给大家介绍收录在NIPS2019的文章“Multi-relational Poincaré Graph Embeddings”,该文章由爱丁堡大学信息学院和剑桥三星AI中心合作完成。这篇文章提出了一种多关系庞加莱模型(MuRp),该模型将多关系图数据嵌入到双曲空间庞加莱球中,使得模型在低维链路预测的效果上,明显优于欧几里得空间中相关模型和现有的其他模型。
DrugAI
2021/02/01
2.1K0
MuRP | 双曲空间下知识图谱链路预测新方法
【GNN】图神经网络综述
本篇文章是对论文“Wu Z , Pan S , Chen F , et al. A Comprehensive Survey on Graph Neural Networks[J]. 2019.“”的翻译与笔记
zenRRan
2020/02/18
1.8K0
上海交通大学王宇光:几何深度学习和图神经网络的研究进展和趋势
机器之心报道 机器之心编辑部 3 月 23 日,在机器之心 AI 科技年会上,上海交通大学自然科学研究院和数学科学学院副教授、上海人工智能实验室成员王宇光老师发表了主题演讲《几何深度学习和图神经网络的
机器之心
2022/04/11
1.3K0
上海交通大学王宇光:几何深度学习和图神经网络的研究进展和趋势
【论文解读】KDD20 | 图神经网络在生物医药领域的应用
最近,越来越多的研究开始将深度学习方法应用到图数据领域。图神经网络在数据具有明确关系的结构场景,如物理系统,分子结构和知识图谱中有着广泛的研究价值和应用前景,本文将介绍在KDD 2020上发表的两个在这一场景下的最新工作。
黄博的机器学习圈子
2020/11/17
1.5K0
【论文解读】KDD20 | 图神经网络在生物医药领域的应用
【综述专栏】图神经网络综述
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。
马上科普尚尚
2021/03/17
9600
【综述专栏】图神经网络综述
告别调参炼丹,谷歌“权重无关”神经网络开源了!
神经网络训练中 “权重” 有多重要不言而喻。但谷歌前段时间发表的研究表明,即使抛弃神经网络权重训练,使用随机共享权重,也可以执行各种任务。
新智元
2019/08/29
8850
告别调参炼丹,谷歌“权重无关”神经网络开源了!
AAAI2021 | 图神经网络的异质图结构学习
近年来,异质图神经网络引起了广泛关注并应用在各种下游任务上。现有异质图神经网络模型通常依赖于原始的异质图结构并暗含着原始图结构是可靠的假设。然而,这种假设往往并不现实,异质图结构普遍存在噪声和缺失的问题。因此,如何为异质图神经网络学习一个合适的图结构而不是依赖于原始图结构是一个关键问题。为解决这一问题,本文首次研究了异质图结构学习(Heterogeneous Graph Structure Learning)问题,并提出了HGSL框架来联合学习适合分类的异质图结构和图神经网络参数。HGSL 通过挖掘特征相似性、特征与结构之间的交互以及异质图中的高阶语义结构来生成适合下游任务的异质图结构并联合学习 GNN参数。三个数据集上的实验结果表明,HGSL 的性能优于基线模型。
Houye
2021/01/27
3.9K0
AAAI2021 | 图神经网络的异质图结构学习
拿了顶会Best Paper的异质图神经网络是啥样?
4月23日,万维网顶会WWW-2021 ( The Web Conference 2021: International World Wide Web Conference ) 公布了本届会议的最佳论文奖冠亚军(Winner和Runner-Up),来自天津大学金弟副教授团队的论文《Heterogeneous Graph Neural Network via Attribute Completion》斩获最佳论文奖(Runner-Up)。
用户3946442
2022/04/11
2.5K0
拿了顶会Best Paper的异质图神经网络是啥样?
iclr 2020 | Geom-GCN:几何图神经网络
今天给大家介绍吉林大学计算机科学与技术学院杨博老师团队在ICLR2020的一篇论文,该研究针对MPNN现存的一些问题提出了一种新的图神经网络的几何聚合方式,其核心思想是:图上的聚合可以受益于图的连续空间,实验结果表明该研究具有显著效果。
DrugAI
2021/02/01
5880
iclr 2020 | Geom-GCN:几何图神经网络
真正的神经网络,敢于不学习权重
昨天,谷歌大脑 David Ha 等人一篇名为《Weight Agnostic Neural Networks》的论文引爆了机器学习圈。其「颠覆性」的理论让人惊呼:「到头来我们对神经网络一无所知?」
机器之心
2019/06/20
8660
真正的神经网络,敢于不学习权重
17篇论文,详解图的机器学习趋势 | NeurIPS 2019
本文来自德国Fraunhofer协会IAIS研究所的研究科学家Michael Galkin,他的研究课题主要是把知识图结合到对话AI中。
AI科技评论
2019/12/18
1.7K0
WSDM2022 | 基于双曲几何无标度图建模的知识感知推荐算法
Modeling Scale-free Graphs with Hyperbolic Geometry for Knowledge-aware Recommendation
张小磊
2022/10/31
2.6K0
2022图机器学习必读的11大研究趋势和方向: 微分方程/子图表示/图谱理论/非对称/动态性/鲁棒性/通用性/强化学习/图量子等
来源:智源社区本文约6900字,建议阅读10+分钟本文为你总结了图机器学习过去一年中的研究亮点,并对该方向在 2022 年的发展趋势进行了展望。 [ 导读 ]几何机器学习和基于图的机器学习是当前最热门的研究课题之一。在过去的一年中,该领域的研究发展迅猛。在本文中,几何深度学习先驱 Michael Bronstein 和 Petar Veličković 合作,采访了多位杰出的领域专家,总结了该领域过去一年中的研究亮点,并对该方向在 2022 年的发展趋势进行了展望。 作者:Michael Bronstei
数据派THU
2022/03/04
7410
推荐阅读
相关推荐
从欧几里得到双曲空间,融入视觉 Transformer 增强层次关系建模 !
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档