KDD是CCF-A类数据挖掘顶级国际学术会议,第30届会议(KDD 2024)于8月25-29日在西班牙巴塞罗那召开。KDD 2024的Research和Applied Data Science两个Track共收到2784篇投稿,其中562篇被接收发表,总体接收率为20.2%。本文梳理汇总了被KDD 2024录用的时空数据挖掘(Spatial-Temporal Data Mining)领域34篇论文,供大家参考。如有疏漏或错误之处,敬请谅解。
Research Track
Theme: Urban Data I
Multi-Task Learning for Routing Problem with Cross-Problem Zero-Shot Generalization作者:Fei Liu, Xi Lin, Zhenkun Wang, Qingfu Zhang, Tong Xialiang, Mingxuan Yuan
机构:香港城市大学
一句话总结:本研究首次通过属性组合的单一模型实现跨问题泛化以解决多种车辆路径问题。
论文简介:车辆路径问题在众多现实世界的应用中扮演着重要角色,几十年来一直是一个重要的研究课题。近年来,神经组合优化方法因其能够利用基于学习的模型解决VRPs而无需手动设计算法,受到了广泛关注。然而,目前的NCO方法通常需要为每个路径问题构建一个单独的模型,这在具有多样化属性的实际问题中极大地限制了其应用。为了解决这一关键挑战,我们在这项工作中首次尝试跨问题泛化。我们将VRPs表示为一组共享的基础属性的不同组合,并通过属性组合使用单一模型同时解决这些问题。通过这种方式,我们提出的模型能够以零样本泛化的方式成功解决具有未见过属性组合的车辆路径问题。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3672040
CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control作者:Jingqing Ruan,Ziyue Li,Hua Wei,Haoyuan Jiang,Jiaming Lu,Xuantang Xiong,Hangyu Mao,Rui Zhao
机构:中国科学院自动化研究所,科隆大学,亚利桑那州立大学,百度,复旦大学,快手,上海交通大学
一句话概括:本文提出了一种强化学习方法,通过动态选择最佳协作路口来优化多路口交通信号控制,显著改善了拥堵状况。
论文简介:有效的多路口协作对于基于强化学习的交通信号控制算法在缓解拥堵方面至关重要。现有的工作主要选择邻近路口作为协作对象。然而,很多拥堵,甚至一些大范围的拥堵,是由于非邻近路口未能进行协作造成的。为了解决这些问题,本文提出将协作对象的选择作为需要学习的策略,与原本的信号控制策略同时更新。具体来说,该选择策略能够实时地根据相位和路口层级的特征自适应地选择最佳的协作路口。在合成数据和真实世界数据集上的实验证明了本文所提方法的优越性,与现有最先进的方法相比,取得了显著的改进。代码可在https://github.com/bonaldli/CoSLight获取。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671998
Online Preference Weight Estimation Algorithm with Vanishing Regret for Car-Hailing in Road Network作者:Yucen Gao、Zhehao Zhu、Mingqian Ma、Fei Gao、Hui Gao、Yangguang Shi、Xiaofeng Gao
机构:上海交通大学,滴滴
一句话概括:本文提出了一种基于在线学习的偏好权重逼近算法来解决网约车乘客的道路选择偏好问题。
论文简介:本文使用一组偏好权重估计模型来捕获用户对网约车路径的偏好和他们的历史选择。由于用户偏好可能随时间动态变化,因此在模型上进行实时决策是一项具有挑战性的任务。本文的主要技术贡献是提出了一种基于在线学习的偏好权重逼近(PWC)算法来解决该问题。通过后悔值分析了PWC在最坏情况下的性能,证明了PWC的后悔值是可以消失的。这意味着经过足够长时间的运行后,其整体表现会非常接近于事后选定的最佳固定策略。基于真实数据集的实验验证了该算法的有效性和高效性。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671664
CrossLight: Offline-to-Online Reinforcement Learning for Cross-City Traffic Signal Control作者:Qian Sun, Rui Zha, Le Zhang, Jingbo Zhou, Yu Mei, Zhiling Li, Hui Xiong
机构:香港科技大学,中国科学技术大学,百度,香港科技大学(广州)
一句话总结:本文提出了一种跨城市的交通信号控制范式CrossLight,通过采用离线数据进行元学习并在目标城市进行微调,以解决不同城市间进行交通信号控制策略迁移难的挑战。
论文简介:本文介绍了一种名为CrossLight的新型跨城市交通信号控制(TSC)范式,旨在通过强化学习解决交通拥堵问题,并提高不同城市间TSC策略的可转移性。研究指出,尽管当前的在线或离线学习策略能够为特定城市创建优化的TSC策略,但这些策略在新城市的适用性受到高质量数据获取困难和探索过程成本高昂的限制。CrossLight方法通过在源城市使用离线数据进行元训练,并在目标城市进行自适应微调,以克服这些挑战。通过在四个城市的广泛实验,验证了CrossLight在新城市中以最小的微调迭代次数实现了与现有在线和离线方法的可比性能。这一成果表明,CrossLight框架作为一种创新且强大的范式,为智能交通社区提供了一种可行和有效的解决方案。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671927
STONE: A Spatio-temporal OOD Learning Framework Kills Both Spatial and Temporal Shifts作者:Binwu Wang, Jiaming Ma, Pengkun Wang, Xu Wang, Yudong Zhang, Zhengyang Zhou, Yang Wang
机构:中国科学技术大学
一句话总结:本文提出了一个时空分布外学习框架STONE,通过提取空间和时间语义图,并设计了三种机制,同时处理结构和时间偏移问题,在泛化和可扩展性方面表现出了极具竞争力的性能。
论文简介:交通预测是智能交通系统(ITS)中的一项重要任务,受到工业界和学术界的极大关注。目前已经出现了许多用于交通预测的时空图卷积网络,并取得了显著的成功。然而,这些模型在处理具有结构和时间偏移的分布外(OOD)图数据时,在泛化和可扩展性方面存在局限性。为了应对时空变化的挑战,本文提出了一个名为 STONE 的框架,通过学习不变的节点依赖关系,在多变的环境中实现稳定的性能。STONE 最初采用门控Transformer来提取空间和时间语义图,这两种图分别代表空间和时间依赖关系。接着本文设计了三种技术来解决时空偏移问题。首先,本文引入了一种对结构变化不敏感的Fréchet嵌入方法,这种嵌入空间可以整合图中节点的松散位置依赖关系。其次,本文提出了一种图干预机制,通过扰动两种语义图生成多种不同的环境,而无需任何数据增强,STONE 可以从环境中探索不变的节点表示。最后,本文进一步引入了从探索到外推的风险目标,以增强生成环境的多样性。本文在多个流量数据集上进行了实验,结果表明,本文提出的模型在泛化和可扩展性方面表现出了极具竞争力的性能。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671680
UniST: A Prompt-empowered Universal Model for Urban Spatio-temporal Prediction作者:Yuan Yuan, Jingtao Ding, Jie Feng, Depeng Jin, Yong Li
机构:清华大学
一句话总结:这篇文章介绍了一个通用的城市时空预测模型UniST,它通过利用多样化的时空数据、有效的预训练和知识引导的提示学习,实现了在多种场景下,特别是在少样本和零样本预测方面的优异性能。
论文简介:这篇文章提出了UniST,一个用于城市时空预测的通用模型。UniST的设计灵感来自于大型语言模型,它通过以下几个关键点来实现跨城市时空场景的高效预测:首先,它利用来自不同城市和领域的多样化时空数据进行训练;其次,通过有效的预训练策略,如掩码标记建模(MTM),捕获复杂的时空关系;最后,引入了知识引导的提示学习,通过特定的提示网络动态生成有用的提示,以增强模型对不同数据分布的适应性。UniST的架构包括数据预处理、基于Transformer的编码器-解码器结构、自监督预训练和提示学习四个主要组成部分。在超过20个时空预测场景的广泛实验中,UniST不仅在常规设置下表现出色,尤其在少量样本和零样本学习环境中,UniST展现了其卓越的泛化能力和预测性能。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671662
Theme: Spatio-temporal Data
Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction作者:Dazhou Yu, Xiaoyun Gong, Yun Li, Meikang Qiu, Liang Zhao
机构:埃默里大学,奥古斯塔大学
一句话总结:该论文提出的DMSP框架通过最大化模型估计与目标变量之间的互信息,并引入保真度评分量化数据源质量,提高了环境监测和自然资源管理中多源空间点数据预测的准确性。
论文简介:该论文针对环境监测和自然资源管理等领域的需求,提出了DMSP自监督学习框架,用于多源空间点数据的预测。框架通过最大化模型估计与目标变量间的互信息来对齐不同数据源,并通过保真度评分量化各数据源的可靠性。此外,它采用地理感知图神经网络来捕捉数据点间复杂的空间关系,提高了预测的准确性。DMSP不依赖于真实标签,而是通过自洽的训练方法动态调整模型参数,有效整合了不同质量和位置的多源数据,解决了在缺乏地面真实标签情况下整合多源数据的挑战。在实验部分,该论文通过在两个真实世界的数据集和一个合成数据集上的严格测试,验证了DMSP框架的优越性能,实验结果一致表明其在多个评估指标上超越了现有的最先进方法。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671737
MulSTE: A Multi-view Spatio-temporal Learning Framework with Heterogeneous Event Fusion for Demand-supply Prediction作者:Li Lin, Zhiqiang Lu, Shuai Wang, Yunhuai Liu, Zhiqing Hong, Haotian Wang, Shuai Wang
机构:东南大学,北京大学,罗格斯大学,京东
一句话总结:本文提出了一种基于多视角时空学习框架的解决方案,通过融合异构事件信息来提升需求和供应的预测性能。
论文简介:近年来,集成仓储和配送物流系统在电子商务行业中广泛应用,以应对不断变化的客户需求。因此,购买需求和配送供应能力的预测成为优化运营和提高效率的关键问题。需求和供应之间的互动不仅依赖于它们的经济关系,还受到诸如疫情、促销和节日等日常事件引发的消费者心理影响。虽然现有研究在考虑需求-供应互动的联合预测方面取得了显著进展,但很少涉及多样化事件的影响。在本研究中,我们提出了MulSTE,一种融合异构事件信息的多视角时空学习框架。首先,本文设计了事件融合表示(EFR)模块,用于融合紧急和周期性事件的文本、数值和分类等异构信息。其次,本文提出了多图自适应卷积递归网络(MGACRN),作为时空编码器(ST-Encoder)来捕捉需求、供应和事件的演变特征。第三,设计了事件门控需求-供应交互注意力(EGIA)模块,用于建模事件期间的需求-供应互动。我们在从京东物流和公共网站收集的两个真实世界数据集上进行了评估,实验结果表明,我们的方法在多个指标上优于现有的最新基线方法。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3672030
Long-Term Vessel Trajectory Imputation with Physics-Guided Diffusion Probabilistic Model作者:Zhiwen Zhang,Zipei Fan,Zewu Lv,Xuan Song,Ryosuke Shibasaki
机构:吉林大学,LocationMind Inc.
一句话总结:本文提出了一种基于生成模型的长期船舶轨迹补全框架,利用预训练嵌入和物理引导的判别器,针对海上运输的特性有效填补AIS数据缺失。
论文简介:海上交通管理越来越依赖于地面和卫星网络自动识别系统(AIS)提供的船舶位置信息。然而,AIS 数据缺失的问题可能导致船舶轨迹长期缺失,从而引发有关碰撞风险和非法活动的安全担忧。现有的补全方法通常聚焦于车辆轨迹,难以应对海上运输系统的独特特征和长期缺失数据的情况。为了解决这些挑战,本文提出了一种长期船舶轨迹补全的框架。具体而言,本文首先利用预训练的轨迹嵌入模块来捕捉船舶运动模式,随后引入扩散模型生成缺失轨迹,其中通过Transformer编码观察到的轨迹,将历史船舶轨迹和外部因素作为条件信息。在训练阶段,还设计了一个物理引导的判别器,通过对位置和角度施加运动学约束,以改善补全轨迹的连续性。基于真实AIS数据集的综合实验和分析验证了提出方法的有效性。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3672086
RPMixer: Shaking Up Time Series Forecasting with Random Projections for Large Spatial-Temporal Data作者:Chin-Chia Michael Yeh, Yujie Fan, Xin Dai, Uday Singh Saini, Vivian Lai, Prince Osei Aboagye, Junpeng Wang, Huiyuan Chen, Yan Zheng, Zhongfang Zhuang, Liang Wang, Wei Zhang
机构:Visa Research
一句话总结:本文介绍了一种全MLP模型RPMixer,主要结构是随机投影层的集成。
论文简介:时空预测系统在面对众多现实世界挑战时扮演着至关重要的角色。本文深入探讨了利用一般时间序列预测模型(即不考虑节点间空间关系的模型)来解决时空预测问题的潜力。本文提出了一种名为RPMixer的全多层感知器(all-MLP)时间序列预测架构。选择全多层感知器架构是因为它在最近的时间序列预测基准测试中获得了成功。此外,通过深度神经网络类似于集成模型的行为,网络中的每个单独块的作用类似于集成模型中的基学习器,尤其是在引入恒等映射残差连接时。最后,通过将随机投影层整合到模型中,不仅增加了块输出之间的差异性,还提升了网络的整体性能。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671881
Heterogeneity-Informed Meta-Parameter Learning for Spatiotemporal Time Series Forecasting作者:Zheng Dong, Renhe Jiang, Haotian Gao, Hangchen Liu, Jinliang Deng, Qingsong Wen, Xuan Song
机构:南方科技大学,东京大学,香港科技大学,松鼠AI,吉林大学
一句话总结:本文提出了一种用于时空时间序列预测的异质性参考的元参数学习方案,通过学习空间和时间嵌入隐式地捕捉时空异质性,并参考捕捉到的异质性来进行时空元参数学习,以充分捕捉和利用时空异质性。
论文简介:时空时间序列预测在现实世界的广泛应用中发挥着关键作用。虽然该领域已取得重大进展,但充分捕捉和利用时空异质性仍是一项基本挑战。因此,本文提出了一种新颖的异质性参考的元参数学习方案。具体来说,本文的方法通过学习空间和时间嵌入隐式地捕捉时空异质性,这可以看作是一个聚类过程。然后,本文提出了一种新颖的时空元参数学习范式,从元参数池中学习特定时空参数,而元参数池则考虑了捕捉到的异质性。基于这些想法,本文开发了用于时空时间序列预测的考虑异质性的时空元网络(HimNet)。在五个广泛使用的基准上进行的大量实验表明,本文的方法达到了最先进的性能,同时表现出卓越的可解释性。本文的代码可在 https://github.com/XDZhelheim/HimNet 上查阅。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671961
HimNet
ImputeFormer: Low Rankness-Induced Transformers for Generalizable Spatiotemporal Imputation作者:Tong Nie, Guoyang Qin, Wei Ma, Yuewen Mei, Jian Sun
机构:同济大学
一句话总结:本文提出了一种低秩性引导的Transformer模型,同时结合了低秩特性和深度模型的优势,用于解决各类稀疏时空数据的高效补全问题。
论文简介:现有的插补解决方案主要包括低秩模型和深度学习模型。前者假设一般的结构先验,但模型容量有限。后者具有显著的表达能力,但缺乏先验知识的基础时空结构。利用这两种范式的优势,我们展示了一个低秩诱导的Transformer,以实现强归纳偏差和高模型表达性之间的平衡。利用时空数据的固有结构,使我们的模型能够学习平衡的信号-噪声表示,使其可推广到各种插补问题。代码和模型开源于:https://github.com/tongnie/imputeformer。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671751
DyPS: Dynamic Parameter Sharing in Multi-Agent Reinforcement Learning for Spatio-Temporal Resource Allocation
作者:Jingwei Wang, Qianyue Hao, Wenzhen Huang, Xiaochen Fan, Zhentao Tang, Bin Wang, Jianye Hao, Yong Li
机构:清华大学
一句话概括:本文提出了一种动态参数共享方法,通过自监督学习提取智能体行为特征,在训练过程中动态调整角色划分,从而高效地在大型城市中优化资源分配。
论文简介:在大型城市中,根据资源和需求的时空分布,高效地分配电力、医疗和交通等各种资源以满足市民的生活需求至关重要。此前的研究者已经通过多智能体强化学习(MARL)方法对这些问题进行了大量研究,多个智能体合作调控和分配资源以满足需求。然而,面对大城市中大量的智能体,现有的MARL方法缺乏有效的智能体间参数共享策略,导致计算复杂度过高。高效参数共享面临两个主要挑战:(1) 在强化学习的训练过程中,智能体的行为变化显著,限制了基于训练前固定角色划分的群体参数共享的性能;(2) 智能体的行为形成了复杂的动作轨迹、角色特征,使得在训练过程中动态调整智能体角色划分更加困难。为了解决这些问题,本文提出了动态参数共享(DyPS)方法。本文设计了自监督学习任务,从智能体的动作轨迹中提取隐含的行为特征。基于获得的行为特征,本文提出了一个分层MARL框架,能够在训练过程中动态调整智能体角色划分,从而在相同角色的智能体之间共享参数,降低计算复杂度。此外,本文所提出的框架可以与各种典型的MARL算法结合,包括IPPO、MAPPO等。本文在4个具有代表性的资源分配场景中进行了7个实验,大量结果表明本文所提的方法具有优越的性能,最高比现有最先进的基准方法提高了31%。开源代码可在 https://github.com/tsinghua-fib-lab/DyPS 获取。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3672052
STEMO: Early Spatio-temporal Forecasting with Multi-Objective Reinforcement Learning作者:Wei Shao, Yufan Kang, Ziyan Peng, Xiao Xiao, Lei Wang, Yuhui Yang, Flora D. Salim
机构: CSIRO,皇家墨尔本理工大学,西安电子科技大学,浙江大学,新南威尔士大学
一句话概括:这篇文章介绍了一种基于多目标强化学习的早期时空预测模型STEMO,旨在通过动态调整预测时间来平衡准确性和及时性,以提高对如野火、犯罪和交通拥堵等事件的预测效果。
论文简介:这篇文章详细介绍了一个名为STEMO的新型早期时空预测模型。STEMO模型旨在解决在预测任务中准确性和及时性往往相互冲突的问题。该模型基于多目标强化学习,能够根据给定的偏好实施最优策略或者基于少量样本推断出偏好。STEMO模型主要解决两个挑战:提高早期预测的准确性和为确定每个区域最合适的预测时间提供最优策略。该模型通过多图卷积神经网络(MGCN)和有偏随机游走的节点嵌入技术,增强了对时空数据的动态适应能力,并通过实时反馈进行交互式学习。此外,STEMO还引入了一种方法来发现隐藏的偏好,并使用熵权法来处理非均匀对象尺度或单位的问题。在三个大规模真实世界数据集上的实验结果表明,STEMO在早期时空预测任务中的性能超过了现有方法,展示了其在不同应用场景中的有效性和适用性。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671922
Theme: Anomaly Detection II
Multi-Scale Detection of Anomalous Spatio-Temporal Trajectories in Evolving Trajectory Datasets作者:Chenhao Wang, Lisi Chen, Shuo Shang, Christian S. Jensen, Panos Kalnis
机构:电子科技大学,奥尔堡大学,阿卜杜拉国王科技大学
一句话概括:本文针对轨迹异常检测开展研究,提出了一种能够在多尺度上检测轨迹时空异常的模型,称为MST-OATD。模型首先计算并融合多尺度上的轨迹时空特征,并在不同尺度上推理正常路线,最后通过轨迹在时空上的重构来检测异常。同时,本文提出一种基于概率和排序的训练集更新策略,在收集到新的轨迹数据时迭代更新训练集,达到实时更新模型的效果。在两个大规模真实数据集上的实验证明了模型的有效性。
论文简介:轨迹是一系列带有时间戳的点位置,用于捕获诸如车辆之类的对象的运动。这种轨迹编码了复杂的空间和时间模式,并提供了关于对象移动性和底层基础设施(通常是移动发生在其中的道路网络)的丰富信息。当不断地包括新的轨迹时,轨迹数据集正在演变。在这种情况下,以在线方式检测异常轨迹的能力是具有许多应用的基本且具有挑战性的功能,基于位置的服务。最先进的解决方案基于轨迹的形状或路线来确定异常,而忽略了由不同采样率或时间偏移引起的潜在异常。本文提出了一种多尺度模型MST-OATD,用于异常流轨迹的检测,该模型同时考虑了轨迹的空间和时间两个方面。该模型的多尺度能力旨在能够在多尺度下提取轨迹特征。此外,为了提高模型的可进化性并应对轨迹模式的变化,模型配备有学习的排序模型,该模型在包括新轨迹时更新训练集。在真实的数据集上的实验结果表明,该模型的性能优于现有的异常检测方法,能够实时检测出异常。此外,学习到的排序模型在使用新到达的轨迹更新训练集时取得了令人满意的结果。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671874
Theme: Sequential Recommendations
ROTAN: A Rotation-based Temporal Attention Network for Time-Specific Next POI Recommendation作者:Shanshan Feng, Feiyu Meng, Lisi Chen, Shuo Shang, Yew Soon Ong
机构:电子科技大学,A*STAR
一句话概括:本文提出了一种全新的Time2Rotation技术来捕获时间信息,基于Time2Rotation技术,本文提出了一种基于旋转的新型时间注意网络ROTAN用于特定时间的下一个 POI推荐任务。
论文简介:下一个POI推荐最近引起了广泛的研究兴趣,它可以预测用户的后续移动。主要的挑战是如何有效地捕捉用户在签到轨迹中的个性化顺序转换,并且已经开发了各种方法。然而,大多数现有研究在进行下一个POI推荐时忽略了时间信息。为了填补这一空白,我们研究了一个特定时间的下一个POI推荐任务,该任务还结合了目标时间信息。我们提出了一种全新的Time2Rotation技术来捕获时间信息。与传统方法不同,我们将时间段表示为旋转向量,然后执行旋转操作。基于Time2Rotation技术,我们为特定时间的下一个POI推荐任务提出了一种基于旋转的新型时间注意力网络,即ROTAN。ROTAN首先构建一个协作POI转换图,捕捉顺序转换中的不对称时间影响。之后,它将时间信息纳入个人签到轨迹的建模中,提取用户偏好和POI影响的单独表示,以反映它们不同的时间模式。最后,结合目标时间生成推荐。在三个真实数据集上进行了大量的实验,证明了所提出的Time2Rotation技术和ROTAN推荐模型的优势。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671809
Diffusion-Based Cloud-Edge-Device Collaborative Learning for Next POI Recommendations作者:Jing Long, Guanhua Ye, Tong Chen, Yang Wang, Meng Wang, Hongzhi Yin
机构:昆士兰大学,Deep Neural Computing Company,合肥工业大学
一句话概括:本文提出了一种基于扩散模型的云-边缘-设备协同学习框架,旨在降低设备计算负担并提高POI推荐的准确性和适应性。
论文简介:随着基于位置的社交网络(LBSNs)的快速扩展,精准的下一兴趣点(POI)推荐变得尤为重要,通过利用历史签到数据预测用户下一步可能访问的兴趣点。传统的集中式深度神经网络(DNNs)尽管在POI推荐性能上表现出色,但由于隐私问题和时效性不足面临挑战。为应对这些问题,引入了基于设备的POI推荐,利用联邦学习(FL)和去中心化的方法来确保隐私和推荐的时效性。然而,这些方法往往给设备带来计算压力,并难以适应新用户和新区域。本文提出了一种创新的协同学习框架——基于扩散模型的云-边缘-设备协同学习(DCPR),用于下一兴趣点推荐。DCPR通过云-边缘-设备架构提供区域特定且高度个性化的POI推荐,同时减少设备端的计算负担。DCPR通过全局与局部学习过程的独特结合,最大限度地降低了设备端的计算需求。我们通过两个真实世界数据集的评估证明,DCPR在推荐准确性、效率以及适应新用户和新区域方面的性能优于现有方法,标志着设备端POI推荐技术的显著进步。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671743
Going Where, by Whom, and at What Time: Next Location Prediction Considering User Preference and Temporal Regularity作者:Tianao Sun, Ke Fu, Weiming Huang, Kai Zhao, Yongshun Gong, Meng Chen
机构:山东大学,新加坡南洋理工大学
一句话总结:本文提出MCLP基于概率主题模型和多头注意力机制建模用户偏好、时间规律性和序列模式实现用户下一位置预测任务。
论文简介:下一位置预测是人类移动建模的关键任务,可应用于位置推荐、交通规划等多种下游应用中。以往的研究局限于将用户下一位置的到达时间作为关键决定因素,忽略了从历史轨迹中提取用户偏好。为解决以上问题,本文提出了MCLP,通过概率主题模型LDA从用户历史轨迹中学习用户偏好,基于多头注意力机制学习用户下一位置到达时间,以及基于Transformer捕获用户移动模式,联合建模预测用户下一位置。实验结果表明,在模型中加入用户偏好和时间规律信息,可以显著提升下一次位置预测的性能。代码和模型开源于:https://github.com/SUNSTARK/MCLP。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671916
Theme: Urban Data II
ControlTraj: Controllable Trajectory Generation with Topology-Constrained Diffusion Model作者:Yuanshao Zhu, James Jianqiao Yu, Xiangyu Zhao, Qidong Liu, Yongchao Ye, Wei Chen, Zijian Zhang, Xuetao Wei, Yuxuan Liang
机构:南方科技大学,香港城市大学,香港科技大学(广州)
一句话概括:本文提出了一种基于条件扩散模型的可控轨迹生成框架ControlTraj。
论文简介:轨迹生成可以用于模拟和分析人类移动模式,为城市规划提供数据支持。然而,现有的轨迹生成方法仍处于起步阶段,面临着人类活动的多样性和不可预测性带来的挑战,如真实性、灵活性和普遍性。为了解决这些问题,本文提出了ControlTraj,这是一种具有拓扑约束的扩散模型的可控轨迹生成框架。与之前的方法不同,ControlTraj利用扩散模型生成高保真度的轨迹,同时整合道路网络拓扑的结构约束来指导结果。具体来说,本文开发了一种新型的道路段自编码器,以提取细粒度的道路段嵌入。然后,将这些编码特征与行程属性合并到提出的去噪UNet架构GeoUNet中,从白噪声中合成地理轨迹。通过在三个真实数据环境中的实验,ControlTraj展示了其生成高保真度,适应未被探索地理环境。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671866
Communication-efficient Multi-service Mobile Traffic Prediction by Leveraging Cross-service Correlations作者:Zhiying Feng, Qiong Wu, Xu Chen
机构:中山大学,香港科技大学
一句话概括:本文提出了基于跨服务相关性的通信高效多服务移动流量预测模型,旨在减少数据传输量并提高预测精度。
论文简介:本文提出了一个新的基于跨服务注意力的时空图卷积网络(CsASTGCN),该网络能够同时捕捉时间、空间和跨服务的流量数据相关性。在减少数据传输量的同时,该方法实现了准确的多服务流量预测。此外,本文还提出了基于模型的自适应迁移学习方案,提升新服务模型的训练效率。实验结果表明,该模型在通信效率和预测性能方面显著优于现有方法。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671730
Irregular Traffic Time Series Forecasting Based on Asynchronous Spatio-Temporal Graph Convolutional Networks作者:Weijia Zhang, Le Zhang, Jindong Han, Hao Liu, Yanjie Fu, Jingbo Zhou, Yu Mei, Hui Xiong
机构:香港科技大学、百度研究院、亚利桑那州立大学
一句话概括:针对不规则交通,本文提出一种时间序列预测的异步时空图卷积网络。
论文简介:本文提出一种针对不规则交通时间序列预测的异步时空图卷积网络(ASeer)。首先,提出一种异步图扩散网络来捕获由自适应交通信号调节的异步测量交通状态之间的空间依赖关系;然后,为捕捉不规则交通状态序列之间的时序依赖关系,设计个性化的时间编码来嵌入连续时间信号;接着,提出了一种可转换的时间感知卷积网络,该网络在时间流不一致的序列上采用元滤波器进行时间感知卷积。此外,设计了一种由状态演化单元和半自回归预测器组成的半自回归预测网络,能够高效地预测变长流量序列。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671665
Profiling Urban Streets: A Semi-Supervised Prediction Model Based on Street View Imagery and Spatial Topology作者:Meng Chen, Zechen Li, Weiming Huang, Yongshun Gong, Yilong Yin
机构:山东大学
一句话概括:本文提出了一种基于街景图像和空间拓扑的半监督预测模型USPM,用于城市街道功能和社会经济指标的精准预测。
论文简介:随着城市的扩展和多模态城市数据的兴起,利用街景图像分析城市区域在城市规划和管理中愈发重要。本文提出了一种半监督的城市街道剖析模型(USPM)。USPM主要由两个部分组成:街道表征学习和城市街道轮廓提取。USPM结合街景图像的视觉特征和空间拓扑信息,提出了一种基于空间上下文的对比学习方法,用于为每幅街景图像生成特征嵌入,然后使用一个基于LSTM的融合方法对这些图像进行编码,产生一个全面的视觉表示的街道。此外,USPM通过基于SPHINX-V2 的图像字幕来创建街道场景的描述,并利用预先训练的Bert来产生街道的文本表示。最后,使用注意力方法将街道的视觉和文本表示相结合来生成街道表示,从而增强街道功能的分析。最终结合图神经网络进行街道功能和社会经济指标的预测。实验结果表明,USPM在实际城市数据集上的表现显著优于现有基准模型,展现了其在城市剖析任务中的强大潜力。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671918
DiffCrime: A Multimodal Conditional Diffusion Model for Crime Risk Map Inference作者:Shuliang Wang, Xinyu Pan, Sijie Ruan, Haoyu Han, Ziyu Wang, Hanning Yuan, Jiabao Zhu, Qi Li
机构:北京理工大学
一句话概括:本文提出了一种多模态条件扩散方法,通过历史犯罪事件、卫星图像和地图图像来推断犯罪风险图。
论文简介:受扩散模型强大且逼真的条件生成能力的启发,本文提出了一种多模态条件扩散方法,即DiffCrime,基于不同领域的数据集(如历史犯罪事件、卫星图像和地图图像)来推断犯罪风险图。它使用了一个历史门控多模态去噪网络,即HamNet,专门用于犯罪风险地图推断。HamNet通过基于门控的历史融合模块强调历史犯罪数据的重要性,并通过时间步感知的模态融合模块自适应地控制多模态条件在不同扩散时间步之间进行融合。在两个真实数据集上的大量实验证明了DiffCrime的有效性。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671843
ADS Track
Theme: Spatiotemporal Applications
Diffusion Model-based Mobile Traffic Generation with Open Data for Network Planning and Optimization作者:Haoye Chai, Tao Jiang, Li Yu
机构: 清华大学,华中科技大学
一句话概括: 本文提出扩散模型OpenDiff,基于对比学习算法和注意力机制,通过学习公开数据生成移动流量数据。
论文简介: 随着5G网络的快速发展,网络规划和优化越来越重要,生成高保真度的网络流量数据可以帮助网络运营商估计移动用户的网络需求,从而提高网络性能。受公开数据有限的约束,本文提出OpenDiff扩散模型,通过对比学习算法学习遥感图像、POI和人口等公开数据,构建扩散模型的条件信息,还基于注意力融合机制来捕捉网络流量和人类活动特征之间的内在关联,指导生成移动流量数据。分析表明,该模型生成的流量数据具有较高的保真度和较好的可控性,并已成功部署在中国移动的九天人工智能平台上,协助运营商进行网络规划,包括基站部署、节能策略优化、网络资源分配等。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671544
LaDe: The First Comprehensive Last-mile Express Dataset from Industry作者:Lixia Wu, Haomin Wen, Haoyuan Hu, Xiaowei Mao, Yutong Xia, Ergang Shan, Jianbin Zheng, Junhong Lou, Yuxuan Liang, Liuqing Yang, Roger Zimmermann, Youfang Lin, Huaiyu Wan
机构:浙江菜鸟网络技术有限公司,北京交通大学,新加坡国立大学,香港科技大学(广州)
一句话概括:本文提出了首个工业级最后一公里快递数据集LaDe。
论文简介:本文提出了首个工业级最后一公里快递数据集LaDe,其包含来自行业的数百万个真实包裹。LaDe有三个独特的特点:(1) 大规模。它包含21k个快递员在6个月内配送和揽收的10677万个包裹。(2) 全面的信息。它提供原始的包裹信息、任务信息,以及快递员的详细运动轨迹和道路网络。(3) 多样性。该数据集包括来自各种场景的数据,包括包裹揽收和配送,以及来自多个城市的数据,每个城市由于其独特的特征,都有其独特的时空模式。并且,本文通过对每个任务运行几个经典的基线模型来验证三个任务上的LaDe。数据集开源于https://huggingface.co/datasets/Cainiao-AI/LaDe。代码开源于https://github.com/wenhaomin/LaDe。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671548
UrbanGPT: Spatio-Temporal Large Language Models作者:Zhonghang Li, Lianghao Xia, Jiabin Tang, Yong Xu, Lei Shi, Long Xia, Dawei Yin, Chao Huang
机构:香港大学,华南理工大学,百度
一句话概括:将时空依赖编码与大语言模型(LLMs)相结合,以应对城市环境中时空预测,尤其是在数据稀缺的情况下的挑战。
论文简介:UrbanGPT是一种旨在解决城市时空预测问题的大型语言模型。时空预测的目标是预测城市生活各个方面的未来时空模式、趋势和事件,包括交通、人口流动和犯罪率。现有方法虽然在时空数据预测方面取得了一定的成效,但大多依赖大量的标注数据,而这些数据在实际的城市感知场景中往往难以获取。数据稀疏性是一个普遍存在的问题,有时甚至难以收集到任何标注数据,从而进一步加剧了这一问题。因此,构建一个能够在不同时空学习场景中展现强泛化能力的时空模型变得至关重要。受到大语言模型(LLMs)在处理文本数据方面显著成果的启发,UrbanGPT的目标是创建一个能够在广泛的下游城市任务中展现卓越泛化能力的时空LLM。为此,我们提出了UrbanGPT,该模型无缝集成了时空依赖编码器和指令微调范式,使得LLMs能够理解时间和空间之间的复杂相互依赖关系,从而在数据稀疏的情况下也能进行更全面和准确的预测。我们在各种公共数据集上进行了广泛的实验,涵盖不同的时空预测任务,结果一致表明,所设计的UrbanGPT始终优于最先进的基准模型。这些发现突显了在标记数据稀疏的零样本情景下构建大型语言模型进行时空学习的潜力。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671578