首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【因果发现】 针对时序数据的因果图学习

【因果发现】 针对时序数据的因果图学习

作者头像
叶庭云
发布于 2023-01-11 01:50:17
发布于 2023-01-11 01:50:17
2.4K0
举报
文章被收录于专栏:Python进阶之路Python进阶之路

一、任务

This track focuses on solving a causal structure learning problem in AIOps.

AIOps 相关:主要目标是从事件序列数据中挖掘因果图关系,并辅助定位根因。

  • 主要需要解决的是智能运维 AIOps 领域中的因果结构学习问题。目标是挖掘连续时间事件序列中的因果图关系。获取因果图信息可以更好地理解实体之间的关系,能够辅助管理员快速定位实际系统故障的根本原因。
  • 在电信网络中,异常现象通常是通过告警来识别的,由于网络的规模和系统内部相互关联的结构,运营商每天可能面临数以百万计的警报。网络中的单个故障可能会在多个相连的设备上触发大量的各种类型的告警,运营商期望能从告警风暴中快速定位到故障根源,然而实现这样的目标是非常困难的,需要学习到告警间的因果图关系提供给管理员进行快速排障。
  • 在这个赛道中需要学习到告警事件间的因果图关系,其中每个节点是从一些可观测的历史告警数据集得出的告警类型,因果图可用于对最重要和最相关的告警进行优先排序,然后提供给管理员参考以此来更加高效地定位到告警的故障根源。

二、数据集说明

所有数据集都是来自现实世界的工业数据或基于专业知识的实际因果假设生成的。告警类型的因果图在竞赛中被限定为:有向、无环,但是因果识别和潜在变量的问题可能仍然存在。

竞赛提供了 24 个数据集,其中 12 个包含了网络拓扑信息其它 12 个不包含网络拓扑信息。每个数据集文件夹中包含以下文件:

Alarm.csv 历史告警数据集

Topology.npy 设备间拓扑关系图(有的数据中并不包含)

  • 格式:M ∗ M 大小的的 Numpy 数组
  • 设备连接关系对应的无向图,二进制对称邻接矩阵,元素值为 1 表示存在连接关系,0 表示不存在连接关系。
  • 数据示例:

DAG.npy 真实因果图

  • 格式: N∗N 大小的 NumPy 数组
  • 告警事件因果关系的有向图
  • 数据示例:

目标任务:给定以上数据集,使用历史告警数据和设备拓扑图(可能没有)来学习到告警类型间的因果图。

三、专业名词

因果发现(Causal Discovery):发现因果关系的传统方法是使用干预措施或随机实验,这在很多情况下过于昂贵,过于耗时,甚至不可能。通过分析纯粹的观察性数据来揭示因果信息,即所谓的因果发现。

  • 基于约束的因果发现方法。基于约束的因果发现方法主要基于独立性和条件独立性检测判断变量之间的统计关系,并在一定的假设下先获得无向因果图。之后利用 V-structure 和一系列方向传播规则对因果图中的无向边进行方向传播。其经典方法包括 PC 算法,能够处理隐变量(混淆变量)的 FCI 算法 ,以及能够处理异构数据的 CD-NOD 算法
  • 基于评分的因果发现方法。基于评分的方法通过对候选模型(即候选因果图)进行评分的方式,来选取评分最高的因果图作为结果。经典方法包括 GES 以及一系列通过改变评分函数来适应不同任务的扩展方法,例如基于通用评分函数的因果发现方法。此外,对于实际情况中 Faithfulness 假设不满足的情景,Exact Search 可提供可靠的马尔科夫等价类。
  • 基于约束性函数因果模型的因果发现方法。基于约束性函数因果模型的因果方法通过假设结果和原因之间的函数关系类别,从而判断其间的方向。经典方法包括线性非高斯无环模型加性噪声模型后非线性模型。近期通过对混合函数进行限制从而得到非线性独立成分分析的可识别性的理论也为通用的非线性的因果发现提供了新的方法。
  • 因果隐表征学习。因果隐表征学习专注于隐变量与观测变量间的关系以及隐变量间的关系,经典工作包括 GIN 以及层级化隐变量学习

因果发现 /因果推断工具DoWhyCausal-LearnYLearnCausalNexCausal ML

因果结构学习工具链华为诺亚方舟实验室 gCastle

多元异构时序数据:即包含多种数据类型(数值、类别、布尔型等),多种因果产生机制等

因果图学习:图形化模型作为一种描述因果关系的语言,便于彼此更好地理解和表达对因果关系的想法。因果图法是一种适合于描述对于多种输入条件组合的测试方法,根据输入条件的组合、约束关系和输出条件的因果关系,分析输入条件的各种组合情况,从而设计测试用例的方法,适合于检查程序输入条件涉及的各种组合情况。

因果隐变量检测:现实场景中,经常有许多存在隐变量的情况,隐变量是影响因果发现算法精度的一大核心要素。如果数据是线性非高斯的,可将独立噪声条件(IN)扩展到广义独立噪声条件(GIN),通过找到隐变量的代理变量做回归,恢复数据的因果结构。但这种方法的局限性在于其认为观测变量之间没有边,无法推断变量之间完整的因果关系,在此基础上可以利用面向不完全观察数据的因果结构学习算法(FRITL 算法)做进一步的优化。当前因果隐变量检测技术对数据的产生机制有较强假设,且大都只能应对线性因果场景,针对工业界的复杂因果场景很难落地实施。

因果推断是统计学领域非常经典的一个问题,旨在利用指标间的因果关系和拓扑图,找到统计学上的根因,结论通常是因果图上的某个节点(KPI 指标)而且事先定义的明确的根因类型 or 某条根因路径(Path)。因果推断领域存在着两大基本框架:PotentialOutcomeFramework(POF)潜在结果框架和 StructuralCausalModel(SCM)结构因果模型,两者的利器分别是控制变量和因果图。典型算法包括 IBM 的 CloudRanger,OM Graph 以及 FluxInfer 等,这些算法在构建因果图阶段主要都使用了经典的 PC Algorithm,而在推断阶段则使用了各不相同的搜索方式例如 Random Walk 随机游走、BFS 或是 PageRank,得到的根因形式也不尽相同。

参考链接:

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
贝叶斯网络的因果关系检测(Python)
虽然机器学习技术可以实现良好的性能,但提取与目标变量的因果关系并不直观。换句话说,就是:哪些变量对目标变量有直接的因果影响?
算法进阶
2023/09/21
1.9K0
贝叶斯网络的因果关系检测(Python)
因果图模型:理解因果关系的强大工具
在科学研究中,理解变量之间的因果关系至关重要。因果关系帮助我们不仅了解事物之间的关联,还能解释为什么这些关系存在。例如,医生想知道某种药物是否能有效治疗疾病,政策制定者想知道新的教育政策是否能提高学生成绩。因果图模型(Causal Graph Model)为我们提供了一种系统的方法来表示和推理这些因果关系。本文将详细介绍因果图模型的基本概念、组成部分、建立方法、因果推理和实际应用,帮助读者理解和使用这一强大工具。
theskylife
2024/07/31
1.3K0
揭开因果图模型的神秘面纱:常用的因果图模型
因果图模型(Causal Diagram Models)是一种通过图形化方法表示变量之间因果关系的工具。它在统计学、社会科学、流行病学等研究领域中广泛应用。因果推断(Causal Inference)则是利用这些图模型来确定变量之间的因果关系,而不仅仅是关联关系。本文将介绍几种常见的因果图模型,探讨它们的使用范围、如何使用及其应用场景,并通过图形实例进行说明。
theskylife
2024/08/01
2.3K0
专题|Python贝叶斯网络BN动态推理因果建模:MLE/Bayes、有向无环图DAG可视化分析呼吸疾病、汽车效能数据2实例合集
作为数据科学家,我们始终在探索能够有效处理复杂系统不确定性的建模工具。本专题合集系统性地解构了贝叶斯网络(BN)这一概率图模型在当代数据分析中的创新应用,通过开源工具bnlearn构建了从理论到实践的完整方法论体系。专题涵盖结构学习(Structure Learning)的评分搜索法(hc-BIC)、约束检验法(cs-χ²),参数学习(Parameter Learning)的MLE与Bayes估计,以及动态推理引擎的工程实现,为数据驱动决策提供了新的范式。
拓端
2025/03/24
7240
专题|Python贝叶斯网络BN动态推理因果建模:MLE/Bayes、有向无环图DAG可视化分析呼吸疾病、汽车效能数据2实例合集
集成20+先进算法,优于GPT-4o,自主因果分析智能体来了
来自加利福尼亚大学圣迭戈分校(UC San Diego)Biwei Huang 实验室的研究团队提出了一种自主因果分析智能体 Causal-Copilot。该实验室专注于因果推理与机器学习的交叉研究,在因果发现和因果表征学习领域取得了多项重要成果。论文共同第一作者 Xinyue Wang、Kun Zhou 和 Wenyi Wu 均来自 Biwei Huang 教授实验室,他们在因果推理与大语言模型结合方面开展了这项创新性研究。同时这项研究也得到了创业公司 Abel.ai 的大力支持和协助。
机器之心
2025/07/08
1480
集成20+先进算法,优于GPT-4o,自主因果分析智能体来了
【NSR特别专题】张坤:学习因果关系和基于因果关系的学习「全文翻译」
编者按:《国家科学评论》于2018年1月发表“机器学习”特别专题,由周志华教授组织并撰写文章。专题内容还包括对AAAI前主席Tom Dietterich的访谈,徐宗本院士、杨强教授、朱军博士、李航博士、张坤博士和Bernhard Scholkopf等人的精彩文章。
马上科普尚尚
2020/05/14
2K0
基于潜在结果框架的因果推断入门(上)
本文是一篇综述文章 「A Survey on Causal Inference」 的阅读笔记(大部分内容参照原文进行了较为通俗易懂的翻译,小部分内容加入了自己的理解)。
口仆
2021/05/13
3.9K0
基于潜在结果框架的因果推断入门(上)
因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二)
《Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution》这篇论文说到了因果推断的三层。
悟乙己
2021/12/07
4.8K0
因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二)
因果推断笔记——自整理因果推断理论解读(七)
之前有整理过一篇:因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二) 不过,那时候刚刚开始学,只能慢慢理解,所以这边通过一轮的学习再次整理一下手里的笔记。
悟乙己
2021/12/07
11.6K0
因果推断笔记——自整理因果推断理论解读(七)
九章云极DataCanvas YLearn因果学习开源项目:从预测到决策
机器之心专栏 机器之心编辑部 图灵奖得主 Judea Pearl 曾表示,现有的机器学习模型不过是对数据的精确曲线拟合,只是在上⼀代的基础上提升了性能,在基本的思想方面没有任何进步。 根据福布斯的统计数据,全球范围只有 13% 左右的机器学习项目能够真正上线运行,项目失败的一个重要原因是模型的泛化能力不足,在真实数据上的表现和完全达不到训练数据上的效果。 随着机器学习建模越来越多的应用,企业对人工智能的要求也在进一步提高。近几年提及的「数智化」核心是智能决策,以数据驱动的方式实现自动化决策来提高整体运营效
机器之心
2022/07/18
6860
九章云极DataCanvas YLearn因果学习开源项目:从预测到决策
因果推断笔记——数据科学领域因果推断案例集锦(九)
这部分只是抛砖引玉贴一些看到的非常好的业内方案。 因果推断在很多领域都有很有意思的应用,值得收藏。
悟乙己
2021/12/07
5.4K0
因果推断笔记——数据科学领域因果推断案例集锦(九)
用预测编码实现因果推断
贝叶斯和因果推理是智能的基本过程。贝叶斯推理模型观察:如果我们观察一个相关变量x,可以推断出关于y的什么?因果推理模型干预:如果我们直接改变x,y会如何改变?预测编码是一种受神经科学启发的方法,仅使用局部信息对连续状态变量进行贝叶斯推理。在这项工作中,我们超越了贝叶斯推理,并显示了在因果图已知的情况下,预测编码的推理过程中的简单变化如何实现干预和反事实推理。然后,我们扩展我们的结果,并显示如何预测编码可以推广到的情况下,这个图是未知的,必须从数据推断,因此执行因果发现。其结果是一种新颖而简单的技术,允许我们对基于预测编码的结构因果模型进行端到端的因果推理,并展示其在机器学习中潜在应用的效用。
CreateAMind
2023/09/26
3760
用预测编码实现因果推断
可信赖图神经网络综述!图的因果学习!
本文综述了图神经网络(GNN)在图挖掘应用中的最新进展,并强调了其在低维表示中保留丰富知识的能力。然而,GNN在可靠性方面存在挑战,包括OOD泛化能力、公平性和可解释性。为了解决这些问题,研究人员开始将因果学习纳入可信赖图神经网络(TGNN)的开发中。
算法进阶
2024/05/21
8640
可信赖图神经网络综述!图的因果学习!
基于潜在结果框架的因果推断入门(下)
上一节详细介绍了在三类基本假设下的各种因果推断方法,然而在实践中,对于某些特定场景下的应用,例如包含依赖性网络信息、特殊数据类型(如时间序列)或特殊条件(例如存在未观测混杂因子)时,三类假设并不总是能全部满足。本节将介绍在这些假设不满足情况下的因果推断方法。
口仆
2021/06/22
3.4K0
基于潜在结果框架的因果推断入门(下)
了解动态因果模型和动态因果建模(Dynamic Causal Modeling)
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/
叶庭云
2024/05/24
1.8K0
因果推断笔记——因果图建模之微软开源的dowhy(一)
github地址:microsoft/dowhy dowhy 文档:DoWhy | An end-to-end library for causal inference
悟乙己
2021/12/07
3.6K3
因果推断笔记——因果图建模之微软开源的dowhy(一)
因果推断笔记——CV、机器人领域因果推断案例集锦(十)
之前一篇是写在数据科学领域使用因果推断的案例,因果推断笔记——数据科学领域因果推断案例集锦(九) 主要应用的领域在:智能营销、一些机制干预的有效性、智能补贴等,那么可以看看在不常见领域的案例,拓宽一下视野。
悟乙己
2021/12/07
1.4K0
因果推断笔记——CV、机器人领域因果推断案例集锦(十)
Science Advances:社会和健康科学中用于描述、预测和因果推理的机器学习方法
社会和健康科学中使用的机器学习(ML)方法需要符合描述、预测或因果推理等预期研究目的。本文通过结合这些学科的统计分析的必要要求,为社会和健康科学中的研究问题与适当的ML方法进行了全面、系统的元映射。作者将已建立的分类映射到描述、预测、反事实预测和因果结构学习,以实现共同的研究目标,如估计不良社会或健康结果的流行率、预测事件的风险、识别不良结果的风险因素或原因,并解释通用的ML性能指标。这种映射可能有助于充分利用ML的好处,同时考虑与社会和健康科学相关的特定领域方面,并希望有助于加速ML应用的普及,以推进基础和应用社会和健康科学研究。
悦影科技
2023/01/25
7990
深度学习后,图灵奖得主Bengio研究核心是什么?因果表示学习
但在过去数年,两者开始互相借鉴,推进彼此的发展。如机器学习领域的蓬勃发展促进了因果推理领域的发展。采用决策树、集成方法、深层神经网络等强大的机器学习方法,可以更准确地估计潜在结果。在机器之心 2018 年的报道文章中,图灵奖得主、因果关系模型倡导者之一 Judea Pearl 也探讨了当前机器学习理论的局限性以及来自因果推理的七个启发。
机器之心
2021/03/15
4450
深度学习后,图灵奖得主Bengio研究核心是什么?因果表示学习
微软因果推理框架DoWhy入门
人类的大脑有一种非凡的能力,能将原因与特定的事件联系起来。从选举的结果到掉在地板上的物体,我们不断地把引起特定效果的一系列事件联系起来。神经心理学将这种认知能力称为因果推理。计算机科学和经济学研究一种特殊形式的因果推理,称为因果推理,主要研究两个观察变量之间的关系。多年来,机器学习产生了许多用于因果推理的方法,但它们在主流应用中大多难以使用。最近,微软研究院(Microsoft Research)开发了一个用于因果思维和分析的框架DoWhy。
AiTechYun
2019/06/21
4.5K0
微软因果推理框架DoWhy入门
推荐阅读
贝叶斯网络的因果关系检测(Python)
1.9K0
因果图模型:理解因果关系的强大工具
1.3K0
揭开因果图模型的神秘面纱:常用的因果图模型
2.3K0
专题|Python贝叶斯网络BN动态推理因果建模:MLE/Bayes、有向无环图DAG可视化分析呼吸疾病、汽车效能数据2实例合集
7240
集成20+先进算法,优于GPT-4o,自主因果分析智能体来了
1480
【NSR特别专题】张坤:学习因果关系和基于因果关系的学习「全文翻译」
2K0
基于潜在结果框架的因果推断入门(上)
3.9K0
因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二)
4.8K0
因果推断笔记——自整理因果推断理论解读(七)
11.6K0
九章云极DataCanvas YLearn因果学习开源项目:从预测到决策
6860
因果推断笔记——数据科学领域因果推断案例集锦(九)
5.4K0
用预测编码实现因果推断
3760
可信赖图神经网络综述!图的因果学习!
8640
基于潜在结果框架的因果推断入门(下)
3.4K0
了解动态因果模型和动态因果建模(Dynamic Causal Modeling)
1.8K0
因果推断笔记——因果图建模之微软开源的dowhy(一)
3.6K3
因果推断笔记——CV、机器人领域因果推断案例集锦(十)
1.4K0
Science Advances:社会和健康科学中用于描述、预测和因果推理的机器学习方法
7990
深度学习后,图灵奖得主Bengio研究核心是什么?因果表示学习
4450
微软因果推理框架DoWhy入门
4.5K0
相关推荐
贝叶斯网络的因果关系检测(Python)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档