Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >拯救数据科学的“半贝叶斯人”

拯救数据科学的“半贝叶斯人”

作者头像
大数据文摘
发布于 2019-08-08 10:07:59
发布于 2019-08-08 10:07:59
5020
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘出品

来源:towardsdatascience

编译:赵伟、张秋玥、钱天培

一位科学家在他的论文中写道:"人类知识的大部分是围绕因果关系而不是概率关系组织的,而概率微积分的语法并不足以描述这些关系......正因如此,我认为自己只是半个贝叶斯人"。

或许一场关于自然语言处理的精彩辩论可以告诉我们何谓“半个贝叶斯人”,让我们把时光拨回到几年前。

一场精彩的辩论

辩论的双方分别是:号称“现代语言学之父”Noam Chomsky、身为谷歌研发总监的Peter Norvig。他们分别是自然语言处理领域的旧派和新派代表。

当谈到该领域的发展方向时,Chomsky说到:

“想象一下,有人说他想要消灭物理系并转而使用‘正确’的方式。所谓‘正确’的方式是将真实世界发生的事情录制成无数录像带,然后将这数十亿字节的数据输入最大、最快的计算机,并进行复杂的统计分析 - 你知道的,对所有东西都用一下贝叶斯方法 - 你就能对接下来会发生的事情做一些预测。事实上,你做的预测会比物理学家能给出的好得多。“如果‘成功’被定义为对大量混乱的未分析数据的合理近似,那么这样做的结果比物理学家的更接近‘成功’。显而易见,这样一来,诸如绝对光滑平面之类的思想实验就不复存在了。但这样做,你将不会得到科学所一直致力于达到的那种理解水平 - 你所得到的只是对正在发生的事情的近似。”

Chomsky在许多其他场合也强调了这种观点:当前对‘成功’自然语言处理的定义 —— 即预测准确性 —— 并不科学。将“一些巨大的语料库”投入到“复杂的机器”,仅仅是“未分析数据的近似处理”简直就像撞大运,并不能使我们“真正理解”语言。

他认为,科学的首要目标是发现关于系统实际运作的“解释性原理”,而实现目标的“正确方法”则是“让理论引导数据”:通过精心设计的实验抽离掉“不相关干扰”,以此来研究系统的基本性质 - 就像自伽利略以来的现代科学研究方法一样。简而言之:“只处理待分析的混乱数据不太可能让你明白任何原理,就算你是伽利略也不行。”

Norvig随后以一篇长文回应了Chomsky的主张,这篇文章挑战了Chomsky在科学上的‘成功’的观念,并为使用概率模型象征人类语言处理进行了辩护。Norvig指出,语言处理中几乎所有主要的应用领域 - 搜索引擎、语音识别机器翻译和问答 - 都是由训练有素的概率模型主导,因为它们比基于理论/逻辑规则的旧工具表现得更好。

他认为,Chomsky关于科学上的“成功”的标准 - 强调找到原因而忽视方法的重要性 – 是误入歧途,这可以引用Richard Feynman的话加以说明:“没有论证,物理学可以进步;但没有事实,我们寸步难行。”

说起来其实还挺low的,Norvig顺带提了一句 - 概率模型“每年创造数万亿美元的收入,而Chomsky理论的产物几亿美元都不到。” (注:数据来自在亚马逊上Chomsky著作的销售额)

Norvig揣测,Chomsky对“对一切应用贝叶斯方法”的蔑视实际上来自于Leo Breiman所描述的统计模型中两种文化之间的分裂。

1)数据建模文化,它假设自然是一个内部变量随机联系的黑箱,建模者的任务就是确定最符合这些联系的模型;

2)算法建模文化,它假设黑箱中的关联太复杂而不能用简单模型来描述,此时建模者的任务就是使用能最好地用输入量估计输出量的算法,而不再期望黑箱内变量真正的潜在联系可以被理解。

Norvig认为Chomsky可能对概率模型(数据建模文化)本身并没有什么意见,他只是针对具有“亿万参数”且难以解释的算法模型,因为它根本无法解决“为什么”的问题。

Norvig属于2号阵营,他们认为像语言这样的系统过于复杂、随机,很难用一小组参数来表示;抽离出复杂性就类似于制造一个实际上不存在的、“完全符合永恒领域的神秘设施”,因此“忽略了语言是什么以及它是如何工作的。”

Norvig在另一篇论文中重申,“我们应该停止以创造完美理论为目的的行为。我们应当拥抱系统复杂性、并接受数据就是有用的这一特点。”。他指出,在语音识别、机器翻译甚至是几乎所有使用网页数据的机器学习应用中,例如基于数百万计具体特征的n-gram统计模型或线性分类器的这些简单模型,比试图发现普遍规律的精美模型表现更好。

这次辩论最让人们受触动的不是Chomsky和Norvig的分歧,而是他们的共识:他们都同意,不试图去理解变量就用统计学习方法分析大量数据往往会产生比试图给变量之间的关系建模更好的预测效果。

而且我们也并非唯一被这一现象困扰的人:那些被访谈过许多的具有数学科学背景的人也认为这是违反直觉的 - 最符合事物基本结构关系的方法难道不应该也是预测得最为准确的吗?我们怎么能在不知道事物如何实际运作的情况下做精准的预测呢?

预测与因果推论

即使在经济学和其它社会科学等学术领域,预测能力和解释能力的概念也通常被混为一谈 - 显示出高解释力的模型通常被认为是具有高度预测性的。但是,构建最佳预测模型的方法与构建最佳解释模型的方法完全不同,建模决策通常要考虑两个目标之间的权衡。为了说明这两种方法上的差异,下面是“An Introduction to Statistical Learning”(ISL,统计学习导引)中一段关于预测和推理建模的简短摘要。

预测建模

预测模型的基本原理相对简单,使用一组已知的输入X来估计Y。如果X的误差项平均为零,则可以使用以下方法预测Y:

其中ƒ是由X提供的关于Y的系统信息,当给定X时,它给出结果Ŷ(Y的预测)。只要能准确地预测Y,ƒ的确切函数形式通常是不重要的,它被视为“黑箱”。

这种模型的准确度可以分解为两部分,可减少的误差和不可减少的误差:

为了提高模型的预测准确性,模型主要目标是通过使用最合适的统计学习技术来使可减少的误差最小,从而估计ƒ。

推理建模

当我们的目标是理解X和Y之间的关系,比如Y是如何作为X的函数而变化时,ƒ不能被视为“黑箱”,因为我们无法在不知道函数形式的情况下理解X对Y的影响ƒ。

几乎总是如此,在推理建模时,使用参数化方法来估计ƒ。参数化是指通过假设参数形式的ƒ并通过假设的参数来简化对ƒ的估计的方法。这种方法有两个一般步骤:

  1. 假设ƒ的函数形式。最常见的假设是ƒ是关于X的线性函数:
  1. 使用数据拟合模型,也即找到参数值β0、β1、...、βp,使得:

最常用的拟合模型的方法是普通最小二乘法(OLS)。

灵活性/可解释性的权衡

你可能已经在想:我们怎么知道ƒ是否具有线性形式?因为ƒ的真实形式是未知的,我们也不知道,如果我们选择的模型与真实的ƒ相差太远,那么估计就会有偏差。那为什么我们要先做出如此肯定的假设呢?这是因为模型的灵活性和可解释性之间存在内在的权衡。灵活性是指模型可以生成的用以适应ƒ的多种不同的可能函数形式的形状范围,因此模型越灵活,它产生的形状就能符合得越好,预测精度就越高。但是更灵活的模型通常更复杂并且需要更多参数来拟合,并且ƒ的估计通常变得太复杂以至于任何预测因子的关联都难以解释。另一方面,线性模型中的参数相对简单且可解释,即使它在准确预测方面做得不是很好。这是ISL中的一张图表,它说明了不同统计学习模型中的这种灵活性-可解释性之间的权衡:

正如你所看到的,具有更好预测精度、同时也更灵活的机器学习模型(例如支持向量机和Boosting方法)的可解释性非常低。对ƒ的函数形式进行较肯定的假设使模型更具解释性,推理建模在这个过程中也放弃了对预测准确性的追求。

因果识别/反事实推理

但是,请等一等!即使用了能很好符合并且高度可解释的模型,你仍然不能将这些统计数据用作证明因果关系的独立证据。这是因为,“相关性不是因果关系”啊!这里有一个简单的例子:假设你有一百个旗杆及其阴影的长度和太阳位置的数据。你知道阴影的长度是由杆的长度和太阳的位置决定的,但是即便你将杆的长度设置为因变量而把阴影长度作为自变量,你的模型仍然会十分符合统计显著性系数。显然,你不能说杆子的长度受阴影长度影响。这就是为什么我们不能仅通过统计模型进行因果推理,我们还需要背景知识和理论来证明我们的结论。因此,因果推理的数据分析和统计建模通常要受到理论模型的严格指导。

即使你确实有一个坚实的理论依据说X导致Y,确定因果关系仍然非常棘手。这是因为,评估因果效应涉及要识别在没有发生X的“反事实世界“里会发生什么,这显然是你观察不到的。

这还有另一个简单的例子:设想一下你要确定维生素C对健康的影响。你有某人是否服用维生素的数据(如果他们这样做则X = 1;否则为0),以及一些二元化的健康状况(如果他们健康则Y = 1;否则为0),如下所示:

Y1代表服用维生素C的人的健康状况,Y0代表那些不服用维生素C的人的健康状况。为了确定维生素C对健康的影响,我们要估计平均治疗效果:

? = E(Y₁)- E(Y₀)

但是为了做到这一点,我们需要知道不服用维生素C、但原本有服用维生素C的人的健康状况,反之亦然(或E(Y0 | X = 1)和E (Y1 | X = 0)),表中的星号表示不可观察的反事实结果。没有这些输入,我们就不能一致地评估平均治疗效果(θ)。

更糟糕的是,想象一下这种情况:健康的人往往服用维生素C,不健康的人则不会。在这种情况下,即使维生素C实际上对健康没有任何影响,恐怕也会显示强烈的治疗效果。在此,先前的健康状况被称为影响维生素C摄入和健康状况(X和Y)的混淆因素,这导致对?估计的偏差。

产生?的相合估计的最安全的方法是通过对治疗进行随机化实验,使X独立于Y。当随机分配治疗实验时,未治疗组结果的均值可以作为代表治疗组的反事实结果的无偏值,并可以保证这样做消除了混淆因素。A/B测试就以这个观点为指导。但是随机实验并不总是可行的(甚至可能是不道德的,比如如果我们想要研究吸烟或吃太多巧克力饼干对健康影响的话),在这些情况下,必须通过观察常常是非随机实验的数据来评估因果效应。有许多统计技术通过构建反事实结果或模拟观测数据中的随机治疗分配来识别非实验环境中的因果效应,但可以想象,这些类型的分析结果往往不是非常稳健或可重复。更重要的是,这些方法的造成障碍的层面并不是为了提高模型的预测准确性而设计的,而是为了通过结合逻辑和统计推断来提出因果关系的证据。

评价预测模型是否成功比因果模型要容易得多 ——预测模型有标准的性能度量,但评估因果模型的相对成功要困难得多。但即使因果推理很棘手,也并不意味着我们应该停止尝试。预测模型和因果模型有着非常不同的目的,需要非常不同的数据和统计建模过程,通常这两点同时发生。这一关于电影业的例子说明了这一点:电影制片厂使用预测模型来预测票房收入,以预测电影发行的票房结果,评估其电影放映组合的金融风险/回报等。但预测模型在理解电影市场的结构和动态并为投资决策提供信息方面不是很有用。这是因为在电影制作过程的早期阶段(通常是发布日期之前的好几年),当做出投资决策时,可能的票房结果的方差非常高,因此基于早期阶段输入数据的预测模型的准确性要大为降低。预测模型在电影发行日期附近才是最准确的,然而这个时候绝大多数制作决策已经被制定,预测也就失去了行动指导力。另一方面,因果推理建模允许制片商了解到,不同的生产特征如何影响生产过程早期阶段的潜在收入,因此对于帮助制定其策略至关重要。

我们真的过分强调预测嘛?

从定量研究文献的现状来看,不难看出为什么Chomsky感到不安 - 预测模型现在主导着学术界和业界。对学术预印本的文本分析发现,在增长最快的定量研究领域中,近十年来越来越关注预测。例如,在AI中,提及与“预测”相关的术语的论文数量增长了2倍以上,而提及与“推理”相关的术语的论文数量自2013年以来已经下降了一半。现今的数据科学课程在很大程度上忽略了因果推理方法,并且数据科学业界大多期望从业者专注于预测模型。即使像Kaggle和Netflix大奖赛这样高调的数据科学竞赛也总是专注于改进预测性能指标。

另一方面,仍有许多领域没有对经验预测给予足够的重视,尽管它们可以从机器学习和预测建模方面的进步中受益。

但是,把目前的状况描述为“Chomsky队”和“Norvig队”之间的文化战争似乎是一个错误的选择 —— 谁说我们只能二选一的呢,在很多时候这两种观点会相互交流相互促进。

为了让机器学习模型更易于理解,我们能做得还有很多。比方说,我对斯坦福大学Susan Athey在因果推理方法中应用机器学习技术的工作尤其感兴趣。

最后,我想以Judea Pearl的大作《The book of why》中的结论做结尾。Pearl曾于20世纪80年代领导了AI研究工作,以便让机器可以使用贝叶斯网络进行概率推理;但自那时起他便成为AI只关注概率关联风气的最大批评者,认为这样会阻碍这个领域的发展进步。

与Chomsky的观点相仿,Pearl认为“深度学习取得的所有璀璨成就仅仅相当于数据拟合曲线”,而直到今天AI仍在做与机器30年前就会做的同样的事情(预测和诊断/分类),现在只是表现得稍好一点,但预测和诊断“仅仅是人类智慧的一角。”

他认为,制造真正的能像人类一样思考的智能机器的关键,是教会机器思考因果关系,这样机器就可以提出反事实问题、设计实验,并找到科学问题的新答案。他过去三十年的工作重点是为机器建立形式语言,以便使因果推理成为可能;这类似于他在贝叶斯网络上所做的工作,其能使机器建立概率关联。

相关报道:

https://towardsdatascience.com/predicting-vs-explaining-69b516f90796

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
可信赖图神经网络综述!图的因果学习!
本文综述了图神经网络(GNN)在图挖掘应用中的最新进展,并强调了其在低维表示中保留丰富知识的能力。然而,GNN在可靠性方面存在挑战,包括OOD泛化能力、公平性和可解释性。为了解决这些问题,研究人员开始将因果学习纳入可信赖图神经网络(TGNN)的开发中。
算法进阶
2024/05/21
7650
可信赖图神经网络综述!图的因果学习!
《自然语言处理中的因果推理》综述论文,以色列理工、谷歌等13位NLP大牛阐述因果推理NLP的估计、预测、解释和超越
科学研究的一个基本目标是了解因果关系。然而,尽管因果关系在生命和社会科学中发挥着关键作用,但在自然语言处理(NLP)中却没有同等的重要性,后者传统上更重视预测任务。随着因果推理和语言处理融合的跨学科研究的兴起,这种区别正开始消失。然而,关于NLP中因果关系的研究仍然分散在各个领域,没有统一的定义、基准数据集和对剩余挑战的清晰表述。
新智元
2021/09/17
7770
为什么每个数据科学家都要读一读Judea Pearl的《The Book of Why》
我热衷于机器学习已经有 4 个年头,对深度学习感兴趣也有一年了。我构建了用于娱乐和工作的预测模型,也了解很多算法,从梯度提升(gradient boosting)这种传统模型到LSTM 这种很深的模型。尽管习得了很多算法,但是我的困惑依然存在。
机器之心
2019/04/09
1.5K0
为什么每个数据科学家都要读一读Judea Pearl的《The Book of Why》
NLPer,是时候重视因果推理了!这有一份杨笛一等撰写的综述
机器之心报道 编辑:张倩 在这篇综述论文中,来自佐治亚理工学院的杨笛一等十几位研究者系统阐述了自然语言处理中的因果推理。 科学研究的一个基本目标是了解因果关系。然而,尽管因果在生活和社会科学中扮演了重要角色,它在 NLP 中却没有得到同样重要的地位,后者通常更加重视预测任务。随着因果推理和语言处理交叉研究领域的出现,二者之前的界限正变得模糊,但 NLP 中的因果推理研究仍然分散在各个领域,没有统一的定义、基准数据集和对剩余挑战的清晰表述。 在这篇综述论文中,来自以色列理工学院的 Amir Feder、佐治亚
机器之心
2023/03/29
2690
NLPer,是时候重视因果推理了!这有一份杨笛一等撰写的综述
因果推断笔记——数据科学领域因果推断案例集锦(九)
这部分只是抛砖引玉贴一些看到的非常好的业内方案。 因果推断在很多领域都有很有意思的应用,值得收藏。
悟乙己
2021/12/07
5K0
因果推断笔记——数据科学领域因果推断案例集锦(九)
重磅!Nature子刊发布稳定学习观点论文:建立因果推理和机器学习的共识基础
整理丨AI科技评论 2月23日,清华大学计算机系崔鹏副教授与斯坦福大学Susan Athey(美国科学院院士,因果领域国际权威)合作,在全球顶级期刊Nature Machine Intelligence(影响因子IF=15.51,2020)上发表题为“Stable Learning Establishes Some Common Ground Between Causal Inference and Machine Learning”(稳定学习:建立因果推理和机器学习的共识)的观点论文。深入探讨和总结了因果
AI科技评论
2022/03/03
9640
观点 | Judea Pearl:传统机器学习尚处于因果层级的底层,达成完备AI的7个工具
机器学习的巨大成功带来了 AI 应用的爆炸式增长以及对具备人类级别智能的自动化系统不断增长的期望。然而,这些期望在很多应用领域中都遇到了基本的障碍。其中一个障碍就是适应性或鲁棒性。机器学习研究者注意到当前的系统缺乏识别或响应未经特定编程或训练的新环境的能力。人们在「迁移学习」、「域适应」和「终身学习」[Chen and Liu 2016] 这些方向进行大量理论和实验研究就是为了克服这个障碍。
机器之心
2018/07/26
5880
观点 | Judea Pearl:传统机器学习尚处于因果层级的底层,达成完备AI的7个工具
ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策
今天为大家介绍的是来自卡内基·梅隆大学的Eric P. Xing团队的一篇论文。可解释策略学习旨在从观察到的行为中估计可理解的决策策略;然而,现有模型在准确性和可解释性之间存在权衡,这限制了基于数据的人类决策过程的解释。从根本上说,现有方法之所以受到这一权衡的困扰,是因为它们将底层决策过程表示为一个通用策略,而实际上人类决策是动态的,可以在不同情境下发生显著变化。因此,作者开发了情境化策略恢复(CPR),将复杂决策过程的建模问题重新定义为一个多任务学习问题,每个情境代表一个独特的任务,可以通过多个简单的情境特定策略逐步构建复杂的决策策略。CPR将每个情境特定策略建模为一个线性映射,并随着新的观测数据的加入生成新的策略模型。作者提供了两种CPR框架的实现方式:一种侧重于精确的局部可解释性,另一种保留了完整的全局可解释性。作者通过模拟数据和实际数据进行了评估,在预测重症监护病房中的抗生素处方和预测阿尔茨海默症患者的MRI处方方面,达到了最先进的性能。通过这一改进,CPR弥合了可解释方法和黑箱方法之间的准确性差距,允许对情境特定决策模型进行高分辨率的探索和分析。
DrugAI
2024/07/16
1620
ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策
贝叶斯网络之父Judea Pearl:新因果科学与数据科学、人工智能的思考
本文介绍贝叶斯网络之父 Judea Pearl 《新因果科学与数据科学、人工智能的思考》的报告。
数据派THU
2020/06/28
3640
贝叶斯网络之父Judea Pearl:新因果科学与数据科学、人工智能的思考
Nat. Mach. Intel. | 基于真实世界患者数据的药物重定位的深度学习框架
今天给大家介绍俄亥俄州立大学计算机科学与工程系的Ruoqi Liu等人于2021年1月4号发表在Nature Intelligence machine上的一篇文章:A deep learning framework for drug repurposing via emulating clinical trials on real-world patient data. 在这项研究中,作者遵循随机临床试验设计的方案,并通过使用真实世界数据明确模拟相应的临床试验,通过计算筛选出候选药物以获得有益效果。考虑到真实世界数据的固有特征(即时间序列数据和现有的混淆变量),作者用深度学习和因果推理方法来控制真实世界数据中的混淆因素,并系统地评估药物对各种疾病疗效的影响。
DrugAI
2021/02/01
1.1K0
Nat. Mach. Intel. | 基于真实世界患者数据的药物重定位的深度学习框架
机器学习真能产生智能决策吗?
历经三年时间,我们在2022年完成了图灵奖获得者、加州大学洛杉矶分校计算机科学教授,美国国家科学院院士,被誉为“贝叶斯网络之父”的朱迪亚·珀尔大作《因果论:模型、推理和推断》。
AI科技大本营
2022/12/10
4000
机器学习真能产生智能决策吗?
图灵奖得主、贝叶斯之父 Judea Pearl 谈深度学习局限,想造自由意志机器人
【新智元导读】人工智能领域最高荣誉图灵奖的获得者,贝叶斯之父 Judea Pearl 日前接受 Edge 的采访。他谈到自己发明贝叶斯理论的过程,谈到了当下火热的深度学习的几个局限,也说到了自己的研究兴趣:希望开发拥有自由意志的机器人。他认为,决策理论也许是创造出人类智慧的一个方式。 文章要点 20世纪80年代,当我们从基于规则的系统过渡到贝叶斯网络的时候,产生了一种新的思想。贝叶斯网络是一种概率推理系统。专家可以把自己对所在领域的专业知识输入其中。领域可以指疾病或者石油,这和专家系统的目标是一致的。 这
新智元
2018/03/26
1K0
独家 | 清华崔鹏团队KDD论文一作解读:在大数据背景下进行因果效应评估
AI科技评论按:ACM SIGKDD 国际会议(简称KDD)是由ACM的知识发现及数据挖掘专委会(SIGKDD)主办的数据挖掘研究领域的顶级学术会议。AI科技评论今年也来到了KDD 2017现场做了覆盖和报道。参与本次KDD的清华大学博士生况琨受AI科技评论独家邀请,介绍他与导师杨士强博士、崔鹏博士、黎波(清华大学)和蒋朦(UIUC)的工作《Estimating Treatment Effect in the Wild via Differentiated Confounder Balancing》。
AI科技评论
2018/03/14
1.7K0
独家 | 清华崔鹏团队KDD论文一作解读:在大数据背景下进行因果效应评估
Nature | 数据驱动的地球系统深度学习与过程理解
Title:Deep learning and process understanding fordata-driven Earth system science
郭好奇同学
2021/12/06
2K0
Nature | 数据驱动的地球系统深度学习与过程理解
Science Advances:社会和健康科学中用于描述、预测和因果推理的机器学习方法
社会和健康科学中使用的机器学习(ML)方法需要符合描述、预测或因果推理等预期研究目的。本文通过结合这些学科的统计分析的必要要求,为社会和健康科学中的研究问题与适当的ML方法进行了全面、系统的元映射。作者将已建立的分类映射到描述、预测、反事实预测和因果结构学习,以实现共同的研究目标,如估计不良社会或健康结果的流行率、预测事件的风险、识别不良结果的风险因素或原因,并解释通用的ML性能指标。这种映射可能有助于充分利用ML的好处,同时考虑与社会和健康科学相关的特定领域方面,并希望有助于加速ML应用的普及,以推进基础和应用社会和健康科学研究。
悦影科技
2023/01/25
7670
因果图模型:理解因果关系的强大工具
在科学研究中,理解变量之间的因果关系至关重要。因果关系帮助我们不仅了解事物之间的关联,还能解释为什么这些关系存在。例如,医生想知道某种药物是否能有效治疗疾病,政策制定者想知道新的教育政策是否能提高学生成绩。因果图模型(Causal Graph Model)为我们提供了一种系统的方法来表示和推理这些因果关系。本文将详细介绍因果图模型的基本概念、组成部分、建立方法、因果推理和实际应用,帮助读者理解和使用这一强大工具。
theskylife
2024/07/31
1.1K0
[译文]实用性 vs 理解力:进入 2022 年的机器学习领域
原文标题:Utility vs Understanding: the State of Machine Learning Entering 2022 原文作者:Aidan Cooper
zhonger
2022/10/28
3590
[译文]实用性 vs 理解力:进入 2022 年的机器学习领域
因果推断的未来
来源:因果推断本文约5700字,建议阅读5分钟因果推理方法正在呈指数级增长。 在过去的几十年里,因果推断理论、方法和一系列的应用方面的发展取得了重大的成就。现代因果推断的基础进展来自于不同的领域,包括流行病学、生物统计学、统计学、计算机科学和经济学。开创性工作主要包括詹姆斯·赫克曼(James Heckman)、朱迪亚·珀尔(Judea Pearl)、詹姆斯·罗宾斯(James Robins)、保罗·罗森鲍姆(Paul Rosenbaum)和唐纳德·鲁宾(Donald Rubin)以及其他一些人的工作,尤其
数据派THU
2023/03/29
4360
因果推断的未来
揭开因果图模型的神秘面纱:常用的因果图模型
因果图模型(Causal Diagram Models)是一种通过图形化方法表示变量之间因果关系的工具。它在统计学、社会科学、流行病学等研究领域中广泛应用。因果推断(Causal Inference)则是利用这些图模型来确定变量之间的因果关系,而不仅仅是关联关系。本文将介绍几种常见的因果图模型,探讨它们的使用范围、如何使用及其应用场景,并通过图形实例进行说明。
theskylife
2024/08/01
1.9K0
统计学权威盘点过去50年最重要的统计学思想,因果推理、bootstrap等上榜
作者 | 陈彩娴、Mr Bear 编辑 | 青暮 近日,图灵奖得主、“贝叶斯网络之父”Judea Pearl在Twitter上分享了一篇新论文“What are the most important
1480
2021/04/21
6500
统计学权威盘点过去50年最重要的统计学思想,因果推理、bootstrap等上榜
推荐阅读
可信赖图神经网络综述!图的因果学习!
7650
《自然语言处理中的因果推理》综述论文,以色列理工、谷歌等13位NLP大牛阐述因果推理NLP的估计、预测、解释和超越
7770
为什么每个数据科学家都要读一读Judea Pearl的《The Book of Why》
1.5K0
NLPer,是时候重视因果推理了!这有一份杨笛一等撰写的综述
2690
因果推断笔记——数据科学领域因果推断案例集锦(九)
5K0
重磅!Nature子刊发布稳定学习观点论文:建立因果推理和机器学习的共识基础
9640
观点 | Judea Pearl:传统机器学习尚处于因果层级的底层,达成完备AI的7个工具
5880
ICML 2024 | 情境化的策略恢复:用自适应模仿学习来建模和解释医疗决策
1620
贝叶斯网络之父Judea Pearl:新因果科学与数据科学、人工智能的思考
3640
Nat. Mach. Intel. | 基于真实世界患者数据的药物重定位的深度学习框架
1.1K0
机器学习真能产生智能决策吗?
4000
图灵奖得主、贝叶斯之父 Judea Pearl 谈深度学习局限,想造自由意志机器人
1K0
独家 | 清华崔鹏团队KDD论文一作解读:在大数据背景下进行因果效应评估
1.7K0
Nature | 数据驱动的地球系统深度学习与过程理解
2K0
Science Advances:社会和健康科学中用于描述、预测和因果推理的机器学习方法
7670
因果图模型:理解因果关系的强大工具
1.1K0
[译文]实用性 vs 理解力:进入 2022 年的机器学习领域
3590
因果推断的未来
4360
揭开因果图模型的神秘面纱:常用的因果图模型
1.9K0
统计学权威盘点过去50年最重要的统计学思想,因果推理、bootstrap等上榜
6500
相关推荐
可信赖图神经网络综述!图的因果学习!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档