Loading [MathJax]/jax/output/CommonHTML/autoload/mtable.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >随机过程(9)——连续时间马尔科夫链的泊松过程描述,爆炸现象,离散马尔科夫链对比

随机过程(9)——连续时间马尔科夫链的泊松过程描述,爆炸现象,离散马尔科夫链对比

作者头像
学弱猹
发布于 2021-08-10 03:33:01
发布于 2021-08-10 03:33:01
2.3K0
举报

上一节笔记:随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入

————————————————————————————————————

大家好!告别2020年之后,希望2021年大家能够顺心顺意,似乎暴露了文章写作的时间哦……

这一节我们会继续介绍连续时间马尔科夫链,包括它的一些比较形象化的描述,它的极限性质等,就和我们之前讨论离散状态马尔科夫链一样。事实上到后面我们也会继续接触各式各样的排队论模型,连续时间马尔科夫链在排队论中的应用同样十分广泛。

那么我们开始吧。

目录

  • 连续时间马尔科夫链的转移速率应用
  • 转移速率的形象化描述
    • 爆炸现象
  • 连续时间马尔科夫链的平稳分布

连续时间马尔科夫链的转移速率应用

首先声明一下,这里的转移速率(transition rate)的概念,其实就是上一节所提到的跳跃速率(jump rate),很多时候两个概念会混着用。

在上一节的最后我们给大家展示了转移速率和C-K方程的联系,合理利用它们俩可以帮助我们求解连续时间马尔科夫链的转移概率矩阵。考虑到马尔科夫链中,转移概率矩阵是一个核心工具,因此在连续时间马尔科夫链中,刻画出转移速率矩阵就成为了一个很重要的任务。这一部分我们就简单的举两个例子,给大家加深一些印象。

Problem 1: 考虑一个速率为

λ

的泊松过程,证明

q(n,n+1)=λ,n0

这个其实就是上一节的例子(Problem 3)。这里就不多费笔墨去说这一件事了。

Problem 2: 考虑排队论中的

M/M/s

模型,也即顾客到达服从一个速率为

λ

的泊松过程,而服务时间服从一个速率为

μ

的泊松过程,二者相互独立。一共有

s

服务器,那么在这个场景下,刻画整个系统中的人数,其对应的转移速率为

q(n,n+1)=λ

如果到达的速率服从泊松过程的话,

其实就是Problem 1的复用,没有太多需要强调的地方。但是

对应的是什么情况呢?自然就是系统中有人离开的情况了。在这个时候,我们将系统中的人数分情况做讨论,就可以看出一些端倪。

首先如果

,事实上对应的是服务器未满载的情况。那么这个时候,可以想像

个服务器中,只有

个在服务,那么“离开”这一件事情要等待的时间,其实就是所有的正在服务的人,要等待的最小值。如果说每一个的时间是

的话,那么这个“离开”发生所需要的等待时间就是

,自然也是服从一个指数分布(这个是一个概率论的结论,后面单独说)。而这个指数分布的参数对应的就是

。那么既然等待时间是指数分布,整个过程就是一个泊松过程,所以复用一下Problem 1的结论就可以了。

同样的思路,如果

,那么服务器满载,所以

个都会服务,那么对应的参数就是

最后我们来说一下这个指数分布的概率论中的结论。

Lemma 1: 若

,那么

这可以直接利用分布函数来推得,是概率论的内容。如果这个不会的话,可能就需要回去复习一下概率论中的最小值分布了。

转移速率的形象化描述

因为脱去了“步数”这么一个具体的概念,所以很多时候会导致连续时间马尔科夫链不是特别好想。这里我们提供了三个常见的对于转移速率的形象化描述。

首先来看第一种描述。

Description 1: 考虑平面上的点,那么假如说一开始,一个跳蚤在点

,对每一个

,假设经过

的时间,跳蚤就会跳到点

。但跳蚤最终跳到哪里,取决于到哪儿所需要的时间最短,那么可以说明的是,跳蚤所在的点对应的转移概率

满足

画一张图来表示一下这个过程。

第一次,因为跳到

要等的时间更短,所以就先跳到了

对这个问题如何建模呢?其实我们只需要关心怎么求

。这里就涉及到跳跃的统计问题。诚然,从

的跳跃会有很多种可能,因此我们先考虑一步到

的可能性。那么这样的话,实质上可以建模为

这表示在

的时间内,到达

所需要等待的时间最短,其它的等待时间都不在

以内。

那么自然的,对它求极限和除法,就会有

那么两步及以上的情况呢?这里要说明的是它本身是一个

的高阶小量,细节上不太好说,这里提供一个思考视角。注意到两步其实就是“一步又一步”的含义。前后的独立性带来的概率的乘积,会将两个

的线性项乘起来,这就变成二阶,也就是高阶无穷小了。

因此我们可以看出,这个描述的其实就是一个转移速率矩阵为

的连续时间马尔科夫链。

Description 2: 考虑一个跳蚤一开始在点

,那么从其离开

需要等待

的时间,其中

。其跳到

的概率为

。此描述对应的随机过程与Description 1相同。

如果说它和Description 1相同,其实一开始不容易让人信服,毕竟,第一个可以看出,跳跃到具体哪一个点是受所有的点制约的。但是这一个似乎就把这个”相互关系“给剥离掉了。这是什么情况呢?事实上这也是一个概率论的性质,这个性质要说明起来还是有点难度,我们仔细看一下。

Lemma 2: Exponential Race 设

,相互独立。

,那么有

,并且

相互独立。

这里相对有些反人类的地方就是

相互独立,简单来说,“第一个到达的点的时间”和“第一个到达的点是谁”没有联系。这在这两个随机变量都和

有关的情况下就显得更加的反直觉了。

要说明这一点,其实也就是概率论的定义。注意到

注意到分离变量,这就完成了证明。

这个命题可以说明的一点是,用Description 2来描述这个过程,和用Description 1来描述是一模一样的。这只是同一个结论用了两段不同的话语去说而已。

事实上,还有一个Description 3,可以理解为它是Description 2的一个标准化。

Description 3: 考虑一个跳蚤一开始在点

,那么从其离开

需要等待

的时间,其中

,并且

与之前的定义一样。其跳到

的概率为

。并且

。此描述对应的随机过程与Description 1相同。

一般来说,我们会把它称为是Description 2的一个“归一化”。直观来看,相当于我们把所有的

都统一了起来,统一为一个“离开时间”(但是注意,这个时候是有可能这个点不会离开的,因此叫离开时间可能并不准确)。

至于为什么说这个描述也是正确的,就需要参考上一节的Problem 2。在Problem 2我们描述了一个随机过程

。其中

就是一个泊松过程,而

是一个离散马尔科夫链,转移概率为

在上一节的Problem 2-2,我们也给出了这个随机过程的转移概率

。事实上,如果我们把这些数据代入公式计算,会发现转移速率矩阵和Description 1是相同的,因此它确实是一个合理的描述连续时间马尔科夫链的方案。至于这个验证过程,我们就交给读者了。

Description 3还有一个优势在随机模拟上。在计算统计中经常会出现需要模拟一条随机过程的情况(比方说MCMC),而这个方案相对来说是最好实现的。

最后总结一下,因为我们相当于把一条连续时间马尔科夫链给建模成了一条泊松过程,所以一切之前与泊松过程有关的性质,结论,都可以应用到这里的连续时间马尔科夫链上。这也是为什么之后介绍它与离散马尔科夫链的联系的时候,我们很多时候可能只会寥寥几笔带过,因为所需要的工具,之前都铺垫的差不多了。

爆炸现象

这里的爆炸(explosion)现象自然不可能是物理中的原子弹爆炸,也不可能是化学中的活泼金属遇水爆炸,而是一种特殊的状态转移现象。即

有限时间内,状态转移发生了无限次。

如果这种现象发生,就说明所有的状态转移,都发生在有限的一段时间内。这在随机模拟中自然是一个不可接受的现象,同样这也不会在离散马尔科夫链中发生,因为在离散情况下根本没有时间的概念

我们来看一个具有爆炸现象的例子。

Problem 3: Pure Birth 考虑一个生命链,也即

,其余均为0。并假设从

开始。那么考虑

为跳转

次状态经过的时间,说明如果

,那么会发生爆炸现象。

直观来看,容易猜出

应该是一个合理的答案,因为这个时候,可以看出转移速率呈现指数上升的趋势。因此可以想像,到最后,跳转的速度就越来越快,一直到最后可能就会一发不可收拾。

首先是

的情况,这个时候,我们来考察

,注意到

数分中我们学过,这是一个p-级数。简单来说,

的时候,这个级数是收敛的。那么高等概率论中有说过

简单来说,这个时候就出现了这种“几乎处处”极限时间为有限的情况,这也就是所谓的爆炸现象。

多说几句,如果

,其实也有一个有意思的事情,就是

。但是要注意,这个时候并没有

相关的结论。那么这里如果要看

的情况,一个粗略的办法是看它的波动,也就是方差。容易发现

是一个有限的数,所以利用切比雪夫(Chebyshev)不等式,我们有

那么再根据

,说明

比一个无穷要小的概率趋于0,那自然就说明了

。这也说明了,

的情况下,尽管移动的速率仍然会越来越快,但是因为不会有指数上升的趋势,所以依然可以使用随机模拟来模拟这个过程,不会有爆炸现象的发生。

好的,到此为止,我们就说完了对于连续时间马尔科夫链的基本刻画。在这之后,我们会利用这些性质,来推广一些离散马尔科夫链中已经涉及到的定理等内容。

连续时间马尔科夫链的平稳分布

很自然,这一节对标的就是离散马尔科夫链的对应内容。强调一遍,我们需要多次的与之前的离散马尔科夫链模型进行对比,所以如果对相关术语感到陌生,建议对之前的内容再多阅读阅读

随机过程(1)——引入,有限状态马尔科夫链,状态转移,常返与瞬时状态

随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链

随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明

随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间

回顾一下离散马尔科夫链的平稳分布定义,我们要求马尔科夫链是不可约的,非周期的,常返的。在连续时间马尔科夫链中,首先不再有周期的概念,其次其余的概念肯定也不能直接套用。所以这里需要对他们做一个重新的刻画。

Definition 1: Irreducible 对于连续时间马尔科夫链

而言,如果对任意的

都能在有限步内完成,也即

,使得

,那么称其不可约。

如果要说明为什么这个不可约的定义是合理的,只需要说明

即可。这个其实也不是特别困难,和离散马尔科夫链的思考过程类似,考虑一种状态转移的情况,首先将

转换为

,所以我们取一个很小的

,对区间分拆,就有

这个转移的过程相当于说,一开始从

的这中间经过的各个步骤,每一步都经过了时间

,然后到了最后的

的时候停留了一段时间(时间

)。那么注意到

(这是因为等待这个过程本身是一个泊松过程,所以这个概率就是一个指数分布的概率),所以自然的根据条件就可以得到这个结论。

这个区间分拆大概可以用图表示为这么一个意思。

下面我们来给定平稳分布的定义。

Definition 2: Stationary Distribution 如果满足

,那么称

是一个平稳分布。

自然地,我们也希望了解为什么

可以对应上离散马尔科夫链的平稳分布的定义。回顾一下,之前我们说过

是一个条件,那么两边求导就会有

。这是一个思路,总结一下就是

因为我们之前有提过

,当然这是需要假设

的情况下。

这是一个引发我们思考的思路,但很显然不是证明,因为还差另外一个方向。如果

,那么能不能推导出

这样的结论呢?其实也是可以的,因为我们有

那么这就说明了

,因为

。所以可以看出,两个方向的证明其实都利用了上一节提到的Kolmogorov方程。

现在我们再回头看一下

所想表达的意思。其实利用矩阵乘法,也不难发现它就是这么一个意思

当然第二个等号是因为我们之前有定义

,同样是在上一节我们定义跳跃速率的时候做的人工补充。

抽象一下,

就是从

出发,到其它各点的“加权速率和”,而

就是除

以外的点到达

的“加权速率和”。因此这里的“平稳”,就是“到达的速率”和“出去的速率”相同的意思。当然这个话术其实我们在离散马尔科夫链中就已经用过了,当时是使用转移概率矩阵来描述的。

一个比较好的对比技巧是,将这里的

和之前的

联系起来,比方说离散情况,其实平稳分布的定义就是

,这就可以和这里的公式对应上。

有了平稳分布之后,自然也可以很好的定义细致平衡条件(detailed balanced condition)和逆马尔科夫链(reversed Markov chain)。

Definition 3: Detailed Balanced Condition 如果

,那么称分布满足细致平衡条件。

类似的,满足细致平衡条件的分布肯定也是平稳分布,但是反过来不一定。这也是从离散马尔科夫链直接推导过来的结论。

Definition 4: Reversed Chain 定义

是原连续时间马尔科夫链的逆马尔科夫链。其中

从平稳分布出发。

这里的

其实是可以趋于无穷大的,因此这个定义并不代表这个随机变量只定义在区间

上。

对于它的转移速率相关的性质,也是和离散情况非常类似的。

Proposition 1 逆马尔科夫链的转移速率满足

可以看出,与离散的情况基本上相同。

要说明

是合理的,其实只需要说明

和离散情况一模一样的推导方式,我们直接可以得到

这里就不多解释了。

同样的,如果

服从细致平衡条件,那么会有

最后也是类比于离散情况,我们可以得到下面这样的结论。

Theorem 1: 设

是一条连续时间马尔科夫链,不可约,且存在平稳分布

,那么有

我们就不证明这个结论了。

Theorem 2: 在连续时间马尔科夫链中,有

同样,它们也是和离散时间马尔科夫链相对应的结论。细微的差别便在

这个系数上。

要说明这个结论,我们可以使用更新过程的方法,这是因为我们之前说过,

可以理解为是一个泊松过程,我们画一张图解释一下。

这里两个

之间的内容都是其他状态。简单来说,定义这里的奖赏

为“等待离开

的时间”

因为连续时间马尔科夫链可以用泊松过程描述(Description 2),所以这里我们使用更新奖赏过程来进行证明,也就是说定义

为停留在状态

的时间,定义

为从一个

到下一个

所需要的时间,这样的话直接就会有

这就完成了证明。

对于第二个式子,可能情况稍微复杂一些。注意到

这其实就是一个期望和积分的交换顺序。有了这个之后,其实只需要注意到,因为我们的

,所以极限状态下,会有

。比较类似数分里,有限的部分带来的影响可以忽略不计一样。这里也是因为这个可以得到这个极限为

。当然了至于为什么同样可以得到

,其实还是更新奖赏过程的理论,可以参考第7节

随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论

好的,我们来看几个例子吧。

Problem 4:

Queue with Balking 考虑一个排队论模型,理发店有

个理发师,顾客到来时间服从一个速率为

的泊松分布,而对于每一个顾客而言,有

的概率加入这个队伍,这里的

是在系统中的人数,不包括他自己。服务时间服从一个速率为

的泊松分布。刻画这个系统的平稳分布。

事实上有了连续时间马尔科夫链的工具,我们可以用它来解决一些排队论的问题,因为它也可以被理解为是一种泊松过程。

不难得到我们可以刻画出这样的转移速率矩阵。

这里要注意

是怎么来的,速率为

加上“加入概率为

",所以对应了一条速率为

的泊松过程。这一个对应泊松过程的稀疏变换,可以参考这一节

随机过程(6)——泊松过程三大变换,更新过程引入

这个转移速率其实可以利用细致平衡条件来求解,不难得到

当然要刻画它的平稳分布,在这个无限状态的情况下,我们就自然希望知道

是否是一个有限数,因为这决定了平稳分布的存在性和值。

虽然没办法再给出更细节的刻画,但有一个比较好分析的case就是

。这个情况下根据级数的比值判别法,可以看出和是收敛的,也就是平稳分布存在的意思。

Problem 5: 考虑一个天气转移的过程。天气从晴天转为多云的时间服从

,从多云转为雨天的时间服从

,从雨天转为晴天服从

。刻画这个连续时间马尔科夫链的转移速率矩阵

,并得出长期来看,各个天气占据时间的比例。

这个

不难得到,假如说晴天状态是1,多云状态是2,雨天状态是3,那么有

状态则是按照

的顺序从左到右,从上到下排序的。比方说

表示从状态1到状态2,转移速率为

,这对应一个

的指数分布。

那么这样的话,求解

,可以得到

注意这里不能使用细致平衡条件

因此可以得到,晴天,多云和雨天的时间占比为

。感兴趣的读者可以使用更新奖赏过程中,交替更新过程的方法进行建模,利用指数分布的无记忆性,可以发现这个时候,结果是一致的。

Problem 6: 考虑一个理发店排队论模型

,理发店理发服从一个速率为

的泊松过程(平均每一个小时完成3个人),顾客到达服从一个速率为

的泊松过程。但如果顾客前面已经有2个人排队,则顾客会离开。刻画这个模型,并求解出进入系统的人中,长期来看平均在系统停留的时间。

那么我们可以看出这个时候,定义状态

表示系统里有

个人的话,就不难得到

当然这个没有考虑人离开的情况,具体怎么加上这个条件会在后面说。当然因为这个我们可以知道,队伍里最多只会有3个人。

这个转移速率知道之后,再补上对角线上的

,我们就可以求解

,得到

注意在这里可以使用细致平衡条件。具体什么时候可以使用什么时候不可以使用,在之前的离散马尔科夫链的部分我们提过一个小的方法,不熟悉的读者可以回去翻一下。

https://zhuanlan.zhihu.com/p/335796325

而这个就对应“系统里有

个人“占据的时间比。比方说从这个结论中,我们可以看出“系统里有3个人”占据的时间比为

前方一个小高能。注意到上一节的PASTA性质,系统里有3个人所占据的时间和“某个人到达之后系统里有3个人所占据的比例”是相同的。因此相当于说,这里有

的人会离开系统,不接受服务(加入他们的时候系统里有3个人,相当于没到的时候系统有2个人,符合离开的条件)。也就是说,这里的排队论模型是有阻拦的(balking),对应的是

去掉这一部分人之后,剩下的人都接受了服务,那么直接求期望可以得到

这里的单位是min。

这里

对应的是“看到系统里没有人”的情况,所以相当于这一段时间,有一个人接受服务,那么因为平均一个小时服务3人,所以这一段时间,这一部分人在系统停留的平均时间就是20min。

好的,关于连续时间马尔科夫链的例子,我们就说到这里。这一节我们提了很多例子,也是希望可以通过例子,将连续时间马尔科夫链的理论,性质,与其对应的实际的应用可以相关联起来。

小结

本节主要介绍了连续时间马尔科夫链的转移速率的描述和对应的泊松过程的形象化描述。虽然说是“形象化描述”,但却是我们最为常用的理解和分析连续时间马尔科夫链问题的工具。同时这一节我们也介绍了大量与离散马尔科夫链的对比性质,因此如果对离散马尔科夫链的结论感到陌生,这一节的阅读就会产生较大的困难。不过这也是这一部分内容的常态了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 学弱猹的精品小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例
上一节笔记:随机过程(9)——连续时间马尔科夫链的泊松过程描述,爆炸现象,离散马尔科夫链对比
学弱猹
2021/08/10
1.6K0
随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例
随机过程(F)——习题课(连续时间马尔科夫链-布朗运动)
这是《随机过程》系列习题课的第二部分。这一部分我们会介绍从连续时间马尔科夫链到布朗运动的一些习题。这一部分的难度相对大一些,当然了,我们提供的习题也会稍微少一些。
学弱猹
2021/08/10
9280
随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入
上一节笔记:随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论
学弱猹
2021/08/10
1.1K0
随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入
随机过程(E)——习题课(马尔科夫链-更新过程)
这一节开始我们进入习题课。我们会对于每一个部分的内容给出一些习题,并计划以计算题为主,证明题为辅。注意到在每一节的正文其实或多或少都有一些题目用于概念和性质的理解和应用,所以在这里我们挑选的题目不会特别简单,更多的是需要一些思考或计算的题目,这也是我一直写习题课保持的一个习惯。
学弱猹
2021/08/10
2K0
随机过程(E)——习题课(马尔科夫链-更新过程)
随机过程(5)——无限状态马尔科夫链的进一步探讨,泊松分布引入,复合泊松分布
这一节我们开始对无限状态马尔可夫链做进一步的介绍。无限状态马尔可夫链的性质和有限状态略有不同,因此在一些问题的分析上,需要更加小心和注意。如果还有空的话,会给大家介绍泊松分布的基本概念。
学弱猹
2021/08/10
1.9K0
随机过程(5)——无限状态马尔科夫链的进一步探讨,泊松分布引入,复合泊松分布
随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链
这一节我们接着上一节的内容,继续介绍与状态分类有关的一些内容。包括上一节最后,利用图来划分状态的方法的解释。以及在这基础上,我们也会对极限状态进行一些探讨。
学弱猹
2021/08/10
2.2K0
随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链
随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论
本节我们开始介绍更新过程中的更新奖赏过程,这是一个很有趣的更新过程的应用,也会占据很大的篇幅。
学弱猹
2021/08/10
1.5K0
随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论
随机过程(6)——泊松过程三大变换,更新过程引入
上一节笔记:随机过程(5)——无限状态马尔科夫链的进一步探讨,泊松分布引入,复合泊松分布
学弱猹
2021/08/10
2.1K0
随机过程(6)——泊松过程三大变换,更新过程引入
随机过程(1)——引入,有限状态马尔科夫链,状态转移,常返与瞬时状态
大家好!这是一个全新的系列,我们会给大家介绍随机过程(Stochastic Process)相关的内容。
学弱猹
2021/08/10
2.4K0
随机过程(1)——引入,有限状态马尔科夫链,状态转移,常返与瞬时状态
随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间
上一节笔记:随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明
学弱猹
2021/08/10
1.2K0
随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间
随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明
上一节笔记:随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链
学弱猹
2021/08/10
1.9K0
随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明
MCMC(二)马尔科夫链
    在MCMC(一)蒙特卡罗方法中,我们讲到了如何用蒙特卡罗方法来随机模拟求解一些复杂的连续积分或者离散求和的方法,但是这个方法需要得到对应的概率分布的样本集,而想得到这样的样本集很困难。因此我们需要本篇讲到的马尔科夫链来帮忙。
刘建平Pinard
2018/08/14
1.4K0
MCMC(二)马尔科夫链
初探随机过程中的马尔科夫模型
正如在现实中一样,很多当前时刻的状态只取决于上一个时刻所做的决定而不是受所有历史所做出的的决定的影响,比如灯泡的以后发光的寿命只和当前是否发光有关、某一个时刻的销售额只与现在已知的累计销售额有关和过去任一时刻的累计销售额无关、人生以后的路只和当下的路有关而不是取决于过去等等,这种在概率学上成为无记忆性,一般指数分布是属于无记忆的概率分布,而马氏链属于无记忆的随机过程。
用户7506105
2021/08/09
1.1K0
马尔可夫性质、马尔可夫链和马尔可夫过程
前言 研究决策问题就一定听说过马尔可夫过程(Markov Process),这是一类非常重要的方法。现在非常热门的强化学习都是基于马尔可夫过程方法建立的。马尔可夫决策过程是研究随机序贯决策问题的理论基础,属于概率论和运筹学的交叉学科,同时,作为作为最优控制理论,也属于随机系统最优控制的范畴,具有广阔的应用范围和前景。
用户7623498
2021/12/04
2.1K0
人工智能马尔可夫模型_高斯马尔科夫模型
马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通用的统计工具。 ———–百度
全栈程序员站长
2022/09/27
1K0
人工智能马尔可夫模型_高斯马尔科夫模型
MCMC原理解析(马尔科夫链蒙特卡洛方法)
马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo),简称MCMC,MCMC算法的核心思想是我们已知一个概率密度函数,需要从这个概率分布中采样,来分析这个分布的一些统计特性,然而这个这个函数非常之复杂,怎么去采样?这时,就可以借助MCMC的思想。
种花家的奋斗兔
2020/11/13
2.8K0
MCMC原理解析(马尔科夫链蒙特卡洛方法)
NLP学习:隐马尔科夫模型(一)
在大学学习<概率论和数理统计>的时候,我们就已经学习过马尔科夫链,这里对于马尔科夫链就不多做赘述,而今天这一篇文章所要概括的是隐马尔科夫模型(HMM). ps:马尔科夫的彼得堡数学学派挺有意思,有兴趣的可以找一些相关资料拓展一下 一:隐马尔克夫模型应用 隐马尔科夫模型在语音识别上是一种非常成功的一种技术,在自然语言理解上已经运用的非常成熟,由于HMM的诸多优点,我们在以下几个领域应用后有了很不错的成绩: 1:分词处理 分词处理在我们生活中很常见,比如在一个句子中,每一个现在的词是HMM的一个状态,而词语的产
云时之间
2018/04/10
1.3K0
NLP学习:隐马尔科夫模型(一)
随机过程(B)——鞅的引入,性质与举例。可选停时定理
上一节笔记:随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例
学弱猹
2021/08/10
3.5K0
随机过程(B)——鞅的引入,性质与举例。可选停时定理
强化学习通俗理解系列一:马尔科夫奖赏过程MRP
本文写作目的:尽量通俗讲解强化学习知识,使读者不会被各种概念吓倒!本文是第一篇,但是最关键的一篇是第二篇马尔科夫决策过程(Markov Decision Process,MDP),只有充分理解了马尔科夫决策过程,才能游刃有余的学习后续知识,所以希望读者能够将MDP深入理解后再去学习后续内容。
机器学习算法工程师
2018/07/27
8920
强化学习通俗理解系列一:马尔科夫奖赏过程MRP
随机过程(C)——可选停时定理的应用,鞅的不等式与收敛性证明
这一节我们继续对鞅相关内容的介绍。包括可选停时定理的应用,鞅的收敛性质等等。当然最开始,我们自然是要把上一节留下的一个遗留问题给解决了。
学弱猹
2021/08/10
1K0
随机过程(C)——可选停时定理的应用,鞅的不等式与收敛性证明
推荐阅读
随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例
1.6K0
随机过程(F)——习题课(连续时间马尔科夫链-布朗运动)
9280
随机过程(8)——更新过程在排队论的两个应用,PASTA,连续时间马尔科夫链引入
1.1K0
随机过程(E)——习题课(马尔科夫链-更新过程)
2K0
随机过程(5)——无限状态马尔科夫链的进一步探讨,泊松分布引入,复合泊松分布
1.9K0
随机过程(2)——极限状态的平稳分布与周期(上),一些特殊的马尔科夫链
2.2K0
随机过程(7)——更新奖赏过程:交替更新过程,生存与濒死时间,观察悖论
1.5K0
随机过程(6)——泊松过程三大变换,更新过程引入
2.1K0
随机过程(1)——引入,有限状态马尔科夫链,状态转移,常返与瞬时状态
2.4K0
随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间
1.2K0
随机过程(3)——无限状态的平稳测度,返回时间,访问频率:几个定理的证明
1.9K0
MCMC(二)马尔科夫链
1.4K0
初探随机过程中的马尔科夫模型
1.1K0
马尔可夫性质、马尔可夫链和马尔可夫过程
2.1K0
人工智能马尔可夫模型_高斯马尔科夫模型
1K0
MCMC原理解析(马尔科夫链蒙特卡洛方法)
2.8K0
NLP学习:隐马尔科夫模型(一)
1.3K0
随机过程(B)——鞅的引入,性质与举例。可选停时定理
3.5K0
强化学习通俗理解系列一:马尔科夫奖赏过程MRP
8920
随机过程(C)——可选停时定理的应用,鞅的不等式与收敛性证明
1K0
相关推荐
随机过程(A)——连续时间马尔科夫链的离出分布,到达时间。排队论模型与排队网络举例
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档