上一节笔记:随机过程(B)——鞅的引入,性质与举例。可选停时定理
————————————————————————————————————
大家好!
这一节我们继续对鞅相关内容的介绍。包括可选停时定理的应用,鞅的收敛性质等等。当然最开始,我们自然是要把上一节留下的一个遗留问题给解决了。
那么我们开始吧。
在这里,先感谢这一门课的授课老师方明老师对这一部分提供的帮助!
在上一节,我们的证明中用到了这么一个步骤。
这个步骤被用来证明鞅的正交性。但是注意到,其实第一行到第二行的那个等号并不是很显然的,它要求我们的条件必须具备包含关系。为什么不具备包含关系就不行呢?我们这里来给出一个反例。
Counterexample 1: 定义随机变量
的样本空间为
,定义
-代数为
,
。并且假设样本空间上对应的概率为
,
,
,相对应的取值为
,验证,先对
求期望,再对
求期望,和反过来的顺序求,对应的
的取值并不相同。
看到这里估计很多人又要一脸懵逼了,为什么突然冒出一个叫作
-代数的东西?这里不用怕,微笑着面对它。因为我们讨论条件期望
的时候,这个
可以被认为是一种划分。比方说如果
,那么
就会分为
和
来讨论,讨论出来之后再进行加权计算。具体可以见下图。
而这里的两个
代数其实也就对应着两个划分。简单来说可以理解为,通过某一种取条件的方式,我们得到了这两个划分,在测度论中,它们因为有专门的性质,因此叫它们为
-代数。
那么好,现在我们来看看,如何求解对应的期望。注意到
这是因为,如果取了条件为
,那么在这个概率空间内就只有
一个,因此期望就是
,如果取了条件为
,那么有两种可能:
。这个时候,在这个条件下,
,
(想想为什么?),所以加权计算一下可以得到期望值为
。
取了条件
之后,再看取了条件
是什么样?注意在取了条件
之后,对于不同的可能的取值,对应的期望值就不同了,比方说
对应的期望值就都变成了
。那么这个时候,我们可以看到
这里我们只考虑
的情况。因为在考虑取条件
的时候,对应的条件是
(对应的
的划分),所以可以计算出
。所以可以得到结果为
。
按照同样的推导思路,你可以计算出
这个计算过程交给读者。也就是说,我们交换了条件,其实对应的期望值是不一样的。这个原因也不言而喻,因为
和
并不具备任何的相互包含性,所以这个结论自然就是不成立的。
这个结论的说明确实需要一些功夫,也不是一个特别好理解的结论。毕竟取条件取条件,先取
再取
和先取
再取
,看起来好像没太大区别。但其实这个反例就告诉我们,区别大了去了……
当然,如果说两个条件是包含的,那么就不存在这里说的问题了。具体的严谨的证明,其实还是会诉诸于高等概率论。但是如果按照划分的思想,代入这里的计算去理解,这个结论倒也就不是那么难懂了。
当然,如果对实分析的相关内容感兴趣,可以关注专栏里已经有的两个实分析系列。这里贴上他们最后一节的链接,可以通过最后一节索引到之前的所有内容。
https://zhuanlan.zhihu.com/p/33879863
https://zhuanlan.zhihu.com/p/37123013
填完坑了,我们继续说我们上一节没说完的内容。在这一部分,我们会说一些可选停时定理的应用,包括如何挑选鞅,如何使用结论等。
那么我们开始吧,先看个简单的。
Problem 1: 设
是独立同分布的随机过程,且
。设
,
,试求解
。
是的,这里我们要介绍的,就是之前离散马尔科夫链中已经关注过的离出分布,离出时间相关的问题。之前的笔记可以看这里
随机过程(4)——返回时间,访问频率定理应用,离出分布,离出时间
在这里我们会发现,其实通过鞅的思路,可以更快更好的求解这些问题。
这是一个离出分布的问题,相当于让一个离散马尔科夫链从点
出发。如果要把它转为一个可选停时定理的问题,我们肯定要确认两件事:**鞅是什么?停时是什么?**在这里,其实停时就是
,因为整个马尔科夫链到了
这个时间就不会再推进了。而鞅的话,其实就是
本身,读者也可以去验证。
这两个东西确定下来之后,还要做的一件事情就是确认可选停时定理成立的充分条件。这里比较容易发现的事情是
有界,并且
。
这个很简单,因为
是一个我们在第5节(链接)就已经提到过的结论。另外一个有界性,其实也不难发现,因为如果把
本身理解为一条离散马尔科夫链,那么它一定会一直在
这个范围内随机游走,这自然是肯定有界的。
原料都准备好了,该用大杀器了。注意到
,而
,且
所以联立一下就可以解出
和
。又因为
,所以联合一下,就可以得到
。
所以大家可以发现,可选停时定理一旦被使用上,离出分布的问题就变成了一个初中二年级就学过的二元一次方程组的求解问题。这比之前我们说的求解方法要简单很多。但是为什么这个是奏效的呢?其实原因也是在于,无论是使用传统的“一步转移”方法,还是使用这里的停时定理,其根本的思路都是在分析一条随机过程的趋势。鞅作为一个趋势的量,自然可以完成这个任务。同时因为它包含了所有的与趋势有关的信息,所以得到这样的结果,也不用奇怪。
再来看一个稍微复杂一点的例子。
Problem 2: 在Problem 1的基础上,修改概率
,
,其余不变。求解
。
这一个题的复杂点多了一些。首先,
本身不再是一个鞅。其次,这个鞅还不太好找。这是怎么回事?我们慢慢来看。
首先注意,我们在上一节介绍过,
才是真正的鞅,
就是对应的
的期望。只是在Problem 1中恰好
。但是在这里,其实这个也不是特别好用。我们可以试着写一下。根据可选停时定理,我们有
这里的问题就是在于
其实是一个很难计算的东西。所以其实这个鞅是不能用的。那么到底问题出在哪里呢?其实就出在这里这个额外的
上。一个自然的思路就是,如果能找到一个不会带来额外未知项的鞅,就可以了。而这个鞅也是很好找的,还记得之前提到的指数鞅吗?
根据上一节所介绍的Problem 3-2,我们就可以得到
是一个指数鞅。所以注意到
也是一个有界的量,所以有
所以可以算出来
这个也和之前的结论是一致的。
Problem 3: 考虑随机变量
,其中
独立同分布,且
,
,研究
的随机性质。
这个问题相对更抽象一些,它是利用鞅,来对随机现象做的一个概率估计。我们可以把这个过程理解为一个投资过程。那么
其实就是这个投资破产的最近的时间。
首先它们都服从正态分布,所以我们最好的方式还是构造指数鞅。按照指数鞅的思路,我们先求
,然后就可以找到对应的鞅了。
注意到
解
就可以得到
。那么可以得到,在这个时候,
就是一个鞅。
这里要注意的是,到这里不要急着验证有没有
是否成立,因为它根本不成立!比方说
就不一定有界,因为
很有可能,
也有可能。所以这个题我们只能诉诸于更加弱的一个版本,就是
这样的话,其实问题的关键就是估计左边的
。这就需要依赖一些传统的分析思路了。注意到
第一行到第二行是因为我们消去了第二项(因为这是一个非负的项),并且可以得到
(想想为什么?)。所以令
就可以得到我们的结论,也即
这就是我们的最终的结论。也就是说,永远不会破产的概率最大为
。其中
。
Problem 4: 在Problem 2的基础上,考虑计算
,其中
不受限制,即游戏可公平也可不公平。
这个就是离出时间的问题。那么这里,既然我们希望计算
,那么自然可以考虑之前的
这么一个鞅。但是如果你在使用的时候,你会发现
的时候,这个鞅是无法使用的(因为
,无法解对应的方程),需要更高阶的鞅。
当然了,首先我们还是来看一看,为什么有
。注意这里也有个问题,就是没有办法利用充分条件来求解。原因在于,
不一定有界。但是这里其实可以直接交换顺序,也即
这是因为
本身是一个有限值,
也是,所以可以分开直接使用控制收敛定理,也就是说这个前提条件是成立的,虽然我们没有利用任何一个充分条件。
说完这个,我们再看这个题。首先
的话,根据
是一个鞅,可以得到
所以可以解得
当
的时候,
,所以一阶鞅就无法使用了。但没关系,我们还有二阶鞅,也就是上一节所提到的
代入
,我们有
。那么这样的话,就有
那么注意到
,
都是之前已经求出来的值(对应的就是
,所以我们代入,可以得到最终的结果
。
Problem 5: 考虑
,且
,
,且
相互独立。证明
,其中
,并且在
的时候取等号。
这个题和Problem 3很类似,也是利用可选停时定理来给出一些概率不等式估计的例子。
在这个题中,我们想用的鞅和Problem 4是相同的。也就是
。那么根据可选停时定理,我们有
这个怎么得来的,相信读者已经非常熟悉了,这里就不多说了。当然了,这里我们也没有使用进阶的
,因为在这里,它不一定成立。
注意到
(这里有些跳步的原因是有些东西之前已经说过了,读者可以自己对照一下Problem 3),那么只需要注意到
。且
,移项就可以得到这个结论。
其实大家也可以看出来,在这里我们举了很多与可选停时定理相关的例子,但并不是一味地重复,因为每一个题都有一些小的变化。这也侧面上说明了可选停时定理的一个适用性。当然了,我们到后面还会补充一些例子,如果有专门的习题课的话……
鞅本身的一些数值性质和随机性质,可以用一些概率不等式的方法去估计/限制(或者说,去bound住),因此可以说它和概率不等式的相关理论也有很密切的联系。总体来说,这一部分会更加理论一些,用到的工具也会更加多样一些。不过如果对于这一块理论不感兴趣,跳过倒也问题不大。但我们还是推荐大家阅读这一部分内容,因为这里用到的一些工具,在很多理论研究中其实还是很有用的。
首先我们来看鞅的最大值估计。
Proposition 1: 设
是一个上鞅,
,那么
我们可以看出,这相当于说,最大值超过某一个值的概率,可以被
所控制住。
事实上,我们说它也是一种可选停时定理的应用,也没有太大问题,因为这个性质确实也可以使用它来证明。首先我们研究的其实就是鞅的一个变化,看它什么时候可以突破
。这个过程完全可以使用停时来描述,也就是说,设
,我们可以得到
所以其实我们只需要关注
就可以了,那么又注意到一件事,就是因为这里我们有上鞅的条件,所以有
(注意不仅仅是取等号的时候才有可选停时条件)。所以可以得到
令
,就得到了
。移项,就可以得到结论,剩下的部分我们交给读者。
其实读者这里也能看出,这个推导思想我们在Problem 3和5,都已经用过了。
当然对于这个结论,我们希望多说几句,就是很多人可能会使用一些常规思路来证明,比方说下面这个思路
这一系列不等式是采用非常正常的概率论中的,不交并可拆分的思路。但是这个结论是没有什么用的,因为最终的不等式,在
的时候会趋于无穷。那么为什么这个结论会有问题呢?就是因为在我们这个问题中,
的趋势是有规律的(否则就不是一个鞅/上鞅/下鞅了)。所以如果用传统的方法,武断的认为每一个
相互之间是不交的,就会对不等式的估计产生严重的错估。
对于下鞅,也有一个类似的结论。
Proposition 2: 设
是下鞅,
,那么有
这里我们取了绝对值,是因为我们这里其实没有
的条件。当然没有这个条件,就没有办法再使用上面的推导了,读者可以想一想,在哪一步有可能会出问题。最后再注意一下就是,这个结论和上面的区别在于,这里我们只关心
这一段时间内的鞅的变化情况。
同样的思路,我们设
,那么自然会有
根据可选停时定理和下鞅的性质,我们有
,又因为
这就可以得到
移项就可以得到结论了。
这两个结论的证明思路,其实如果你认真看了之前的内容,就应该相对来说比较熟悉了。如果没有看明白他们怎么来的,建议可以从头到尾把这些内容再看一遍哈哈哈。
接下来这个命题可以认为是一个鞅领域的赫尔德(Holder)不等式,为什么这么说呢?
Proposition 3: 设
是一个鞅或者一个正的下鞅,且设
,证明对
,有
从这个结论本身来看,容易看出来这是一个鞅最大值的p阶矩估计。一般来说p阶矩估计的结果最容易联想到的就是赫尔德不等式了。
注意到
化简一下就可以了。
不过这个推导过程其实不是很好理解的,我们还是一步一步来看一下。首先第一个等号估计就很难看出来。如果我们设
,那么就是很常见的一个期望等式
但是对于一般的
有什么样的结果呢?这其实利用的就是富比尼(Fubini)定理。简单来说就是
这就可以了。富比尼定理用在了第一行到第二行,积分与期望交换顺序的地方。事实上,只要绝对有界,富比尼定理就能保证交换顺序是合法的,所以在这里不算是一个很强的条件(毕竟如果
也就没有什么计算的必要了)。
再之后,利用的就是Proposition 2,得到一个不等式。之后也是期望与积分交换了顺序,运用的同样是富比尼定理。在这之后就可以直接积分了。积分之后运用了赫尔德不等式,也即
读者可以自己思考,如何配这里的系数
才可以得到我们上面证明中的那个结果。
说完了不等式估计,终于来到了我们的重头戏——收敛性(Convergence)。收敛性所关注的问题就是:当我们的鞅趋于无穷的时候,结果会变化成什么样?举个例子,对于一个鞅来说,利用当前以及之前的所有时刻的信息,我们可以得到期望随着时间变化而不变的一个结论(毕竟是定义嘛)。利用可选停时定理,我们有
。但是如果只研究鞅
本身,它的收敛性又怎么样呢?事实上也是存在的,类比的就是数分中的单调有界必定收敛的定理。这也是这一部分要介绍的一个大定理。我们用它来结束这一部分。
Theorem 1: 设
是一个下鞅,那么
几乎可以确定存在(
),并且
这个结论不是特别难理解,毕竟对于一个下鞅,它的整体趋势就是下降的,所以极限存在的话,期望偏小也好说。但是这里还有一个细节,就是如果仅仅是一个鞅,这里的期望的符号是否应该改成等号?答案其实是否定的。有一个反例可以说明这一点。
Counterexample 2: 考虑一个简单随机游动
,且
相互独立,服从标准正态分布。那么设
,
,
,那么说明这个时候,
是不成立的。
当然,我们要预先假设一下这个极限是存在的,有那么一点点的越界和不严谨哈。
这个地方其实很容易发现,
是一个鞅。但是注意到,因为我们停时是规定在
的时候,所以不管这个极限的表现如何,都一定有
。但是我们又有
,所以自然的这两个值不相同。因为它们甚至都不能说是两个随机变量,所以也就不会存在期望相同的可能性了。
当然了,这里的期望的不等式关系,来源于实分析中的法图(Fatou)引理。具体的内容可以看这一节
https://zhuanlan.zhihu.com/p/36755508
在这里,事实上就是
法图引理用在了第二个不等式上。利用这个引理,其实可以类似发现,如果是上鞅,
就要改成
。
好的,下面我们进入这个定理的证明。这个定理的证明思路其实依然来源于实分析(或者说高等概率论)。既然要说明一个随机变量的极限存在(当然我们还是按照惯例,省略了
这个表达),那么只需要说明
简单来说,对于一串随机变量而言,我们可以定义它极限的一个上限和一个下限(严格来说就是上极限和下极限)。如果最终他们俩相等(严格来说,就是相等的概率为1),那么就说明极限存在。
要说明极限情况下,两个值是相同的。一个思路是给定一个范围
。然后分析我们值跳跃的情况。对于一个下鞅而言,一个推断是,它下降是合理的,它上升是反常的。所以思路就是在于,我们说明,值上升的情况是有限的,不会过多的,这样的话似乎就能得到结论。
到此为止算是有了基本的思路。具体来说,我们定义
画出一张图就是这么一回事。
如果做一个简单的定义,定义
为下降过程
,定义
为上升过程
,那么这样的话,根据上面我们的讨论,只要说明上升过程
只会发生有限次就可以了。
接下来,进一步只需要说明的就是
,这是因为要使用高等概率论中的Borel-Cantelli(B-C)定理。这个思路不太好想,我们直接给出。如果有
,那么根据B-C定理自然会有
如果这个事情只会发生有限次,那么没有理由相信上升过程
会发生无限多次(因为每上升一次就会有一个新的
出现)。
那么如何说明这一个事情呢。事实上自然是需要研究
的。有一个方案是考虑取条件
。这是因为在这个条件下,鞅的性质依然是保证的(简单来说,
仍然是一个上鞅)。所以结合乘法公式我们会有
不等号是因为,如果
,必然有
。
那么注意到鞅的不等式性质,我们有
因此结合起来就有
。这个单项对应的级数是收敛的。所以有
,也就说明了我们的结论成立。
单看这个证明思路其实还是比较难理解的。但是对于随机过程这一门课本身,这个看看就好了,不懂问题倒也不大。
本节依然在关注鞅,包括可选停时定理的应用,鞅本身的一些不等式估计,和对于鞅本身的收敛性的分析。事实上,鞅本身作为概率论中的工具之一,也会被用来作为证明一些概率论定理和性质的辅助手段。当然了在随机过程中,主要的鞅的一个应用也便是我们的可选停时定理了。
当然,其实关于鞅的内容,我们还留了一个小尾巴。下一节我们会补充完鞅的收敛性的最后一个应用,然后就会开始对最后一个随机过程——布朗运动,做一个简单的介绍。