本节将对离散时间鞅定义停时,并介绍上穿不等式。

定义1\(\{\mathscr{F}_n\}\)是上升的\(\sigma\)-域,也即对任意的\(n\geq 0\),都有\(\mathscr{F}_n\subset\mathscr{F}_{n+1}\)。随机变量\(T:\Omega\to\{0,1,2,\cdots\}\),且对任意的\(n\geq 0\),都有 \[ \{T=n\}\in\mathscr{F}_n, \] 则称\(T\)\(\{\mathscr{F}_n\}\)停时


事实上,注意到\(\{\mathscr{F}_n\}\)是上升的,在这里\(\{T=n\}\in\mathscr{F}_n\)对任意的\(n\geq 0\)成立,等价于\(\{T\le n\}\in\mathscr{F}_n\)对任意的\(n\geq 0\)成立。


例2\(T\)表示赌徒停止赌博的时间,\(T=n\)表示在经过\(n\)次赌博后赌徒停止赌博,则事件\(\{T=n\}\)取决于前\(n\)次赌博中所获得的信息\(\mathscr{F}_n\)


定义3\(T\)是停时,记 \[ \mathscr{F}_{\infty}=\sigma\left(\bigcup_{n=1}^{\infty}\mathscr{F}_n\right),\quad\mathscr{F}_T=\{A\in\mathscr{F}_{\infty}:A\cap\{T=n\}\in\mathscr{F}_n,\forall n\geq 0\}, \]\(\mathscr{F}_T\)\(T\)\(\sigma\)-域


关于停时和\(T\)\(\sigma\)-域,有一些基本的性质。


命题4\(S, T\)是停时,则\(S+T\)是停时。


证明 根据 \[ \{S+T=n\}=\bigcup_{i=0}^{n}\{S=i,T=n-i\}=\bigcup_{i=0}^{n}\{S=i\}\{T=n-i\}\in\mathscr{F}_n, \]\(S+T\)是停时。


命题5\(S, T\)是停时,\(S\le T\),则\(\mathscr{F}_S\subset\mathscr{F}_T\)


证明 任取\(A\in\mathscr{F}_S\),则对任意的\(n\geq 0\),都有 \[ A\cap\{S\le n\}=A\cap\{S\le T\}\cap\{T=n\}\in\mathscr{F}_n, \] 从而\(A=A\cap\{S\le T\}\in\mathscr{F}_T\)


定理6(Doob停止定理)\(S, T\)是有界停时,且\(S\le T\)

(1)设\(\{X_n\}\)是鞅,则\(\mathbb{E}(X_T|\mathscr{F}_S)=X_S,\mathrm{a.s.}\)

(2)设\(\{X_n\}\)是上鞅,则\(\mathbb{E}(X_T|\mathscr{F}_S)\le X_S,\mathrm{a.s.}\)


证明 对于上鞅的情形,设\(\{X_n\}\)是上鞅,\(S\le T\le N\),任取\(A\in\mathscr{F}_S\)。首先设\(T=S+1\),对任意的\(0\le i\le N\),记 \[ A_i=A\cap[S=i]\cap[T\geq i]\in\mathscr{F}_i. \] 利用上鞅的期望的单调性,有 \[ \int_A(X_S-X_T)\mathrm{d}\mathbb{P}=\sum_{i=0}^{N}\int_{A_i}(X_{i}-X_{i+1})\mathrm{d}\mathbb{P}\geq 0\implies\int_AX_S\mathrm{d}\mathbb{P}\geq\int_AX_T\mathrm{d}\mathbb{P}; \] 接下来设\(T>S+1\),令\(R_i=S+i, 1\le i\le T-S-1\),则\(S\le R_1\le R_2\le\cdots\le T\),且它们之间间隔为\(1\)。应用上式可得 \[ \int_A X_S\mathrm{d}\mathbb{P}\geq\int_A X_{R_1}\mathrm{d}\mathbb{P}\geq\int_A X_{R_2}\mathrm{d}\mathbb{P}\geq\cdots\geq\int_A X_T\mathrm{d}\mathbb{P}. \] 从而,对任意的\(S\le T\),及对任意的\(A\in\mathscr{F}_S\),都有 \[ \int_AX_S\mathrm{d}\mathbb{P}\geq\int_AX_T\mathrm{d}\mathbb{P}=\int_A\mathbb{E}(X_T|\mathscr{F}_S)\mathrm{d}\mathbb{P}, \] 这便说明了\(\mathbb{E}(X_T|\mathscr{F}_S)\le X_S,\mathrm{a.s.}\)。鞅的情形同理可证。


最后,我们将介绍鞅的上穿不等式,为此引入一些记号。对于上鞅\(\{X_n\}\),记\(U_a^b(k)\)表示\(\{X_1,X_2,\cdots,X_k\}\)上穿区间\([a,b]\)的次数。为了更精确地描述\(U_a^b(k)\),记 \[ T_0=\inf\{n\geq 0, X_n\le a\},\quad T_1=\inf\{n> T_0, X_n\geq b\}, \] 以及 \[ T_{2i}=\inf\{n>T_{2i-1}|X_n\le a\},\quad T_{2i+1}=\inf\{n>T_{2i}|X_n\geq b\}, \]\(T_{2i}\)表示第\(i+1\)上穿区间\([a,b]\)的开始时间,而\(T_{2i+1}\)表示第\(i+1\)上穿区间\([a,b]\)的结束时间,并且\(\{T_n,n\geq 0\}\)为递增的停时序列。从而, \[ \{U_a^b(k)=i\}=\{T_{2i-1}<k<T_{2i+1}\}\in\mathscr{F}_k, \] 也即\(U_a^b(k)\)是关于\(\mathscr{F}_k\)可测的随机变量。


定理7(上穿不等式)\(\{X_n\}\)是上鞅,\(U_a^b(k)\)表示\(\{X_1,X_2,\cdots,X_k\}\)上穿区间\([a,b]\)的次数,则 \[ \mathbb{E} U_a^b(k)\le\dfrac{1}{b-a}\cdot\mathbb{E}[(X_k-a)^-]. \]


证明\(\{X_n\}\)是上鞅知\(\mathbb{E}X_{T_{2i+1}\wedge k}\le\mathbb{E}X_{T_{2i}\wedge k}\),从而 \[ \begin{aligned} 0&\geq\mathbb{E}(X_{T_{2i+1}\wedge k}-X_{T_{2i}\wedge k})\\ &=\mathbb{E}(X_{T_{2i+1}\wedge k}-X_{T_{2i}\wedge k})\cdot\left(I_{\{T_{2i}\le k\le T_{2i+1}\}}+I_{\{k\geq T_{2i+1}\}}\right)\\ &\geq\mathbb{E}(X_k-a)\cdot I_{\{T_{2i}\le k\le T_{2i+1}\}}+(b-a)\cdot\mathbb{E}I_{\{k\geq T_{2i+1}\}}. \end{aligned} \] 由于\(\{U_a^b(k)\geq i+1\}\subset\{k\geq T_{2i+1}\}\),并且\(\{2i\le k\le 2i+1\}\subset\{U_a^b(k)=i\}\),因此 \[ (b-a)\cdot\mathbb{P}(U_a^b(k)\geq i+1)\le\mathbb{E}(X_k-a)^-\cdot I_{\{U_a^b(k)=i\}}, \] 在上式中对\(i\)进行求和,可得 \[ \mathbb{E}U_a^b(k)=\sum_{i=0}^{\infty}\mathbb{P}(U_a^b(k)\geq i+1)\le\dfrac{1}{b-a}\cdot\mathbb{E}(X_k-a)^-. \] 这便完成了定理的证明。