跳转至

Chapter 06 : 随机模型

随机性

  • 必然性与偶然性:揭示客观事物发生、发展和灭亡趋势的一对范畴。
    • 必然性(Necessity):客观事物联系和发展中一定要发生的、确定不移的趋势
    • 偶然性(Contingency):客观事物联系发展中并非确定发生的,可以这样出现也可以那样出现的不确定趋势
  • 随机性(Randomness):偶然性的一种形式
    • 可重复性:事件可以在基本相同的条件下重复进行。只有单一的偶然过程而无法判定它的可重复性则不称为随机事件
    • 多样性:在基本相同条件下某事件可能以多种方式表现出来,事先不能确定它以何种特定方式发生。只有唯一可能性的过程不是随机事件
    • 概率性:事先可以预见该事件以各种方式出现的所有可能性,预见它以某种特定方式出现的概率。在重复发生时没有确定概率的现象不是同一过程的随机事件

疾病检测

  • 记 \(A\) 为患病,\(B\) 为检测结果为阳性,疾病检测方法的性能指标为:
    • 灵敏度(Sensitivity)\(p=P(B|A)\):患病者被检测为阳性(Positive)的概率
    • 特异度(Specificity)\(q=P(\overline{B}|\overline{A})\):未患病者被检测为阴性(Negative)的概率
  • 设疾病的发病率为 \(r\) ,则被检测出阳性的情况下患病的概率为
\[ P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(\overline{A})}=\frac{pr}{pr+(1-q)(1-r)} \]

概率群式

概率群式:假定 \(n\) 个人相互独立地以概率 \(p\) 患病,如何找出全部的病人,使平均检测次数尽可能少?

对于选择群式方案,我们要考虑平均检测次数、检测阶段数、每人最大检测次数、每组最多样本数、方案的可操作性、检测的灵敏度与特异度等多个因素


两阶段群式

  • 将 \(n\) 人的样本混合后检测。若结果为阴性,说明这 \(n\) 人均未感染。若结果为阳性,说明这 \(n\) 人中至少有一人已感染。此时逐个检测每个人样本

对于这样的检测方案,检测次数如下:

  • 混合样本阴性概率为 \((1−p)^n\) ,总检测次数为 1
  • 混合样本阳性概率为 \(1−(1−p)^n\),总检测次数为 \(n+1\)
  • 检测次数的数学期望为 \(1⋅(1−p)^n+(n+1)⋅(1−(1−p)^n)\)

所以平均检测次数的数学期望为 \(\frac{1⋅(1−p)^n+(n+1)⋅(1−(1−p)^n)}{n}\)


矩阵检测方案

矩阵检测方案是二阶段群式的改进方案

矩阵检测方案

将 \(m\times n\) 个人按矩阵排好,先检测每行样本,若结果为阴性,说明这 \(n\) 人均未感染。若结果为阳性,说明这 \(n\) 人中至少有一人已感染。此时逐个检测每列样本。

这样每行就相当于两阶段群式中的混合样本,每列就相当于两阶段群式中的每个人样本,检测次数数学期望为 \(m\times(1⋅(1−p)^n+(n+1)⋅(1−(1−p)^n))\),平均检测次数数学期望仍然为 \(\frac{1⋅(1−p)^n+(n+1)⋅(1−(1−p)^n)}{n}\)

将 \(m\times n\) 个人按矩阵排好,对每行每列分别进行检测。通过检测结果确定感染者的位置。

这样需要的检测次数恒为 \(m+n\)


三阶段检测方案

三阶段检测方案也是二阶段群式的改进方案

  • 第一阶段:有 \(n\) 个人,进行总体的混合检测,若结果为阴性,说明这 \(n\) 人均未感染。若结果为阳性,说明这 \(n\) 人中至少有一人已感染。进入第二阶段
  • 第二阶段:将这 \(n\) 人分成 \(A,B\) 两组,每组 \(\frac{n}{2}\) 人,先对 \(A\) 组进行检测,若结果为阴性,说明这 \(\frac{n}{2}\) 人均未感染,且确定感染者在 \(B\) 组。若结果为阳性,说明这 \(\frac{n}{2}\) 人中至少有一人已感染,但仍需确定 \(B\) 组是否有感染者,此时对 \(B\) 组进行总体的混合检测
  • 第三阶段:对有感染者的组进行逐个检测,确定感染者的位置

检测次数

  • 对于第一阶段,结果为阴性的概率为 \((1-p)^n\),总检测次数为 1
  • 对于第二阶段:
    • \(A\) 组结果为阴性的概率为 \((1-p)^{\frac{n}{2}}\),此时 \(B\) 组必然为阳性,这发生的概率为 \(1-(1-p)^{\frac{n}{2}}\),总检测次数为 \(1+1+\frac{n}{2}=2+\frac{n}{2}\)
    • \(A\) 组结果为阳性的概率为 \(1−(1−p)^{\frac{n}{2}}\)\(B\) 组结果为阴性的概率为 \((1−p)^{\frac{n}{2}}\),总检测次数为 \(1+1+\frac{n}{2}+1=3+\frac{n}{2}\)
    • \(A\) 组结果为阳性的概率为 \(1−(1−p)^{\frac{n}{2}}\)\(B\) 组结果为阳性的概率为 \(1−(1−p)^{\frac{n}{2}}\),总检测次数为 \(1+1+\frac{n}{2}+1+\frac{n}{2}=3+n\)

所以总检测次数的数学期望为:

\[ \begin{aligned} &(1-p)^n·1+(1-p)^{\frac{n}{2}}(1-(1-p)^{\frac{n}{2}})·(2+\frac{n}{2})\\ +&(1-(1-p)^{\frac{n}{2}})(1-p)^{\frac{n}{2}}·(3+\frac{n}{2})+(1-(1-p)^{\frac{n}{2}})^2·(3+n)\\ =&n+3-(n+1)(1-p)^{\frac{n}{2}}-(1-p)^n \end{aligned} \]

平均检测次数的数学期望为 \(1+\frac{3}{n}-(1+\frac{1}{n})(1-p)^{\frac{n}{2}}-\frac{1}{n}(1-p)^n\)


随机变量

详见 概统 笔记


赠券收集问题

问题描述

一套赠券共有 \(N\) 种,商家在每件商品中随机放入一张赠券。假设每件商品中放入各种赠券的概率相同,那么集齐全套赠券平均需购买多少件商品?

De Morgan 定律

定义随机变量 \(X\) 为“集齐全套赠券需购买的商品件数”,\(E(X)=\sum\limits_{i=1}^Ni⋅P(X=i)\)。记 \(B_i\) 为事件“购买 \(i\) 件商品后集齐全套赠券”,记 \(A_i^j\) 为事件“购买 \(i\) 件商品后收集到第 \(j\) 种赠券”。则有:

\[ \begin{aligned} P(A_i^j)&=1−P(\overline{A_i^j})=1−(1−\frac{1}{N})^i\\ P(B_i)&=P(A_i^1\cap A_i^2\cap...\cap A_i^N)\\ &=1−P(\overline{A_i^1\cap A_i^2\cap...\cap A_i^N})\\ &=1−P(\overline{A_i^1}\cup \overline{A_i^2}\cup ...\cup\overline{A_i^N})\\ &=1−(\sum\limits_{j=1}^NP(\overline{A_i^j})−\sum\limits_{1\leq j_1<j_2\leq N}P(\overline{A_i^j}\cap\overline{A_i^k})+...+(−1)^{N−1}P(\overline{A_i^1}\cap\overline{A_i^2}\cap...\cap\overline{A_i^N})) \end{aligned} \]

分析括号中的第二项,对任意固定的 \(j,k,1\leq j<k\leq N\)\(\overline{A_i^j}\cap\overline{A_i^k}\) 表示购买 \(i\) 件商品后未收集到第 \(j\) 种和第 \(k\) 种赠券,有 \(P(\overline{A_i^j}\cap \overline{A_i^k})=(1-\frac{2}{N})^i\)

同理,对任意 \(1\leq j_1<j_2<...<j_k\leq N\)\(\overline{A_i^j}\cap\overline{A_i^k}\) 表示购买 \(i\) 件商品后未收集到第 \(j_1\) 种、第 \(j_2\) 种、...、 第 \(j_k\) 种赠券,有 \(P(\overline{A_i^{j_1}}\cap\overline{A_i^{j_2}}\cap...\cap\overline{A_i^{j_k}})=(1-\frac{k}{N})^i\)。因此,有:

\[ \begin{aligned} P(B_i)&=1-(\sum\limits_{j=1}^NP(\overline{A_i^j})-\sum\limits_{1\leq j_1<j_2\leq N}P(\overline{A_i^j}\cap\overline{A_i^k})+...+(-1)^{N-1}P(\overline{A_i^1}\cap\overline{A_i^2}\cap...\cap\overline{A_i^N}))\\ &=1-(\sum\limits_{j=1}^N(1-\frac{1}{N})^i-\sum\limits_{1\leq j_1<j_2\leq N}(1-\frac{2}{N})^i+...+(-1)^{N-1}(1-\frac{N}{N})^i)\\ &=1-(C_N^1(1-\frac{1}{N})^i-C_N^2(1-\frac{2}{N})^i+...+(-1)^{N-1}C_N^N(1-\frac{N}{N})^i)\\ &=1-\sum\limits_{j=1}^N(-1)^{j-1}C_N^j(1-\frac{j}{N})^i\\ &=\sum\limits_{j=0}^N(-1)^jC_N^j(1-\frac{j}{N})^i \end{aligned} \]

所以其期望为 \(\sum\limits_{i=1}^N i·P(X=i)=\sum\limits_{i=1}^N i·\sum\limits_{j=0}^N(-1)^jC_N^j(1-\frac{j}{N})^i\)


几何分布

记随机变量 \(X\) 为“集齐全套赠券购买的商品件数”,定义随机变量 \(Y\) 为“从收集到 \(k−1\) 种赠券到 \(k\) 种赠券购买的商品件数”,则有:\(X=Y_1+Y_2+⋯+Y_N\)

我们考察 \(Y_k\)\(Y_k=j\) 意味着先购买的 \(j−1\) 件商品中的赠券均为已收集到的 \(k−1\) 种中的一种,第 \(j\) 件商品中有未收集到的 \(N−k+1\) 种赠券中的一种。可知,\(Y_k\) 服从参数为 \(\frac{N−k+1}{N}\) 的几何分布

所以,根据几何分布的性质,有 \(E(Y_k)=\frac{N}{N−k+1}\)。因此,\(E(X)=\sum\limits_{k=1}^NE(Y_k)=\sum\limits_{k=1}^N\frac{N}{N−k+1}=N\sum\limits_{k=1}^N\frac{1}{k}\)

显然,方法二的计算量要小于方法一;而且,方法二的思路更加简单,更加容易理解


随机过程

随机过程

随机过程是描述随机现象随时间推移而演化的一类数学模型。

• 一族随机变量 \(\{X(t),t\in T\}\) ,其中 \(t\) 是参数,\(T\) 为参数集。 \(\cdot T\) 为整数集的随机过程称为随机序列。

Markov 过程

Markov 过程意味着:在已知目前的状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变(过去)

对随机序列 \(\{X_n,n=0,1,2⋯\}\)\(X_n\) 为有限个或可数个),\(P(X_{n+1}=i_{n+1})\) 只与 \(X_n\) 有关, 而与 \(X_{n−1},X_{n−2},⋯\) 无关,则称 \(\{X_n,n=0,1,2⋯\}\) 为 Markov 链。用数学语言描述为\(P(X_{n+1}=i_{n+1}|X_n=i_n,X_{n−1}=i_{n−1},⋯,X_0=i_0)=P(X_{n+1}=i_{n+1}|X_n=i_n)\)


赌徒破产问题

问题描述

一个赌徒在初始时拥有 \(h\) 个单位财富。在每局赌博中以概率 \(p\) 赢一个单位财富,以概率 \(q=1−p\) 输一个单位财富。各局赌博结果独立。当赌徒的财富达到 \(N\) 个单位或 \(0\) 个单位(破产)时停止赌博。求赌徒破产的概率。

记 \(P_h\) 和 \(Q_h\) 分别为赌徒初始财富为 \(h\) 个单位时,财富最终达到 \(N\) 个单位的和 \(0\) 个单位的概率,显然有初始条件 \(P_N=1,P_0=0,Q_N=0,Q_0=1\)


对 \(P_h\),可以由如下 Markov 链得到:

那么有 \(P_h=pP_{h+1}+qP_{h-1},1\leq h\leq N-1\),即 \(P_h-P_{h+1}=\frac{q}{p}(P_{h-1}-P_h)\)

解递推关系,可得 \(P_h=\begin{cases}\frac{1-(\frac{q}{p})^h}{1-(\frac{q}{p})^N}, & q\not=p\\\frac{h}{N}, & q=p\end{cases}\)


\(Q_h\),设想赌徒与另一位在初始时拥有 \(N−h\) 个单位财富的虚拟赌徒赌博。在每局赌博中虚拟赌徒以概率 \(q\) 赢一个单位财富,以概率 \(p\) 输一个单位财富。赌徒破产时,虚拟赌徒财富达到 \(N\) 个单位。

所以真实赌徒从 \(h\) 输到破产就相当于虚拟赌徒从 \(N−h\) 的赚到 \(N\) 个单位,即 \(Q_h=P_{N−h}'\)

因为 \(P_h'=\begin{cases}\frac{1−(\frac{p}{q})^h}{1−(\frac{p}{q})^N}, & p\not=q\\\frac{h}{N}, & p=q\end{cases}\)(输赢需要对调),所以 \(Q_h=P_{N-h}'=\begin{cases}\frac{1−(\frac{p}{q})^{N-h}}{1−(\frac{p}{q})^N}=\frac{(\frac{q}{p})^N-(\frac{q}{p})^h}{(\frac{q}{p})^N-1}, & p\not=q\\\frac{N-h}{N}, & p=q\end{cases}\)


Pascal 问题

问题描述

A,B 两人玩一种游戏,初始时两人各有 12 分。一次掷三枚骰子,若点数恰为 11 则 A 胜 B 负,点数恰为 14 则 B 胜 A 负,其他点数不分胜负。对出现胜负的一次投掷,胜一方增 1 分,负一方减 1 分。分数先为 0 分的一方失败。求双方获胜的概率之比

我们采用多项式的方法计算掷三枚骰子,点数恰为 \(j\) 的概率。

\[ \begin{aligned} (x+x^2+x^3+x^4+x^5+x^6)^3&=x^{18}+3x^{17}+6x^{16}+10x^{15}+15x^{14}+21x^{13}+25x^{12}+27x^{11}\\ &+27x^{10}+25x^9+21x^8+15x^7+10x^6+6x^5+3x^4+x^3 \end{aligned} \]

总可能性为 \(6^3=216\) ,所以点数恰为 \(j\) 的概率为 \(\frac{a_j}{216}\) ,其中 \(a_j\) 为上式中 \(x_j\) 的系数。

一次投掷,A 胜的概率为 \(p=a_{11}{216}=\frac{27}{216}\) ,B 胜的概率为 \(q=\frac{a_{14}}{216}=\frac{15}{216}\),不分胜负的概率为 \(1−p−q=\frac{1−a_{11}−a_{14}}{216}=\frac{174}{216}\)

我们从获胜的角度来看,就是判断从 12 分到 24 分的概率。我们可以用 Markov 链来解决这个问题

\(P_h\) 为 A 从 \(h\) 分到 24 分的概率,\(Q_h\) 为 B 从 \(h\) 分到 24 分的概率,显然有初始条件 \(P_{24}=1,P_0=0,Q_{24}=1,Q_0=0\)

根据 Markov 链,我们可以得到如下递推关系:

\[ \begin{cases} P_h=pP_{h+1}+qP_{h-1}+(1-p-q)P_h, & 1\leq h\leq 23\\ Q_h=qQ_{h+1}+pQ_{h-1}+(1-p-q)Q_h, & 1\leq h\leq 23 \end{cases} \]

即:

\[ \begin{cases} P_h-P_{h+1}=\frac{q}{p}(P_{h-1}-P_h), & 1\leq h \leq 23\\ Q_h-Q_{h+1}=\frac{p}{q}(Q_{h-1}-Q_h), & 1\leq h\leq 23 \end{cases} \]

解递推关系,有 \(P_h=\frac{1-(\frac{q}{p})^h}{1-(\frac{q}{p})^{24}},Q_h=\frac{1-(\frac{p}{q})^h}{1-(\frac{p}{q})^{24}}\)

代入 \(h=12\),得到:

\[ \begin{cases} P_{12}=\frac{1-(\frac{q}{p})^{12}}{1-(\frac{q}{p})^{24}}=\frac{1-(\frac{15}{27})^{12}}{1-(\frac{15}{27})^{24}}=\frac{1-\frac{5^{12}}{3^{24}}}{1-\frac{5^{24}}{3^{48}}}=\frac{3^{48}-3^{24}5^{12}}{3^{48}-5^{24}}\\ Q_{12}=\frac{1-(\frac{p}{q})^{12}}{1-(\frac{p}{q})^{24}}=\frac{1-(\frac{27}{15})^{12}}{1-(\frac{27}{15})^{24}}=\frac{1-\frac{3^{24}}{5^{12}}}{1-\frac{3^{48}}{5^{24}}}=\frac{5^{24}-3^{24}5^{12}}{5^{24}-3^{38}} \end{cases} \]

所以 \(\frac{P_{12}}{Q_{12}}=\frac{3^{48}-3^{24}5^{12}}{3^{24}5^{12}-5^{24}}=\frac{3^{24}}{5^{12}}=\frac{282429536481}{244140625}\)

显然 A 获胜的概率要远大于 B 获胜的概率

评论