Chapter 02 : 随机变量及其分布¶

📖 阅读信息

阅读时间：2 分钟 | 中文字符：768

随机变量¶

常见的两类试验结果：

示数的（降雨量、候车人数、发生交通事故的次数……）
示性的（明天天气、化验结果……）

设随机试验的样本空间为 $S$, 若 $X = X (e)$ 为定义在样本空间 $S$ 上的实值单值函数, $e\in S$ , 则称 $X = X (e)$ 为随机变量

常用大写字母 $X,Y,Z$ 来表示随机变量，用小写字母 $x,y,z$ 表示其取值。

一般地，若 $I$ 是一个实数集合，则 $\{X\in I\}$ 为事件 $\{e:X(e)\in I\}$

常见的随机变量分为离散型、连续型

离散型随机变量¶

如果随机变量取有限个或可列个值，则此随机变量为离散型随机变量，而若其可能取值为 $\{x_i\}$，则称 $P\{X=x_k\}=p_k,k=1,2,...$ 为 $X$ 的概率分布律（Probability Mass Function），也可以用列表的方式表达。

因为样本空间 $S=\{X=x_1,X=x_2,...,X=x_n...\}$ 中各样本点两两不相容，所以：
$1=P(S)=\sum\limits_{i=1}^{+\infty}P(X=x_i)=\sum\limits_{i=1}^{+\infty}p_i$

两点分布¶

如果随机变量 $X$ 的概率分布律为：

X	0	1
P	1-p	p

$P\{X=k\}=p^k(1−p)^{1−k},k=0 或 1$

则称 $X$ 为服从参数为 $p$ 的 0−1 分布，也称为两点分布，并记为 $X∼B(1,p)$ 或者 $X∼0−1(p)$

定义伯努利（Bernoulli）试验为：在 $n$ 次独立重复试验中，每次只有 $A$ 和 $\overline{A}$ 两种结果，且概率不变，则这一系列试验为伯努利试验。

二项分布¶

若随机变量 $X$ 表示 $n$ 重伯努利实验中事件 $A$ 发生的次数，其概率分布律为$P\{X=k\}=C_n^kp^k(1−p)^{n−k},k=0,1,2,...,n$

则称 $X$ 为服从参数为 $(n,p)$ 的二项分布（Binomial Distribution），并记为 $X∼B(n,p)$

根据二项式定理，二项分布有性质：$\sum\limits_{k=0}^nC_n^kp^k(1−p)^{n−k}=1$

如果遇到来自于两点分布的总体的，容量为 $n$ 的样本的均值 $\overline{X}$，则有 $n⋅\overline{X}=\sum\limits_{i=1}^nX_i∼B(n,p)$

泊松分布¶

如果随机变量 $X$ 的概率分布律为 $P(X=k)=\frac{e^{−\lambda}\lambda^k}{k!},k=0,1,2,...$

其中 $\lambda>0$，则称 $X$ 服从参数为 $\lambda$ 的泊松分布（Poisson distribution），记做 $X∼P(\lambda)$

当 $n$ 足够大，$p$ 充分小(一般要求 $n\geq 20,p\leq 0.1$)，且 $np$ 保持适当大小时，参数为 $(n,p)$ 的二项分布可以用泊松分布近似描述，其中 $\lambda=np$，即 $C_n^kp^k(1−p)^{n−k}∼\frac{e^{−λ}λ^k}{k!}(n\rightarrow +\infty,p<\epsilon,\lambda=np)$

Proof

\[ \begin{aligned} C_n^kp^k(1-p)^{n-k}&=\frac{n!}{k!(n-k)!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}\\ &=\frac{\lambda^k}{k!}\frac{n(n-1)...(n-k+1)}{n^k}\frac{[(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}}]^{-\lambda}}{(1-\frac{\lambda}{n})^k} \end{aligned} \]

当 $n$ 充分大，$\lambda$ 适当时，$\frac{n(n-1)...(n-k+1)}{n^k}\approx 1,(1-\frac{\lambda}{n})^k\approx 1,[(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}}]^{-\lambda}\approx e^{-\lambda}$

超几何分布¶

如果随机变量 $X$ 的概率分布律为 $P\{X=k\}=\frac{C_a^kC_b^{n−k}}{C_{a+b}^n},k=l_1,l_1+1,...,l_2,l_1=\max\{0,n-b\},l_2=\min\{n,a\}$

则称 $X$ 为服从超几何分布（Hypergeometric Distribution），并记为 $X∼H(n,a,N)$

其意义为，如：$a$ 白球，$N-a$ 红球，取 $n$ 次得到 $X$ 个白球

几何分布¶

如果随机变量 $X$ 的概率分布律为 $P\{X=k\}=p(1−p)^{k−1},k=1,2,...$

则称 $X$ 为服从参数为 $p$ 的几何分布（Geometric Distribution），记为 $X∼G(p)$

其意义为事件 $A$ 发生的概率为 $p$，则 $X$ 为第一次发生 $A$ 的时候，经历了多少次试验

连续型随机变量¶

分布函数¶

定义：设 $X$ 为随机变量，$x$ 为任意实数，函数 $F(x)=P\{X\leq x\}$ 为随机变量 $X$ 的概率分布函数，简称为分布函数（Distribution Function）。（离散随机变量同样可以有分布函数）

则有结论：$P\{x_1<X\leq x_2\}=P\{X\leq x_2\}−P\{X\leq x_1\}=F(x_2)−F(x_1)$

当 $X$ 为离散型随机变量时，设 $X$ 的概率分布律为 $P\{X=x_i\}=p_i,i=1,2,...$，则 $X$ 的分布函数为 $F(x)=P\{X\leq x\}=\sum\limits_{x_i\leq x}P\{X=x_i\}$

关于 $F(x)$ 有以下结论：

$F(x)$ 单调不减；
$0\leq F(x)\leq 1$ 且 $F(−\infty)=0$，$F(+\infty)=1$；
$F(x)$ 右连续，即 $F(x+0)=F(x)$；
$P(a<X\leq b)=F(b)−F(a)$；
$P\{X=a\}=P\{X\leq a\}-P\{X<a\}=F(a)-\lim\limits_{x\rightarrow a^-}P\{X\leq x\}=F(a)-F(a-0)$

密度函数¶

如果对于随机变量 $X$，其分布函数为 $F(x)$，若存在一个非负的实函数 $f(x)$，使对于任意实数 $x$，有 $F(x)=\int_{−\infty}^xf(t)dt$，则称 $X$ 为连续型随机变量，并且称 $f(x)$ 为 $X$ 的概率密度函数（Probability Density Function），简称为密度函数。

关于 $f(x)$ 有以下结论：

$f(x)\geq 0$；
$\int_{−\infty}^{\infty}f(x)dx=1$；
$\forall x_1,x_2\in\R(x_1<x_2),P\{x_1<X\leq x_2\}=F(x_2)−F(x_1)=\int_{x_1}^{x_2}f(t)dt$；
在 $f(x)$ 的连续点 $x$ 处，$F'(x)=f(x)$
$P\{X=a\}=0$，即连续型随机变量任取一个定值的概率为零，因此连续型随机变量落在开区间与相应闭区间上的概率相等；

均匀分布¶

设随机变量 $X$ 有密度函数：

\[ f(x)=\begin{cases} \begin{aligned} \frac{1}{b−a}&,x\in (a,b)\\ 0&,\text{else} \end{aligned} \end{cases} \]

则称 $X$ 服从区间 $(a,b)$ 上的均匀分布，并记为 $X∼U(a,b)$

而得到对应的分布函数为：

$$ F(x)=\begin{cases} 0 & x<a\ \frac{x−a}{b−a} & a\leq x<b\ 1 & x\geq b \end{cases} $$

指数分布¶

若随机变量 $X$ 具有密度函数：

\[ f(x)=\begin{cases} \begin{aligned} \lambda e^{−\lambda x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

也有地方写成这样：

\[ f(x)=\begin{cases} \begin{aligned} \frac{1}{\theta}e^{-\frac{1}{\theta}x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

其中 $\lambda>0$，则称 $X$ 服从参数为 $\lambda$ 的指数分布（Exponential Distribution），记为 $X∼E(\lambda)$

指数分布对应的分布函数为：

\[ F(x)=\int_{−\infty}^xf(t)dt=\begin{cases} \begin{aligned} 1−e^{−\lambda x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

指数分布具有无记忆性，即 $P(X>s|X>t_0)=P(X>s−t_0)$

正态分布¶

如果随机变量 $X$ 具有密度函数：

\[ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{−\frac{(x−\mu)^2}{2\sigma^2}},|x|<+\infty \]

其中 $\sigma>0,|\mu|<+\infty$ 为常数，则称 $X$ 服从参数为 $(\mu,\sigma)$ 的正态分布（Normal Distribution / Gauss Distribution），或者称 $X$ 为正态变量，记为 $X∼N(\mu,\sigma^2)$。

其对应的分布函数为：

\[ F(x)=\int_{−\infty}^x\frac{1}{\sqrt{2π}\sigma}e^{−\frac{(t−μ)^2}{2\sigma^2}}dt \]

在上面出现的式子中，$\mu$ 为位置参数，决定了分布图像的对称轴位置；$\sigma$ 为尺度参数，决定了形状，$\sigma$ 越小，图像越集中。

特别地，当 $\mu=0,\sigma=1$ 时，如果记这时的正态变量为 $Z$，即 $Z∼N(0,1)$ 则它服从标准正态分布（Standard Normal Distribution）。则其密度函数为：$\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{−\frac{x^2}{2}},|x|<+\infty$

则对应的分布函数为 $\Phi(x)=\int_{−\infty}^x\frac{1}{\sqrt{2\pi}}e^{−\frac{t^2}{2}}dt$，显然有 $\Phi(x)+\Phi(−x)=1$

由于大部分情况下其无法计算，所以我们需要查表获得具体值，以下为标准正态分布表：

有关正态分布的重要结论：

若 $X∼N(\mu,\sigma^2)$，则 $Y=aX+b∼N(a\mu+b,a^2\sigma^2)$
- 标准化：特别地，若 $X∼N(\mu,\sigma^2)$，则 $\frac{X−\mu}{\sigma}∼N(0,1)$；
- 即正态分布的随机变量线性变换后正态性不变；
$\int_{-\infty}^{+\infty}e^{-\frac{x^2}{A}}dx=\sqrt{A\pi}(A>0)$（可以根据正态分布 $N(0,\frac{A}{2})$ 推出）

对于不是标准正态分布的正态分布，我们可以标准化来转换为标准正态分布：

若 $X∼N(\mu,\sigma^2)$，则 $P\{a<X<b\}=P\{\frac{a−\mu}{\sigma}<\frac{X−\mu}{\sigma}<\frac{b−\mu}{\sigma}\}=\Phi(\frac{b−\mu}{\sigma})−\Phi(\frac{a−\mu}{\sigma})$
- 特别地，若 $X∼N(\mu,\sigma^2)$，则 $P\{|X−\mu|<k\sigma\}=\Phi(k)−\Phi(−k)=2\Phi(k)−1$
$3\sigma$ 法则

随机变量函数的分布¶

如果：

$X$ 为连续型随机变量，且其密度函数为 $f_X(x)$；
随机变量 $Y=g(X)$；
函数 $y=g(x)$ 为一严格单调（增/减）函数
函数 $y=g(x)$ 可微

则记 $y=g(x)$ 的反函数为 $x=h(y)$，得到 $Y$ 的密度函数为：$f_Y(y)=\begin{cases}\begin{aligned}f_X(h(y))\times |h'(y)|,y\in D\\0,y\not\in D\end{aligned}\end{cases}$，其中 $D$ 为 $y=g(x)$ 的值域

一般情况下，当没有第三个条件时，常规方法如下：

先找自变量 $y$ 的分段点
- 将 $x$ 的分段代入 $y=g(x)$ 得到 $y$ 的分段
- 有时还需要求 $y=g(x)$ 的最值
再根据以上分段点，分区间求 $F_Y(y)=P\{Y\leq y\}\stackrel{代入}{=}P\{g(x)\leq y\}=\int_{区间}f_X(x)dx$
求导，$f_Y(y)=F_Y'(y)$

Example

设 $X∼f_X(x)=\begin{cases}\frac{x}{8} & 0<x<4\\0 & 其他\end{cases}$，求 $Y=2X+8$ 的密度函数 $f_Y(y)$

常规方法特殊方法

先找自变量 $y$ 的分段点，$y=8,16$

分区间：

当 $y<8$ 时，$F_Y(y)=P\{Y\leq y\}=P\{2x+8\leq y\}=P\{x\leq\frac{y-8}{2}\}=\int_{-\infty}^{\frac{y-8}{2}}f_X(x)dx=0$
当 $8\leq y<16$ 时，$F_Y(y)=P\{Y\leq y\}=\int_{-\infty}^{\frac{y-8}{2}}f_X(x)dx=\int_{-\infty}^0 0dx+\int_0^{\frac{y-8}{2}}\frac{x}{8}dx=\frac{(y-8)^2}{64}$
当 $y\geq 16$ 时，$F_Y(y)=P\{Y\leq y\}=\int_{-\infty}^{\frac{y-8}{2}}f_X(x)dx=\int_{-\infty}^0 0dx+\int_0^4\frac{x}{8}dx+\int_{4}^{\frac{y-8}{2}}f_X(x)dx=1$

综上 $F_Y(y)=\begin{cases}0 & y<8\\\frac{(y-8)^2}{64} & 8\leq y<16\\1 & y\geq 16\end{cases}$

求导得 $f_Y(y)=F_Y'(y)=\begin{cases}\frac{1}{32}(y-8) & 8\leq y<16\\0 & 其他\end{cases}$

$y=2x+8$ 反函数为 $x=\frac{y-8}{2}=h(y)$

用公式得 $f_Y(y)=\begin{cases}f_X(h(y))|h'(y)|=\frac{y-8}{16}·\frac{1}{2}=\frac{y-8}{32} & 8<y<16\\ 0 & 其他\end{cases}$

💬 评论

评论系统加载中...