跳转至

Chapter 02 : 随机变量及其分布

随机变量

常见的两类试验结果:

  • 示数的(降雨量、候车人数、发生交通事故的次数……)
  • 示性的(明天天气、化验结果……)

设随机试验的样本空间为 \(S\), 若 \(X = X (e)\) 为定义在样本空间 \(S\) 上的实值单值函数, \(e\in S\) , 则称 \(X = X (e)\)随机变量

常用大写字母 \(X,Y,Z\) 来表示随机变量,用小写字母 \(x,y,z\) 表示其取值

一般地,若 \(I\) 是一个实数集合,则 \(\{X\in I\}\) 为事件 \(\{e:X(e)\in I\}\)

常见的随机变量分为离散型、连续型


离散型随机变量

如果随机变量取有限个或可列个值,则此随机变量为离散型随机变量,而若其可能取值为 \(\{x_i\}\),则称 \(P\{X=x_k\}=p_k,k=1,2,...\) 为 \(X\) 的概率分布律(probability mass function),也可以用列表的方式表达。

因为样本空间 \(S=\{X=x_1,X=x_2,...,X=x_n...\}\) 中各样本点两两不相容,所以:
\(1=P(S)=\sum\limits_{i=1}^{+\infty}P(X=x_i)=\sum\limits_{i=1}^{+\infty}p_i\)


两点分布

如果随机变量 \(X\) 的概率分布律为:

X 0 1
P 1-p p

\(P\{X=k\}=p^k(1−p)^{1−k},k=0 或 1\)

则称 \(X\) 为服从参数为 \(p\)  0−1 分布,也称为两点分布,并记为 \(X∼B(1,p)\) 或者 \(X∼0−1(p)\)

定义伯努利(Bernoulli)试验为:在 \(n\) 次独立重复试验中,每次只有 \(A\) 和 \(\overline{A}\) 两种结果,且概率不变,则这一系列试验为伯努利试验。


二项分布

若随机变量 \(X\) 表示 \(n\) 重伯努利实验中事件 \(A\) 发生的次数,其概率分布律为\(P\{X=k\}=C_n^kp^k(1−p)^{n−k},k=0,1,2,...,n\)

则称 \(X\) 为服从参数为 \((n,p)\) 的二项分布(binomial distribution),并记为 \(X∼B(n,p)\)

根据二项式定理,二项分布有性质:\(\sum\limits_{k=0}^nC_n^kp^k(1−p)^{n−k}=1\)

  • 如果遇到来自于两点分布的总体的,容量为 \(n\) 的样本的均值 \(\overline{X}\),则有 \(n⋅\overline{X}=\sum\limits_{i=1}^nX_i∼B(n,p)\)

泊松分布

如果随机变量 \(X\) 的概率分布律为 \(P(X=k)=\frac{e^{−\lambda}\lambda^k}{k!},k=0,1,2,...\)

其中 \(\lambda>0\),则称 \(X\) 服从参数为 \(\lambda\) 的泊松分布(Poisson distribution),记做 \(X∼P(\lambda)\)

当 \(n\) 足够大,\(p\) 充分小(一般要求 \(p<0.1\)),且 \(np\) 保持适当大小时,参数为 \((n,p)\) 的二项分布可以用泊松分布近似描述,其中 \(\lambda=np\),即 \(C_n^kp^k(1−p)^{n−k}∼\frac{e^{−λ}λ^k}{k!}(n\rightarrow +\infty,p<\epsilon,\lambda=np)\)

Proof

\[ \begin{aligned} C_n^kp^k(1-p)^{n-k}&=\frac{n!}{k!(n-k)!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}\\ &=\frac{\lambda^k}{k!}\frac{n(n-1)...(n-k+1)}{n^k}\frac{[(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}}]^{-\lambda}}{(1-\frac{\lambda}{n})^k} \end{aligned} \]

\(n\) 充分大,\(\lambda\) 适当时,\(\frac{n(n-1)...(n-k+1)}{n^k}\approx 1,(1-\frac{\lambda}{n})^k\approx 1,[(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}}]^{-\lambda}\approx e^{-\lambda}\)


超几何分布与几何分布

如果随机变量 \(X\) 的概率分布律为 \(P\{X=k\}=\frac{C_a^kC_b^{n−k}}{C_{a+b}^n},k=l_1,l_1+1,...,l_2\)

则称 \(X\) 为服从超几何分布(hypergeometric distribution),并记为 \(X∼H(n,N,a)\)

  • 其意义为,如:\(a\) 白球,\(N-a\) 红球,取 \(n\) 次得到 \(X\) 个白球

如果随机变量 \(X\) 的概率分布律为 \(P\{X=k\}=p(1−p)^{k−1},k=1,2,...\)

则称 \(X\) 为服从参数为 \(p\) 的几何分布(geometric distribution)


连续型随机变量

分布函数

定义:设 \(X\) 为随机变量,\(x\) 为任意实数,函数 \(F(x)=P\{X\leq x\}\) 为随机变量 \(X\) 的概率分布函数,简称为分布函数(distribution function)。(离散随机变量同样可以有分布函数)

则有结论:\(P\{x_1<X\leq x_2\}=P\{X\leq x_2\}−P\{X\leq x_1\}=F(x_2)−F(x_1)\)

当 \(X\) 为离散型随机变量时,设 \(X\) 的概率分布律为 \(P\{X=x_i\}=p_i,i=1,2,...\),则 \(X\) 的分布函数为 \(F(x)=P\{X\leq x\}=\sum\limits_{x_i\leq x}P\{X=x_i\}\)

关于 \(F(x)\) 有以下结论:

  • \(F(x)\) 单调不减;
  • \(0\leq F(x)\leq 1\) 且 \(F(−\infty)=0\)\(F(+\infty)=1\)
  • \(F(x)\) 右连续,即 \(F(x+0)=F(x)\)
  • \(P(a<X\leq b)=F(b)−F(a)\)

密度函数

如果对于随机变量 \(X\),其分布函数为 \(F(x)\),若存在一个非负的实函数 \(f(x)\),使对于任意实数 \(x\),有 \(F(x)=\int_{−\infty}^xf(t)dt\),则称 \(X\) 为连续型随机变量,并且称 \(f(x)\) 为 \(X\)概率密度函数(probability density function),简称为密度函数

关于 \(f(x)\) 有以下结论:

  • \(f(x)\geq 0\)
  • \(\int_{−\infty}^{\infty}f(x)dx=1\)
  • \(\forall x_1,x_2\in\R(x_1<x_2),P\{x_1<X\leq x_2\}=F(x_2)−F(x_1)=\int_{x_1}^{x_2}f(t)dt\)
  • \(f(x)\) 的连续点 \(x\) 处,\(F'(x)=f(x)\)
  • \(P\{X=a\}=0\),即连续型随机变量任取一个定值的概率为零,因此连续型随机变量落在开区间与相应闭区间上的概率相等;

均匀分布

设随机变量 \(X\) 有密度函数:

\[ f(x)=\begin{cases} \begin{aligned} \frac{1}{b−a}&,x\in (a,b)\\ 0&,\text{else} \end{aligned} \end{cases} \]

则称 \(X\) 服从区间 \((a,b)\) 上的均匀分布,并记为 \(X∼U(a,b)\)

而得到对应的分布函数为:

$$ F(x)=\begin{cases} 0,x<a\ \frac{x−a}{b−a},a\leq x<b\ 1,x\geq b \end{cases} $$​


指数分布

若随机变量 \(X\) 具有密度函数:

\[ f(x)=\begin{cases} \begin{aligned} \lambda e^{−\lambda x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

也有地方写成这样:

\[ f(x)=\begin{cases} \begin{aligned} \frac{1}{\theta}e^{-\frac{1}{\theta}x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

其中 \(\lambda>0\),则称 \(X\) 服从参数为 \(\lambda\) 的指数分布(exponential distribution),记为 \(X∼E(\lambda)\)

指数分布对应的分布函数为:

\[ F(x)=\int_{−\infty}^xf(t)dt=\begin{cases} \begin{aligned} 1−e^{−\lambda x},x>0\\ 0,x\leq 0 \end{aligned} \end{cases} \]

指数分布具有无记忆性,即 \(P(X>s|X>t_0)=P(X>s−t_0)\)


正态分布

如果随机变量 \(X\) 具有密度函数:

\[ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{−\frac{(x−\mu)^2}{2\sigma^2}},|x|<+\infty \]

其中 \(\sigma>0,|\mu|<+\infty\) 为常数,则称 \(X\) 服从参数为 \((\mu,\sigma)\) 的正态分布(normal distribution / Gauss distribution),或者称 \(X\) 为正态变量,记为 \(X∼N(\mu,\sigma^2)\)

其对应的分布函数为:

\[ F(x)=\int_{−\infty}^x\frac{1}{\sqrt{2π}\sigma}e^{−\frac{(t−μ)^2}{2\sigma^2}}dt \]

在上面出现的式子中,\(\mu\) 为位置参数,决定了分布图像的对称轴位置;\(\sigma\) 为尺度参数,决定了形状,\(\sigma\) 越小,图像越集中。

特别的,当 \(\mu=0,\sigma=1\) 时,如果记这时的正态变量为 \(Z\),即 \(Z∼N(0,1)\) 则它服从标准正态分布(standard normal distribution)。则其密度函数为:\(\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{−\frac{x^2}{2}},|x|<+\infty\)

则对应的分布函数\(\Phi(x)=\int_{−\infty}^x\frac{1}{\sqrt{2\pi}}e^{−\frac{t^2}{2}}dt\),显然有 \(\Phi(x)+\Phi(−x)=1\)

由于其无法计算,所以我们需要查获得具体值,以下为标准正态分布表:


而对于不是标准正态分布的正态分布,我们可以通过线性变换(标准化)来转换为标准正态分布:

  • 若 \(X∼N(\mu,\sigma^2)\),则 \(P\{a<X<b\}=P\{\frac{a−\mu}{\sigma}<\frac{X−\mu}{\sigma}<\frac{b−\mu}{\sigma}\}=\Phi(\frac{b−\mu}{\sigma})−\Phi(\frac{a−\mu}{\sigma})\)
  • 特别的:若 \(X∼N(\mu,\sigma^2)\),则 \(P\{|X−\mu|<k\sigma\}=\Phi(k)−\Phi(−k)=2\Phi(k)−1\)
  • \(3\sigma\) 法则

有关正态分布的重要结论:

若 \(X∼N(\mu,\sigma^2)\),则 \(Y=aX+b∼N(a\mu+b,a^2\sigma^2)\)

  • 标准化:特别的,若 \(X∼N(\mu,\sigma^2)\),则 \(\frac{X−\mu}{\sigma}∼N(0,1)\)
  • 即正态分布的随机变量线性变换后正态性不变;

随机变量函数的分布

如果:

  • \(X\) 为连续型随机变量,且其密度函数为 \(f_X(x)\)
  • 随机变量 \(Y=g(X)\)
  • 函数 \(y=g(x)\) 为一严格单调(增/减)函数,并且可微;

则记 \(y=g(x)\) 的反函数为 \(x=h(y)\),得到 \(Y\) 的密度函数为:\(f_Y(y)=\begin{cases}\begin{aligned}f_X(h(y))\times |h'(y)|,y\in D\\0,y\not\in D\end{aligned}\end{cases}\),其中 \(D\) 为 \(y=g(x)\) 的值域。

评论