跳转至

Chapter 02 : 随机变量及其分布

约 1363 个字 2 张图片 预计阅读时间 7 分钟

随机变量

常见的两类试验结果:

  • 示数的(降雨量、候车人数、发生交通事故的次数……)
  • 示性的(明天天气、化验结果……)

设随机试验的样本空间为 S, 若 X=X(e) 为定义在样本空间 S 上的实值单值函数, eS , 则称 X=X(e)随机变量

常用大写字母 X,Y,Z 来表示随机变量,用小写字母 x,y,z 表示其取值

一般地,若 I 是一个实数集合,则 {XI} 为事件 {e:X(e)I}

常见的随机变量分为离散型、连续型


离散型随机变量

如果随机变量取有限个或可列个值,则此随机变量为离散型随机变量,而若其可能取值为 {xi},则称 P{X=xk}=pk,k=1,2,... 为 X 的概率分布律(Probability Mass Function),也可以用列表的方式表达。

因为样本空间 S={X=x1,X=x2,...,X=xn...} 中各样本点两两不相容,所以:
1=P(S)=i=1+P(X=xi)=i=1+pi


两点分布

如果随机变量 X 的概率分布律为:

X 0 1
P 1-p p

P{X=k}=pk(1p)1k,k=01

则称 X 为服从参数为 p  0−1 分布,也称为两点分布,并记为 XB(1,p) 或者 X01(p)

定义伯努利(Bernoulli)试验为:在 n 次独立重复试验中,每次只有 A 和 A 两种结果,且概率不变,则这一系列试验为伯努利试验。


二项分布

若随机变量 X 表示 n 重伯努利实验中事件 A 发生的次数,其概率分布律为P{X=k}=Cnkpk(1p)nk,k=0,1,2,...,n

则称 X 为服从参数为 (n,p) 的二项分布(Binomial Distribution),并记为 XB(n,p)

根据二项式定理,二项分布有性质:k=0nCnkpk(1p)nk=1

  • 如果遇到来自于两点分布的总体的,容量为 n 的样本的均值 X,则有 nX=i=1nXiB(n,p)

泊松分布

如果随机变量 X 的概率分布律为 P(X=k)=eλλkk!,k=0,1,2,...

其中 λ>0,则称 X 服从参数为 λ 的泊松分布(Poisson distribution),记做 XP(λ)

当 n 足够大,p 充分小(一般要求 n20,p0.1),且 np 保持适当大小时,参数为 (n,p) 的二项分布可以用泊松分布近似描述,其中 λ=np,即 Cnkpk(1p)nkeλλkk!(n+,p<ϵ,λ=np)

Proof

Cnkpk(1p)nk=n!k!(nk)!(λn)k(1λn)nk=λkk!n(n1)...(nk+1)nk[(1λn)nλ]λ(1λn)k

n 充分大,λ 适当时,n(n1)...(nk+1)nk1,(1λn)k1,[(1λn)nλ]λeλ


超几何分布

如果随机变量 X 的概率分布律为 P{X=k}=CakCbnkCa+bn,k=l1,l1+1,...,l2,l1=max{0,nb},l2=min{n,a}

则称 X 为服从超几何分布(Hypergeometric Distribution),并记为 XH(n,a,N)

  • 其意义为,如:a 白球,Na 红球,取 n 次得到 X 个白球

几何分布

如果随机变量 X 的概率分布律为 P{X=k}=p(1p)k1,k=1,2,...

则称 X 为服从参数为 p 的几何分布(Geometric Distribution),记为 XG(p)

  • 其意义为事件 A 发生的概率为 p,则 X 为第一次发生 A 的时候,经历了多少次试验

连续型随机变量

分布函数

定义:设 X 为随机变量,x 为任意实数,函数 F(x)=P{Xx} 为随机变量 X 的概率分布函数,简称为分布函数(Distribution Function)。(离散随机变量同样可以有分布函数)

则有结论:P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)

当 X 为离散型随机变量时,设 X 的概率分布律为 P{X=xi}=pi,i=1,2,...,则 X 的分布函数为 F(x)=P{Xx}=xixP{X=xi}

关于 F(x) 有以下结论:

  • F(x) 单调不减;
  • 0F(x)1 且 F()=0F(+)=1
  • F(x) 右连续,即 F(x+0)=F(x)
  • P(a<Xb)=F(b)F(a)
  • P{X=a}=P{Xa}P{X<a}=F(a)limxaP{Xx}=F(a)F(a0)

密度函数

如果对于随机变量 X,其分布函数为 F(x),若存在一个非负的实函数 f(x),使对于任意实数 x,有 F(x)=xf(t)dt,则称 X 为连续型随机变量,并且称 f(x) 为 X概率密度函数(Probability Density Function),简称为密度函数

关于 f(x) 有以下结论:

  • f(x)0
  • f(x)dx=1
  • x1,x2\R(x1<x2),P{x1<Xx2}=F(x2)F(x1)=x1x2f(t)dt
  • f(x) 的连续点 x 处,F(x)=f(x)
  • P{X=a}=0,即连续型随机变量任取一个定值的概率为零,因此连续型随机变量落在开区间与相应闭区间上的概率相等;

均匀分布

设随机变量 X 有密度函数:

f(x)={1ba,x(a,b)0,else

则称 X 服从区间 (a,b) 上的均匀分布,并记为 XU(a,b)

而得到对应的分布函数为:

F(x)={0x<a xabaax<b 1xb


指数分布

若随机变量 X 具有密度函数:

f(x)={λeλx,x>00,x0

也有地方写成这样:

f(x)={1θe1θx,x>00,x0

其中 λ>0,则称 X 服从参数为 λ 的指数分布(Exponential Distribution),记为 XE(λ)

指数分布对应的分布函数为:

F(x)=xf(t)dt={1eλx,x>00,x0
  • 指数分布具有无记忆性,即 P(X>s|X>t0)=P(X>st0)

正态分布

如果随机变量 X 具有密度函数:

f(x)=12πσe(xμ)22σ2,|x|<+

其中 σ>0,|μ|<+ 为常数,则称 X 服从参数为 (μ,σ) 的正态分布(Normal Distribution / Gauss Distribution),或者称 X 为正态变量,记为 XN(μ,σ2)

其对应的分布函数为:

F(x)=x12πσe(tμ)22σ2dt

在上面出现的式子中,μ 为位置参数,决定了分布图像的对称轴位置;σ 为尺度参数,决定了形状,σ 越小,图像越集中。

特别地,当 μ=0,σ=1 时,如果记这时的正态变量为 Z,即 ZN(0,1) 则它服从标准正态分布(Standard Normal Distribution)。则其密度函数为:φ(x)=12πex22,|x|<+

则对应的分布函数Φ(x)=x12πet22dt,显然有 Φ(x)+Φ(x)=1

由于大部分情况下其无法计算,所以我们需要查获得具体值,以下为标准正态分布表:


有关正态分布的重要结论:

  • 若 XN(μ,σ2),则 Y=aX+bN(aμ+b,a2σ2)
    • 标准化:特别地,若 XN(μ,σ2),则 XμσN(0,1)
    • 即正态分布的随机变量线性变换后正态性不变;
  • +ex2Adx=Aπ(A>0)(可以根据正态分布 N(0,A2) 推出)

对于不是标准正态分布的正态分布,我们可以标准化来转换为标准正态分布:

  • 若 XN(μ,σ2),则 P{a<X<b}=P{aμσ<Xμσ<bμσ}=Φ(bμσ)Φ(aμσ)
    • 特别地,若 XN(μ,σ2),则 P{|Xμ|<kσ}=Φ(k)Φ(k)=2Φ(k)1
  • 3σ 法则

随机变量函数的分布

如果:

  • X 为连续型随机变量,且其密度函数为 fX(x)
  • 随机变量 Y=g(X)
  • 函数 y=g(x) 为一严格单调(增/减)函数
  • 函数 y=g(x) 可微

则记 y=g(x) 的反函数为 x=h(y),得到 Y 的密度函数为:fY(y)={fX(h(y))×|h(y)|,yD0,yD,其中 D 为 y=g(x) 的值域


一般情况下,当没有第三个条件时,常规方法如下:

  • 先找自变量 y 的分段点
    • x 的分段代入 y=g(x) 得到 y 的分段
    • 有时还需要求 y=g(x) 的最值
  • 再根据以上分段点,分区间求 FY(y)=P{Yy}=P{g(x)y}=fX(x)dx
  • 求导,fY(y)=FY(y)

Example

XfX(x)={x80<x<40,求 Y=2X+8 的密度函数 fY(y)

先找自变量 y 的分段点,y=8,16

分区间:

  • y<8 时,FY(y)=P{Yy}=P{2x+8y}=P{xy82}=y82fX(x)dx=0
  • 8y<16 时,FY(y)=P{Yy}=y82fX(x)dx=00dx+0y82x8dx=(y8)264
  • y16 时,FY(y)=P{Yy}=y82fX(x)dx=00dx+04x8dx+4y82fX(x)dx=1

综上 FY(y)={0y<8(y8)2648y<161y16

求导得 fY(y)=FY(y)={132(y8)8y<160

y=2x+8 反函数为 x=y82=h(y)

用公式得 fY(y)={fX(h(y))|h(y)|=y816·12=y8328<y<160

评论