我们说一个 RV X 遵循二项分布是指
在 n 次成功概率为 p 独立伯努利试验中,成功次数为 x。
记作 X∼B(n,p)。其 pmf
f(x)=(xn)px(1−p)n−x
mgf
M(t)=x=0∑netx(xn)px(1−p)n−x=(1−p+pet)n
which can comfirm that
M′(t)=npet(1−p+pet)n−1,M′′(t)=n(n−1)p2e2t(1−p+pet)n−2+npet(1−p+pet)n−1
μ=M′(0)=np,σ2=M′′(0)−M′2(0)=np(p(n−1))+np−(np)2=np(1−p)
当 n→∞,p→0, 记 λ=np 即均值,可被描述为
将某时间段均分为 n 个单位时间段,某事件在该单位时间段发生的概率为 p,事件在该时间段发生次数的均值即为 λ。
若 RV X 表示时间段上事件发生的次数,我们称 X 遵循 Possion Distrubution,记作 X∼Poisson(λ)。其 pmf
f(x)=n→∞limx!(n−x)!n!(nλ)x(1−nλ)n−x=x!λxn→∞limnx(n−x)!n!n→∞lim(1−nλ)n−x=x!λxe−λ
mgf
M(t)=x≥0∑etxx!λxe−λ=e−λx≥0∑x!(λet)x=eλ(et−1)
均值和方差均为 λ obviously。
我们继续考察观察到(observe)Possion Distrubution 事件第一次的出现时间 X,这意味着 RV X 是连续的。考察其 cdf
F(x)=P(X≥x)=1−P(X≤x)=1−e−λx
其中第三个等号表示事件在时间段 [0,x] 从未发生。则 RV X 的 pdf
f(x)=F′(x)=λe−λx
记 θ=λ−1 为 Exponential Distribution 的参数,被描述为单位时间内事件的发生率,则 RV X 遵循 Exponential Distribution 意味着其 pmf
f(x)=θ1e−θx
更进一步的,如果我们考察观察到 Possion Distrubution 发生 α 次的第一次出现时间 X,考察其 cdf
F(x)=P(X≥x)=1−k=0∑α−1k!(λx)ke−λx
pdf
f(x)=F′(x)=λe−λx−e−λxk=1∑α−1(k!k(λx)k−1λ−k!(λx)kλ)=λe−λx−e−λx(λ−(α−1)!(λx)α−1λ)=e−λxλα(α−1)!xα−1
这样的 RV 被称为遵循 Erlang Distribution,要求 α 为正整数,其 cdf 由上文给出。
如果将 α 扩展到实数域,则要将阶乘扩展到实数域,记实数域上的函数 Γ(x) 满足
∫0∞e−λxλαΓ(α)xα−1dx=1
意味着
Γ(α)=∫0∞e−λx(λx)α−1dλx=∫0∞e−yyα−1dy
这给出了 Gamma 函数的定义,据此我们说 X 遵循 Gamma Distribution,是指其 pdf
f(x)=e−θxθ−αxα−1Γ−1(α)
其中 θ,α 为参数,定义由上文给出。
其 mgf
M(t)=Γ−1(α)θ−α∫0∞ex(t−θ−1)xα−1dx=(θ−1−t)−αθ−αΓ−1(α)∫0∞e−(θ−1−t)x((θ−1−t)x)α−1d((θ−1−t)x)=(1−θt)−α
其均值和方差 μ=αθ, σ2=αθ2。不难验证 Exponential Distribution 是 α=1 的 Gamma Distribution。
特别的,我们能够注意到,两个遵循同一发生率的 Gamma Distribution 的 RV,其代数和应当也会遵循 Gamma Distribution,其发生次数应当为二者之和,形式化的
对于 X1∼Γ(α1,θ),X2∼Γ(α2,θ),X1+X2∼Γ(α1+α2,θ)
这一性质一般被描述为 Gamma Distribution 的可加性,接下来来证明这一性质。
令 Z=X1+X2,其 pdf
f(z)=∫−∞∞f1(x)f2(z−x)dx=θ−(α1+α2)Γ−1(α1)Γ−1(α2)e−θz∫0zxα1−1(z−x)α2−1dx=e−θzzα1+α2−1θ−(α1+α2)Γ−1(α1)Γ−1(α2)∫01tα1−1(1−t)α2−1dt
第三个等号换元 t=zx,将 Cyan 色部分设为 A,则有
1=∫0∞Aθ−(α1+α2)e−θzzα1+α2−1dz=A∫0∞e−θz(θz)α1+α2−1dθz=AΓ(α1+α2)⟹A=Γ−1(α1+α2)
代回原式
f(z)=e−θzθ−(α1+α2)zα1+α2−1Γ−1(α1+α2)
也即 X1+X2=Z∼Γ(α1+α2,θ)
让我们回到一切的起点,对于遵循二项分布 B(n,p) 的随机变量 Z,当 n→∞,令 X=σZ−μ=np(1−p)Z−np,其 pmf
P(Z=k)=n→∞lim(kn)pk(1−p)n−k
利用斯特林公式,并取对数
lnP(Z=k)=n→∞limnlnn+klnp+(n−k)ln(1−p)−21ln(2πk(n−k))−klnk−(n−k)ln(n−k)
其中 k=np+xσ,则 npxσ→0,n(1−p)xσ→0 当 n→∞,二者同在 O(n−0.5),意味着我们只需展开到泰勒 x2 项。
=n→∞limnlnn+klnp+(n−k)ln(1−p)+21n−21ln(2πk(n−k))−klnnp−(n−k)ln(n(1−p))−npkxσ+2n2p2kx2σ2+n(1−p)(n−k)xσ+2n2(1−p)2(n−k)x2σ2=n→∞lim21lnn−21ln(2π(np+xσ)(n−np−xσ))−σkx(1−p)−(n−k)xp+2σ2kx2(1−p)2+(n−k)x2p2=n→∞lim21lnn−21ln(2πn2p(1−p)(1+npxσ)(1−n(1−p)xσ))−x2+2x2+o(x3)=−21ln(2πnp(1−p))−2x2
还原对数可得
P(Z=k)=2πnp(1−p)e−2x2
也即导出了正态分布 Z∼N(np,np(1−p)) 的 pdf,也即说明了 X∼N(0,1)。
更一般的,我们说 RV X∼N(μ,σ2),是指它的 pdf
f(x)=2πσ21exp(−σ2(x−μ)2)
当 μ=0,σ2=1 时,我们说 X 遵循标准正态分布。其 cdf
Φ(x)=∫−∞x2π1exp(−2x2)dx
更进一步的,如果 k 个 RV Xi∼N(0,1),考虑 Z=∑Xi2。
先考虑 k=1 的情况,也即
f(z)=dzdP(∣X∣≤z)=dzdzdzd∫−zz2π1e−2x2dx=2z1×2π2e−2z=Γ(21)(21)21z21−1e−2z
所以说 z 遵循 θ=2,α=21 的 Gamma Distribution。而根据 Gamma Distribution 的可加性,不难得出 Z∼Γ(2,2k)。我们将这样的 RV 称作其遵循 Chi-Square Distribution,记作 Z∼χ2(k),其中 k 为参数,被称作自由度。
以上。