这篇文章是 UncleBob 的统计推断第一至第四章笔记. 这几章主要是一些概率论相关基础知识.
由于是从 LATEX 格式转化而来,可能发生了一些排版上的改变.
Chapter 1. 概率论基本知识
1.1不等式
定理[Bonferroni 不等式]
P(A∩B)≥P(A)+P(B)−1,
P(i=1⋂nAi)≥i=1∑nP(Ai)−(n−1).
1.2 pdf 与 pmf
略.
1.3 统计学基本定理
定理
设X1,…,Xn∼i.i.d. F(x)(cdf),则
P{n→∞limxsup∣Fn(x)−F(x)∣=0}=1.
定义[分布族]
参数θ未知,θ∈Θ.称
{F(x∣θ):θ∈Θ}
为分布族.
进一步地,设F(x)∈F={F:F 为满足一定条件的分布函数},则
P{n→∞limF∈Fsupxsup∣Fn(x)−F(x)∣=0}=1.
Chapter 2. 变换与期望
2.1 变换
例
若X∼U(0,1),则−logX∼Exp(1).
例
若X∼N(0,1),则Y=X2∼χ12.
定理[概率积分变换]
设X有连续的 cdfFX,则Y=FX(X)∼U(0,1).
2.2 积分下求导
定理[Leibniz 法则]
在一定正则化条件下,
dθd∫a(θ)b(θ)f(x,θ)dx=f(b(θ),θ)b′(θ)−f(a(θ),θ)a′(θ)+∫a(θ)b(θ)∂θ∂f(x,θ)dx.
Chapter 3. 分布族
3.1 指数分布族
定义[指数分布族]
一个分布族{Pθ:θ∈Θ}称为k-维指数分布族,如果其 pdf 或 pmf 可表示为
f(x∣θ)=h(x)c(θ)exp{i=1∑kwi(θ)ti(x)},x∈R,
其中h(x)≥0,c(θ)>0,wi(θ)仅与θ有关,ti(x)仅与x有关.
例
若X∼N(μ,σ2),其中μ∈R,σ2>0,令θ=(μ,σ2)T,则
f(x∣μ,σ2)=2πσ21exp{−2σ2(x−μ)2}=2πσ21exp{2σ2μ2}exp{−2σ2x2+σ2μx}.
例
若X∼Bernoulli(p),0<p<1,则 pmf 为
f(x∣p)={px(1−p)1−x,0,x∈{0,1},otherwise,={(1−p)exp{xlog1−pp},0,x∈{0,1},otherwise.
例
二项分布族:
-X∼Binomial(n,p),n已知,0<p<1未知(指数分布族);
-X∼Binomial(n,p),n∈{1,2,…}未知,p已知;
-X∼Binomial(n,p),n,p均未知.
例
Cauchy 分布族:
f(x∣θ)=π11+(x−θ)21,θ∈R,
f(x∣θ,σ)=πσ11+(σx−θ)21,σ>0,
不是指数分布族.
例
设
f(x∣θ)=⎩⎨⎧θ1exp{1−θx},0,θ<x<+∞,otherwise,=θ1exp{1−θx}I(x>θ),
不是指数分布族.
3.2 指数分布族的性质
定理
E(i=1∑k∂θj∂wi(θ)ti(X))=−∂θj∂logc(θ),j=1,2,…,d=dim(Θ),
Var(i=1∑k∂θj∂wi(θ)ti(X))=−∂θj2∂2logc(θ)−E(i=1∑k∂θj2∂2wi(θ)ti(X)),j=1,2,…,d.
定义[自然参数]
将指数分布族改写为
f(x∣θ)=h(x)c∗(η)exp{i=1∑kηiti(x)},
其中参数η=(η1,η2,…,ηk)称为自然参数,上式称为自然参数形式的指数分布族.
自然参数空间为
H={(η1,η2,…,ηk):∫h(x)exp{i=1∑kηiti(x)}dx<∞}.
性质
自然参数空间H是凸集.
性质
定义
a(η)=log∫h(x)exp(ηTt(x))dx,η∈H,
其中t(x)=(t1(x),t2(x),…,tk(x))T. 则函数a(η):H→R是凸函数.
若H中有内点,则a(η)关于η无穷可微,且有
∇a(η)=∂η∂a(η)=Eη[t(X)],
∇2a(η)=∂η∂ηT∂2a(η)=Covη(t(X))=Eη[(t(X)−Eη[t(X)])(t(X)−Eη[t(X)])T],
其中X∼f(x∣η).
3.3 曲线指数族
例
若X∼N(μ,σ2),且满足μ2=σ2,则
f(x∣μ)=2πμ21exp(−21)exp(−2μ2x2+μx),
其自然参数为(−2μ21,μ1),其中μ∈R∖{0}.
例
设X1,X2,…,Xn∼i.i.d. Poisson(λ),则
nλ∑i=1nXi−nλdN(0,1),
即n1∑i=1nXidN(λ,nλ),这属于正态的曲线分布族.
3.4 位置与尺度分布族
定义[位置与尺度分布族]
设随机变量Z的 pdf 或 pmf 为fZ(z),则称:
-Z+μ, μ∈R为位置分布族,
即{fZ+μ(x)=fZ(x−μ):μ∈R};
-σZ, σ>0为尺度分布族,
即{fσZ(x)=σ1fZ(σx):σ>0};
-μ+σZ, μ∈R,σ>0为位置–尺度分布族,
即{fσZ+μ(x)=σ1fZ(σx−μ):μ∈R,σ>0}.
3.5 等式与不等式
定理[Chebyshev 不等式]
P(g(X)≥r)≤rE[g(X)].
定理[Hoeffding 不等式]
设X1,X2,…,Xn独立,且均值为 0,并满足ai≤Xi≤bi,则对任意ε>0,有
P(i=1∑nXi≥ε)≤2exp{−∑i=1n(bi−ai)22ε2}.
定理[Jensen 不等式]
设随机变量X满足E∣X∣<∞,且f:R→R为凸函数,则
E[f(X)]≥f(E[X]).
定理[Stein 恒等式]
设X∼N(μ,σ2),若g:R→R可微且E∣g′(X)∣<∞,则
E[g(X)(X−μ)]=σ2E[g′(X)].
定理[Fubini 定理与分部积分公式]
设f,g在R上连续,且g(±∞)=0,则
∫−∞+∞f′(x)g(x)dx=−∫−∞+∞f(x)g′(x)dx.
3.6 正态分布的其他刻画
定理[Cramér–Lévy 定理]
设n≥2,X1,…,Xn相互独立,若Sn=X1+⋯+Xn服从正态分布,则每个Xi均服从正态分布.
定理
设X1,…,Xn∼i.i.d.N(μ,σ2),则
σ2∑i=1n(Xi−Xˉ)2∼χn−12.
反之,若n≥2,X1,…,Xn为独立同分布且关于均值μ对称、方差有限,且满足∑i=1n(Xi−Xˉ)2/σ2∼χn−12,
则Xi∼N(μ,σ2).
定理
设X1,…,Xn∼i.i.d.N(μ,σ2),则Xˉ∼N(μ,σ2/n),∑i=1n(Xi−Xˉ)2/σ2∼χn−12,且Xˉ与∑i=1n(Xi−Xˉ)2相互独立.
反之,若连续型独立同分布随机变量X1,…,Xn满足Xˉ与∑i=1n(Xi−Xˉ)2独立,则Xi∼N(μ,σ2).
Chapter 4. 多维随机向量
若0<Var(X)<∞、0<Var(Y)<∞,定义 Pearson 相关系数为
ρXY=Var(X)Var(Y)E[(X−E[X])(Y−E[Y])].
-−1≤ρXY≤1;
-ρXY=0当且仅当E[(X−E[X])(Y−E[Y])]=0;
-∣ρXY∣=1当且仅当X与Y几乎处处线性相关,
即存在常数a,b,使得P(a(X−E[X])+b(Y−E[Y])=0)=1.