参数估计
通过取样本,并用样本构造函数,达成估计分布函数参数的目的
矩估计法
本质:用样本的各阶矩代替总体的各阶矩,即取:
E(X)=X‾=1n∑iXiE(X2)=1n∑iXi2E(X)=\overline{X}=\dfrac{1}{n}\sum_i X_i\\ E(X^2)=\dfrac{1}{n}\sum_iX_i^2 E(X)=X=n1i∑XiE(X2)=n1i∑Xi2
极大似然估计法
本质:将使得样本 AAA 发生概率最大的参数值作为估计值
1、写出总体概率/密度函数
2、构造似然函数 L(λ)L(\lambda)L(λ)
3、两边取 ln\lnln
4、对 λ\lambdaλ 求导
点估计的优良性准则
一、无偏性:E(θ^)=θE(\hat{\theta})=\thetaE(θ^)=θ
定理:总体为 XXX,且 E(X)=μE(X)=\muE(X)=μ,D(X)=σ2D(X)=\sigma^2D(X)=σ2,样本为 (X1,⋯,Xn)(X_1,\cdots,X_n)(X1,⋯,Xn),那么有:
1、X‾\overline{X}X 是 μ\muμ 的无偏估计
2、样本方差 S2S^2S2 是 σ2\sigma^2σ2 的无偏估计
3、取 μ^=C1X1+⋯+CnXn\hat{\mu}=C_1X_1 + \cdots + C_nX_nμ^=C1X1+⋯+CnXn,若 C1+⋯+Cn=1C_1+\cdots + C_n=1C1+⋯+Cn=1,则 μ^\hat{\mu}μ^ 是 μ\muμ 的无偏估计
证明:
1 与 2:
已经在 上一份笔记 中证明过 E(X‾)=μE(\overline{X})=\muE(X)=μ 和 E(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2
3:
E(μ^)=E(C1X1+⋯+CnXn)=E(C1X1)+⋯+E(CnXn)=C1E(X1)+⋯+CnE(Xn)=(C1+⋯+Cn)μ=μ\begin{align*} E(\hat{\mu}) &= E(C_1X_1 + \cdots + C_nX_n)\\ &=E(C_1X_1)+\cdots+E(C_nX_n)\\ &=C_1E(X_1)+\cdots+C_nE(X_n)\\ &=(C_1+\cdots+C_n)\mu\\ &=\mu \end{align*} E(μ^)=E(C1X1+⋯+CnXn)=E(C1X1)+⋯+E(CnXn)=C1E(X1)+⋯+CnE(Xn)=(C1+⋯+Cn)μ=μ
!注意:θ^\hat{\theta}θ^ 是 θ\thetaθ 的无偏估计,但是 g(θ^)g(\hat{\theta})g(θ^) 不一定是 g(θ)g(\theta)g(θ) 的无偏估计
例如:S2S^2S2 是 σ2\sigma^2σ2 的无偏估计,而 SSS 不是 σ\sigmaσ 的无偏估计(性质)
该性质的证明:
D(S)=E(S2)−E(S)2=σ2−E(S)2⇒E(S)=σ2−D(S)⩽σ\begin{align*} &D(S) = E(S^2)-E(S)^2\\ &=\sigma^2-E(S)^2\\ &\Rightarrow E(S)=\sqrt{\sigma^2-D(S)}\leqslant\sigma \end{align*} D(S)=E(S2)−E(S)2=σ2−E(S)2⇒E(S)=σ2−D(S)⩽σ
二、有效性:D(θ1^)⩽D(θ2^)D(\hat{\theta_1})\leqslant D(\hat{\theta_2})D(θ1^)⩽D(θ2^)
定理:总体为 XXX,且 E(X)=μE(X)=\muE(X)=μ,D(X)=σ2D(X)=\sigma^2D(X)=σ2,样本为 (X1,⋯,Xn)(X_1,\cdots,X_n)(X1,⋯,Xn),若 a1+⋯+an=1a_1+\cdots+a_n=1a1+⋯+an=1,则现有两种 μ\muμ 的估计:a1X1+⋯+anXna_1X_1+\cdots+a_nX_na1X1+⋯+anXn 与 X‾\overline{X}X,由有效性准则认为,X‾\overline{X}X 更优
证明:
由 上一份笔记 知 D(X‾)=σ2nD(\overline{X})=\dfrac{\sigma^2}{n}D(X)=nσ2
那么有:
D(θ^)=D(a1X1+⋯+anXn)=a12D(X1)+⋯+an2D(Xn)=σ2(a12+⋯+an2)⩾σ2n\begin{align*} D(\hat{\theta})&=D(a_1X_1+\cdots+a_nX_n)\\ &=a_1^2D(X_1)+\cdots+a_n^2D(X_n)\\ &=\sigma^2(a^2_1+\cdots+a^2_n)\\ &\geqslant \dfrac{\sigma^2}{n} \end{align*} D(θ^)=D(a1X1+⋯+anXn)=a12D(X1)+⋯+an2D(Xn)=σ2(a12+⋯+an2)⩾nσ2
三、相合性(一致性):limn→+∞P(∣θ^−θ∣<ε)=1\lim\limits_{n\to +\infty}P(|\hat{\theta}-\theta|<\varepsilon)=1n→+∞limP(∣θ^−θ∣<ε)=1
置信区间
区间估计时,区间长度 和 落在区间的概率 十分重要
若 P(θ1⩽θ⩽θ2)=1−αP(\theta_1 \leqslant \theta \leqslant \theta_2)=1-\alphaP(θ1⩽θ⩽θ2)=1−α,则 1−α1-\alpha1−α 称为 置信度,而 [θ1,θ2][\theta_1,\theta_2][θ1,θ2] 则是估计区间
定义:
1、I=I(T,θ)I=I(T,\theta)I=I(T,θ),其中 θ\thetaθ 是未知参数,TTT 是已知的,随机变量 III 的分布 FFF 已知且其分布与 θ\thetaθ 无关,则将 III 称为 枢轴变量
2、给定 1−α1-\alpha1−α,确定 FFF 的上 α2\dfrac{\alpha}{2}2α 分位数为 vα2v_{\frac{\alpha}{2}}v2α,上 1−α21-\dfrac{\alpha}{2}1−2α 为 v1−α2v_{1-\frac{\alpha}{2}}v1−2α,则:
P(vα2⩽I(T,θ)⩽v1−α2)=1−αP\left(v_{\frac{\alpha}{2}}\leqslant I(T,\theta) \leqslant v_{1-\frac{\alpha}{2}}\right)=1-\alpha P(v2α⩽I(T,θ)⩽v1−2α)=1−α
一个正态总体的均值和方差的区间估计
设 v=n(X‾−μ)σ∼N(0,1)v=\dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1)v=σn(X−μ)∼N(0,1)
给定 1−α1-\alpha1−α,令 P(v>uα2)=α2P(v>u_{\frac{\alpha}{2}})=\dfrac{\alpha}{2}P(v>u2α)=2α
1、σ2\sigma^2σ2 已知,对 μ\muμ 的区间估计:
P(−uα2⩽n(X‾−μ)σ⩽uα2)=1−αP(−σuα2n⩽X‾−μ⩽σuα2n)=1−αP(X‾−σuα2n⩽μ⩽X‾+σuα2n)=1−α\begin{align*} &P\left(-u_{\frac{\alpha}{2}}\leqslant \dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma} \leqslant u_{\frac{\alpha}{2}}\right)=1-\alpha\\ &P\left(-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\overline{X}-\mu\leqslant\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha\\ &P\left(\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\mu\leqslant\overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha \end{align*} P(−u2α⩽σn(X−μ)⩽u2α)=1−αP(−nσu2α⩽X−μ⩽nσu2α)=1−αP(X−nσu2α⩽μ⩽X+nσu2α)=1−α
也就是说,有 1−α1-\alpha1−α 的把握,认为 μ\muμ 在区间 [X‾−σuα2n,X‾+σuα2n]\left[\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}, \overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right][X−nσu2α,X+nσu2α] 中
2、σ2\sigma^2σ2 未知,对 μ\muμ 的区间估计:
构造枢轴变量:T=n(X‾−μ)S∼t(n−1)T=\dfrac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1)T=Sn(X−μ)∼t(n−1)
P(−tα2(n−1)⩽n(X‾−μS⩽tα2(n−1))=1−α⇒P(X‾−Sntα2(n−1)⩽μ⩽X‾+Sntα2(n−1))=1−α\begin{align*} &P\left(-t_{\frac{\alpha}{2}}(n-1)\leqslant\dfrac{\sqrt{n}(\overline{X}-\mu}{S}\leqslant t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) \leqslant \mu \leqslant \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha \end{align*} P(−t2α(n−1)⩽Sn(X−μ⩽t2α(n−1))=1−α⇒P(X−nSt2α(n−1)⩽μ⩽X+nSt2α(n−1))=1−α
也就是说,有 1−α1-\alpha1−α 的把握,认为 μ\muμ 在区间 [X‾−Sntα2(n−1),X‾+Sntα2(n−1)]\left[\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1), \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right][X−nSt2α(n−1),X+nSt2α(n−1)] 中
3、μ\muμ 已知,对 σ2\sigma^2σ2 的区间估计:
构造枢轴变量:χ2=1σ2∑i=1n(Xi−μ)2∼χ2(n)\chi^2=\dfrac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim \chi^2(n)χ2=σ21i=1∑n(Xi−μ)2∼χ2(n),给定 1−α1-\alpha1−α、χ1−α22(n)\chi^2_{1-\frac{\alpha}{2}}(n)χ1−2α2(n) 及 χα22(n)\chi^2_{\frac{\alpha}{2}}(n)χ2α2(n)
注意:之所以不继续使用正态分布的枢轴变量,是因为 σ\sigmaσ 在开平方后不是无偏估计
P(χ1−α22(n)⩽1σ2∑i=1n(Xi−μ)2⩽χα22(n))=1−α⇒∑i=1n(Xi−μ)2χα22(n)⩽σ2⩽∑i=1n(Xi−μ)2χ1−α22(n)\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n)\leqslant\dfrac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2\leqslant\chi^2_{\frac{\alpha}{2}}(n)\right)=1-\alpha\\ &\Rightarrow \dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)}\leqslant\sigma^2\leqslant\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)} \end{align*} P(χ1−2α2(n)⩽σ21i=1∑n(Xi−μ)2⩽χ2α2(n))=1−α⇒χ2α2(n)∑i=1n(Xi−μ)2⩽σ2⩽χ1−2α2(n)∑i=1n(Xi−μ)2
也就是说,有 1−α1-\alpha1−α 的把握,认为 σ2\sigma^2σ2 在区间 [∑i=1n(Xi−μ)2χα22(n),∑i=1n(Xi−μ)2χ1−α22(n)]\left[\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)},\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)}\right][χ2α2(n)∑i=1n(Xi−μ)2,χ1−2α2(n)∑i=1n(Xi−μ)2] 中
4、μ\muμ 未知,对 σ2\sigma^2σ2 的区间估计:
构造枢轴变量:χ2=(n−1)S2σ2∼χ2(n−1)\chi^2=\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)χ2=σ2(n−1)S2∼χ2(n−1),给定 1−α1-\alpha1−α、χ1−α22(n−1)\chi^2_{1-\frac{\alpha}{2}}(n-1)χ1−2α2(n−1) 及 χα22(n−1)\chi^2_{\frac{\alpha}{2}}(n-1)χ2α2(n−1)
P(χ1−α22(n−1)⩽(n−1)S2σ2⩽χα22(n−1))=1−α⇒P((n−1)S2χα22(n−1)⩽σ2⩽(n−1)S2χ1−α22(n−1))=1−α\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leqslant\dfrac{(n-1)S^2}{\sigma^2}\leqslant\chi^2_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leqslant\sigma^2\leqslant\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)=1-\alpha \end{align*} P(χ1−2α2(n−1)⩽σ2(n−1)S2⩽χ2α2(n−1))=1−α⇒P(χ2α2(n−1)(n−1)S2⩽σ2⩽χ1−2α2(n−1)(n−1)S2)=1−α
也就是说,有 1−α1-\alpha1−α 的把握,认为 σ2\sigma^2σ2 在区间 [(n−1)S2χα22(n−1),(n−1)S2χ1−α22(n−1)]\left[\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right][χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2] 中