
在介绍统计学中最重要的定理之一-中心极限定理-之前,我们先来想一个问题:统计学的目的是什么?根据<Mathematical statistics with application 7th Edition>书中所写的:
统计学的目的是基于从总体中的样本所获得的信息,对总体进行推断,并且提供推断的准确性。
这其中有几个关键词:总体,样本,推断。总体的含义就是所研究对象的所有可能的数据,比如,全世界每个人的身高,工厂上个月生产出来的每个灯泡的寿命等等。样本的概念是从总体中衍生出来的,比如,全世界任意20个人的身高,工厂上个月任意100个灯泡的寿命,样本就是总体的一个子集。通常情况下总体的数据是难以获得的,而样本是容易得到的,所以统计学的目的就是从样本数据来推断总体。
接下来我们通过一个实际例子来介绍中心极限定理:
一个工厂所生产的灯泡的平均寿命是1000小时,方差是25个小时。我买了36个灯泡装在家里,那么这个9个灯泡的平均寿命超过1005小时的概率是多少
求解问题的第一步是将实际问题抽象出数学模型。在实际应用中,数学模型的建立远远要比解题方法更重要。首先定义随机变量:
由题中信息可得:
那么问题的求解转化为求解
我们并不知道随机变量
设定有个独立且完全相同的随机变量
,他们的期望
,方差
。定义随机变量:
那么,当趋向于无穷大时,随机变量
趋向于标准正态分布。
回到我们的问题,求解
其中
中心极限定理实际上是揭示了任意一个总体中样本均值的分布规律。
通常在教科书中,在描述完中心极限定理后,会出现3个字:证明略。接下来本文使用随机变量特征函数的方式来对其进行证明。
首先,引入随机变量特征函数的概念。对于随机变量
那么对于
而标准正态分布