第五章---简单统计推断:总体参数的估计
所谓的无偏性就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。 严格说来 ,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。
随机样本产生的样本均值、样本标准差和Bernoulli试验的成功比例都是无偏估计。
假定 (n >2)为来自一个总体的独立随机样本,这些观测值互相独立,那么,对于总体均值 的无偏估计就有很多,比如下面的统计量都是无偏估计,他们的期望都是 。
但是,他们的标准差不同,第一个是 ,第二个是 ,第三个是 ,最后一个是 ,显然 的标准差最小。
举例说明置信区间的概念:
为了估计某候选人在选民中的支持率(即总体比值p),调查机构的民意测验可能会说,该候选人的“支持率为75%,误差是±3%,置信度是95%”。这种说法意味着下面三点:
1,样本中的支持率为75%,这是用样本比例作为对总体比例的点估计。
2,估计范围为75%±3%,即区间估计。
3,如果用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中会有些覆盖真正的p,而有些不会,但这些区间中大约有95%会覆盖真正的总体比例。
这样得到的区间被称为总体比例p的置信度为95%的置信区间。置信度、样本量与区间之间的关系:
1,样本量相同时,置信度的增加导致区间变长;
2,置信度相同时,样本量的增加导致区间变短。
不要认为由一个样本数据得到的总体参数的一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
2023-08-15 广告