S是样本标准差,其计算公式为:
置信区间越大,置信水平越高。
参数的置信区间估计的要旨是:充分利用样本所提供的信息,做出尽可能可靠而精确的估计。
扩展资料:
奈曼以概率的频率解释为出发点,认为被估计的θ是一未知但确定的量,而样本X是随机的。区间【A(X),B(X)】是否真包含待估计的θ,取决于所抽得的样本X。因此,区间 【A(X),B(X)】只能以一定的概率包含未知的θ。
对于不同的θ,π(θ)之值可以不同,π(θ)对不同的θ取的最小值1-α(0<;α<1)称为区间【A(X),B(X)】的置信系数。与此相应,区间【A(X),B(X)】称为θ的一个置信区间。
这个名词在直观上可以理解为:对于“区间【A(X),B(X)】包含θ”这个推断,可以给予一定程度的相信,其程度则由置信系数表示。
95%置信区间是用来估计参数的取值范围的方法。比如在用样本去估计整体均值的实验过程中。假设做了100组统计均值实验后,算出95%的置信区间后,其中有95个置信区间包含整体均值,5个不包含。
95%置信区间的意义:假设上面统计的结果为[ 160-20, 160+20],怎么说明最低身高为140,最高身高为180。这个统计结果有95%的可信度。
构造
在数理统计学中,待估计的未知量是总体分布的参数θ或θ的某个函数g(θ)。区间估计问题可一般地表述为:要求构造一个仅依赖于样本X=(x1,x2,…,xn)的适当的区间【A(X),B(X)】,一旦得到了样本X的观测值尣,就把区间【A(尣),B(尣)】作为θ或g(θ)的估计。至于怎样的区间才算是“适当”,如何去构造它,则与所依据的原理和准则有关。
以上内容参考:百度百科-区间估计
然而实际中很难计算出总体的标准差 所以就用样本的标准差代替 就用楼上的公式来做就可以 但是要牵扯到自由度的问题