CPK中δ的计算公式

请问一下哪位网友可以说明一下CPK中计算公式中为什么在除以N-1,而不是N。谢谢... 请问一下哪位网友可以说明一下CPK中 计算公式中为什么在除以N-1,而不是N。谢谢 展开
飞艇上的羊
2009-04-28 · TA获得超过1922个赞
知道小有建树答主
回答量:537
采纳率:0%
帮助的人:593万
展开全部
cpk中δ表示的就是样本的标准差.所以问题可以转化成为什么样本标准差公式中使用的是n-1而不是n的问题了.这里涉及到自由度的问题.

自由度,很多统计量的计算公式中都有自由度的概念,可为什么同样是计算标准差,总体标准差的自由度是n,而样本标准差的自由度就是n-1?为什么其它公式中的自由度还有n-2、n-3呢? 它到底是什么含意?

一般总体方差(sigma^2),其实它是衡量所有数据对于中心位置(总体平均)平均差异的概念,所以也称为离散程度,通常表示为sum(Xi-Xbar)^1/2/N ,(有多少个数据就除多少)而样本方差(S^2),则是利用样本数据所计算出来估计总体变异用的(样本统计量的基本目的:少量资料估计总体).一般习惯上,总体怎么算,样本就怎么算,可是在统计上估计量(或叫样本统计量)必须符合一个特性--无偏性,也就是估计量的数学期望值要等于被估计的总体参数=> E(S^2)=sigma^2(无偏估计)。很不幸的,样本变异数E(S^2)并不会等于sigma^2所以必须做修正,而修正后即为sum(Xi-Xbar)^2/(N-1).才会继续带出后来的自由度概念。(自由度是由修正样本统计量得来的吗?)
  网上一些文献的说法也是林林总总。
  金志成实验设计书中的定义:能独立变化的数据数目。只要有n-1个数确定,第n个值就确定了,它不能自由变化。所以自由度就是n-1。自由度表示的是一组数据可以自由表化的数量的多少。
  通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为平均分已经固定下来了,自由度少一个了。
  自由度的设定是出于这样一个理由:在总体平均数未知时,用样本平均数去计算离差(常用小s)会受到一个限制————要计算标准差(小s)就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据的总和就是一个常数了。所以,“最后一个”样本数据就不可以变了,因为它要是变,总和就变了,而这是不允许的。至于有的自由度是n-2什么的,都是同样道理。
  n-1是通常的计算方法,更准确的讲应该是n-k,n表示“处理”的数量,k表示实际需要计算的参数的数量。如需要计算2个参数,则数据里只有n-2个数据可以自由变化。例如,一组数据,平均数一定,则这组数据有n-1个数据可以自由变化;如一组数据平均数一定,标准差也一定,则有n-2个数据可以自由变化。df=n-k的得出是需要大量的数理统计的证明的。太复杂的情况,我们就不讨论了。

对卡方分布,t分布而言,从其统计量的来源看,卡方分布自由度n理解为来自n个服从正态分布的样本,而且他们之间并没有什么约束关系,也就是说n个样本都是可以自由变化的。
而对于我们在统计检验中构造的那些统计量而言,也可以这样理解,一般自由度并不为n,是因为这n个样本之间有约束关系,约束方程的个数为a,则自由度为n-a,因为一般约束方程的个数等于未知参数的个数,也就是说自由度是n-未知参数的个数,但是这种解释在有些场合不容易理解,也没有说到本质上,严格的解释应该还是从统计量对应的二次型的秩的角度来理解。
图为信息科技(深圳)有限公司
2021-01-25 广告
边缘计算可以咨询图为信息科技(深圳)有限公司了解一下,图为信息科技(深圳)有限公司(简称:图为信息科技)是基于视觉处理的边缘计算方案解决商。作为一家创新企业,多年来始终专注于人工智能领域的发展,致力于为客户提供满意的解决方案。... 点击进入详情页
本回答由图为信息科技(深圳)有限公司提供
toredu87
推荐于2020-02-23 · TA获得超过2394个赞
知道小有建树答主
回答量:217
采纳率:0%
帮助的人:254万
展开全部
这是个很好的问题,可惜2楼的朋友回答得太广、太散,却没有简单地命中问题的根本,估计是网上Copy的原因吧。

显然,如果把分母减去1(就是“除以n-1”)就会使得标准差大于实际的大小,那么我们为何还要这么做呢?这主要是基于2方面原因:

1.样本标准差是总体标准差的估计值,只有当它除以(n-1)时,得出的情况才会是无偏估计。(当然,如果你的目的只是描述样本的特征,那么有偏估计也是可以的;但大部分情况是想用样本估计总体参数,此时最好用无偏统计值)

2. 好的研究人员一般总是保守的,即:如果我们不得不出错,那么我们宁可出错是由于过高估计了总体的标准差(而非可能导致严重后果的“低估”),于是,除以一个较小的分母(n-1)就可以让我们做到这一点。

其实,一般而言,如果样本规模越大,那么“除以n”和“除以n-1”的差异也会越小,也就是说,它们引起的“量变”不大,但是它们却有着“有偏估计”与“无偏估计”的“质变”。又,通常情况下,统计数据时,样本数据量总是比较多的,因此,通常的样本标准差公式取的是“除以n-1”
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
任人摆布吗
2009-04-28
知道答主
回答量:53
采纳率:0%
帮助的人:15万
展开全部
没有
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式