假设检验
1个回答
展开全部
基本思想
在一次观测或是严重几乎不可能发生的小概率事件,发生的概率称之为显著性水平。观测小概率事件在假设成立的情况下是否发生,如果在一次试验中小概率事件发生了,说明该假设在一定的显著性水平下不可靠或不成立,从而否定原假设;如果该小概率事件没有发生,只能说明没有足够的理由否定原假设。
如果P值<=a,说名字啊显著性水平下,原假设不成立,拒绝原假设,选择备择假设;如果P>a,说明在显著性a水平下,没有充分的理由拒绝原假设。
如果没有指a的值,则P值越小越显著。
基本步骤:
1、写出原假设
2、确定理论的显著性水平a
3、计算用于检验的统计量值及其对应p值
4、进行判定,P值远小于a时可拒绝原假设
大样本情况下,方差已知或未知,和小样本方差未知情况下都是用Z正态统计量
小样本方差未知的情况下,使用t统计量(服从自由度为n-1的t分布)
就是在一定置信度下对总体均值进行估计。
规定饼干中水分含量不得超过4%,这里用随机抽取的50块饼干及其水分含量数据,对该型号的所有饼干(单总体)的水分含量(总体均值)进行置信区间为95%的区间估计。
scipy.stats中的ttest_lsamp函数也可以用于t检验:
这里ttest_lsamp的假设检验结果的出来的P值是双侧检验的P值,即备择假设为‘不等于’时计算出来的P值,按照如下原则进行计算:
如果备择假设是‘<’符号:
当t>=0时,进行判定的单侧P值=1-P/2;当t<0时,进行判定的单侧P值=P/2
如果备择假设是‘>’符号:
当t>=0时,进行判定的单侧P值=P/2;当t<0时,进行判定的单侧P值=1-P/2
因此,本例计算出来的用于判定的单侧P值为1-0.4993/2=0.75>>0.05,没有充分的理由拒绝原假设。对达到82分的标准评估值得进一步商榷。
同单总体均值的估计原理相同,唯一的区别在于所用的统计量服从卡方分布。
这里的比例是指反应总体某种特征只有两种属性,其中某种属性占所有属性的比重或百分比。如全国男性人口的比例,人们对某项政策是持支持还是反对态度的比例。
考察比例的样本数据通常为大样本,利用大样本条件下的统计量进行统计推断。
问题:随机抽取的100个产品经过检验有95个合格,5个不合格,试以99%的置信度估计对产品合格率的置信区间
利用statsmodels中的proportion_confint函数进行比例的参数估计非常简单,只需要指定我们所关注的属性(一般定义为“成功”的属性)和样本量即可
这里可以得出样本的产品合格率为95%,设总体合格率为p,提出原假设和备择假设:H0:p<=0.97;H1:p>0.97
可以看到单侧P值=0.919>>0.05,proportions_ztest的正态检验P值为0.8206>>0.05.因此,没有充分的理由拒绝原假设。即没有充分理由否定产品合格率不超过97%。
在一次观测或是严重几乎不可能发生的小概率事件,发生的概率称之为显著性水平。观测小概率事件在假设成立的情况下是否发生,如果在一次试验中小概率事件发生了,说明该假设在一定的显著性水平下不可靠或不成立,从而否定原假设;如果该小概率事件没有发生,只能说明没有足够的理由否定原假设。
如果P值<=a,说名字啊显著性水平下,原假设不成立,拒绝原假设,选择备择假设;如果P>a,说明在显著性a水平下,没有充分的理由拒绝原假设。
如果没有指a的值,则P值越小越显著。
基本步骤:
1、写出原假设
2、确定理论的显著性水平a
3、计算用于检验的统计量值及其对应p值
4、进行判定,P值远小于a时可拒绝原假设
大样本情况下,方差已知或未知,和小样本方差未知情况下都是用Z正态统计量
小样本方差未知的情况下,使用t统计量(服从自由度为n-1的t分布)
就是在一定置信度下对总体均值进行估计。
规定饼干中水分含量不得超过4%,这里用随机抽取的50块饼干及其水分含量数据,对该型号的所有饼干(单总体)的水分含量(总体均值)进行置信区间为95%的区间估计。
scipy.stats中的ttest_lsamp函数也可以用于t检验:
这里ttest_lsamp的假设检验结果的出来的P值是双侧检验的P值,即备择假设为‘不等于’时计算出来的P值,按照如下原则进行计算:
如果备择假设是‘<’符号:
当t>=0时,进行判定的单侧P值=1-P/2;当t<0时,进行判定的单侧P值=P/2
如果备择假设是‘>’符号:
当t>=0时,进行判定的单侧P值=P/2;当t<0时,进行判定的单侧P值=1-P/2
因此,本例计算出来的用于判定的单侧P值为1-0.4993/2=0.75>>0.05,没有充分的理由拒绝原假设。对达到82分的标准评估值得进一步商榷。
同单总体均值的估计原理相同,唯一的区别在于所用的统计量服从卡方分布。
这里的比例是指反应总体某种特征只有两种属性,其中某种属性占所有属性的比重或百分比。如全国男性人口的比例,人们对某项政策是持支持还是反对态度的比例。
考察比例的样本数据通常为大样本,利用大样本条件下的统计量进行统计推断。
问题:随机抽取的100个产品经过检验有95个合格,5个不合格,试以99%的置信度估计对产品合格率的置信区间
利用statsmodels中的proportion_confint函数进行比例的参数估计非常简单,只需要指定我们所关注的属性(一般定义为“成功”的属性)和样本量即可
这里可以得出样本的产品合格率为95%,设总体合格率为p,提出原假设和备择假设:H0:p<=0.97;H1:p>0.97
可以看到单侧P值=0.919>>0.05,proportions_ztest的正态检验P值为0.8206>>0.05.因此,没有充分的理由拒绝原假设。即没有充分理由否定产品合格率不超过97%。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
上海灿态智能科技有限公司
2020-10-27 广告
2020-10-27 广告
影响IQC来料检验控制价格的因素有很多。而且除了价格以外,是否能达成合作还有很多方面的内容需要考虑。可以了解下上海灿态智能科技有限公司,应该可以有一些收获。上海灿态智能科技有限公司,专业从事质量管理技术应用与服务。公司致力于为企业的生产过程...
点击进入详情页
本回答由上海灿态智能科技有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询