统计学假设检验的原假设怎么设?
假没检验分为双侧假设检验和单侧假设检验。双侧假设检验所针对的问题是指一些客体的指标过大和过小都不符合要求,或证明总体某个参数是否等于某个特定值。假设的基本设定方法是等号放在原假设,其基本形式为:原假设!":!%!",备择假设!#:!!!"。这里只谈单侧假设检验中假设的设定依据。
几种常见的假设检验
定义
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
基本原理
(1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
(2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
假设的形式
H0——原假设, H1——备择假设
双侧检验:H0:μ = μ0 ,H_1:\mu\ne\mu_0
单侧检验:H_0:\mu\ge\mu_0 ,H1:μ < μ0 或 H_0:\mu\le\mu_0, H1:μ > μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
假设检验的种类
下面介绍几种常见的假设检验
1. T检验
亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
目的:比较样本均数 所代表的未知总体均数μ和已知总体均数μ0。
计算公式:
t统计量:t=\frac{|\overline{X}-\mu_0|}{S_{\overline{X}}}=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}
自由度:v=n - 1
适用条件:
(1) 已知一个总体均数;
(2) 可得到一个样本均数及该样本标准误;
(3) 样本来自正态或近似正态总体。
T检验的步骤
1、建立虚无假设H0:μ1 = μ2,即先假定两个总体平均数之间没有显著差异;
2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;
1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:
T=\frac{\bar{X}-\mu_0}{\frac{S}{n-1}}
2)如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为:
T=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{\sum x_1^2+\sum x_2^2}{n_1+n_2-2}}\times\frac{n_1+n_2}{n_1\times n_2}}
3、根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为T(df)0.01和T(df)0.05
4、比较计算得到的t值和理论T值,推断发生的概率,依据下表给出的T值与差异显著性关系表作出判断。
T值与差异显著性关系表
T P值 差异显著程度
T\ge T(df)0.01 P\le 0.01 差异非常显著
T\ge T(df)0.05 P\le 0.05 差异显著
T < T(df)0.05 P > 0.05 差异不显著
5、根据是以上分析,结合具体情况,作出结论。
T检验的应用领域:
T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。
2. z检验(U检验)
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
第一步:建立虚无假设 H0:μ1 = μ2 ,即先假定两个平均数之间没有显著差异,
第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法,
1、如果检验一个样本平均数(\bar{X})与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:
Z=\frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}}
其中:
\bar{X}是检验样本的平均数;
μ0是已知总体的平均数;
S是样本的标准差;
n是样本容量。
2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:
Z=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{S_1}{n_1}+\frac{S_2}{n_2}}}
其中:
\bar{X_1},\bar{X_2}是样本1,样本2的平均数;
S1,S2是样本1,样本2的标准差;
n1,n2是样本1,样本2的容量。
第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示:
Z值与P值关系
\left| Z \right| P值 差异程度
\ge2.58 \le0.01 非常显著
\ge1.96 \le0.05 显著
<1.96 >0.05 不显著
第四步:根据是以上分析,结合具体情况,作出结论。
3. F检验
4. 卡方检验
原假设的设法则根据题目要求做出假设,且必须保证等号放在原假设。
假设检验分为双侧假设检验和单侧假设检验,双侧假设检验所针对的问题是证明总体某个参数是否等于某个特定值,而单侧检验假设是证明是否大于或是否小于某一固定数值,其基本原理是先假设总体某项假设成立,若导致结果不合理的现象产生,则拒绝原假设,若不导致不合理的现象产生,则接受原假设。
假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平。
对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件”
扩展资料:
注意问题
1、作假设检验之前,应注意资料本身是否有可比性 。
2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义 。
3、根据资料类型和特点选用正确的假设检验方法 。
4、根据专业及经验确定是选用单侧检验还是双侧检验 。
5、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性 。
原假设是想证否的一个假设,根据所考察问题的要求提出原假设和备择假设,为了检验原假设是否正确,先假定原假设是正确的情况下,构造一个小概率事件,然后根据抽取的样本去检验这个小概率事件是否发生。
一般检验程序是实证分析中常被采用的设定原假设和检验式的方法。前者的基本思想是通过分析样本序列的趋势图,确定原假设和检验式是否含有漂移或趋势项,后者是直接设定原假设和检验式为一般形式,然后通过检验检验式中漂移和趋势项的显著性,修正原假设和检验式。
它们的共同特点是依据样本序列的特征直接设定原假设和检验式,以DF临界值为检验标准进行ADF(DF)和PP检验。
扩展资料
在确立原假设与备择假设时应遵循以下两个原则:
(1)原假设是在一次试验中有绝对优势出现的事件,而备择假设在一次试验中不易发生(或几乎不可能发生)的事件。因此,在进行单侧检验时,最好把原假设取为预想结果的反面,即把希望证明的命题放在备择假设上。
(2)将可能犯的严重错误看作第一类错误,因为犯第一类错误的概率可以通过a的大小来控制。犯第二类错误的概率夕是无法控制的。
如医生对前来问诊的病人作诊断时,可能会犯“有病看成无病”或者“无病看成有病’的错误,相比较而言,“无病看成有病“的错误更严重,故应将“问诊人有病”作为原假设。而在某项疾病普查中,将“被检查人有病’作为原假设就不恰当了。
参考资料来源:百度百科-原假设
所提出的假设称为原假设(或称为零假设),记为H0。对立于原假设的假设称为备择假设(或称为对立假设),记为H1。
在总体的分布完全未知,或只知其分布但不知其参数的情况下,为了推断总体的某些性质,提出关于总体的某些假设,称为统计假设。
原则
原假设是在一次试验中有绝对优势出现的事件,而备择假设在一次试验中不易发生(或几乎不可能发生)的事件。因此,在进行单侧检验时,最好把原假设取为预想结果的反面,即把希望证明的命题放在备择假设上。
假设检验是统计分析的一种重要方法,正确的理解假设检验过程中由于文换原假设与备择很设所引发的结论的差异,对于我们理解假设检验的思想以及掌握其方法都是十分重要的。
以上内容参考:百度百科-原假设
原假设的设定是单位根检验的首要问题。通过剖析以往单位根检验原假设设定存在的缺陷,在同时考虑原假设的可信度和检验可靠性的前提下,靳庭良提出了单位根检验原假设的一种合理的设定策略及改进的检验程序。
该单位根检验程序中原假设的设定、检验式和临界值的确定均以样本序列的数据生成过程为依据,与传统单位根检验程序相比更具有科学性,同时也提高了检验的可靠性。
其缺陷是数据生成过程模型的估计对检验结果可能产生一定的影响,因此,研究新检验程序的检验结果对数据生成过程模型估计的敏感性对进一步完善单位根检验理论无疑具有重要意义。
原假设在某种意义上是“无效”的,因为它通常代表着一种“现状”。它通过 “断言”一个总体参数或总体参数的组合具有一定的值来形式化。在例子中,零假设是“整个州的平均汽油价格就是1.15美元”。零假设写作H0,那么H0:µ=1.15。
扩展资料
先假定原假设是成立的,这样正常情况之下,计算的统计量应该是落在两根线之间的区域的,而如果计算的统计量超出了这个区域,那么说明原假设是有问题的。
这里利用了小概率原理:概率很小的事情,在一次试验中,一般不会发生,如果你买过彩票,应该很容易理解这句话。对应于图中就是,红色部分的数值出现的概率很小,出现了就不正常,就要否定原假设,接受备择假设。
判断方法:
第一种判断方法就是,用计算的统计量和两个临界值(两根线的位置)比较,如果超出,则拒绝原假设。
第二种方法,如果一个统计量要落在两根线的两边,概率是多少呢,是 0.05,如果再往两边靠呢,那就小于 0.05 了。所以当概率值 p 小于 0.05 时,统计量也超出 95% 的区域了,也要拒绝原假设。
参考资料来源:百度百科-原假设
广告 您可能关注的内容 |