何谓分层抽样法?
一、优点
1、 如果层内的测量具有较低的标准偏差(与总体中的总体标准偏差相比),则分层会产生较小的估计误差。
2、 对于许多应用程序,当人口被分组到层中时,测量变得更易于管理和/或更便宜。
3、 当需要对总体中的组进行总体参数估计时- 分层抽样验证我们从感兴趣的层中获得了足够的样本。
二、缺点
当总体无法彻底划分为不相交的子组时,分层抽样没有用。使子组的样本量与可从子组获得的数据量成正比,而不是将样本量缩放到子组大小(或它们的方差,如果已知差异显着——例如,通过测试)。
如果每个亚组之间的可疑变异需要分层抽样,则代表每个亚组的数据被认为具有同等重要性。如果子组方差差异显着,并且需要按方差对数据进行分层,则不可能同时使每个子组样本量与总人口中的子组大小成正比。
分层抽样策略
比例分配在每个层中使用与总人口比例成比例的抽样分数。
例如,如果总体由n个个体组成,其中m是男性,f女性(其中m + f = n),则两个样本的相对大小(x 1 = m/n男性,x 2 = f/n女性)应该反映这个比例。
最优分配(或不成比例的分配)——每个层的抽样比例与变量分布的比例(如上)和标准差成正比。在可变性最大的层中抽取较大的样本,以生成尽可能小的总体抽样方差。
使用分层抽样的一个真实例子是政治调查。如果受访者需要反映人口的多样性,研究人员会根据上文提到的与总人口的比例,专门寻求包括种族或宗教等各种少数群体的参与者。
因此,分层调查可以声称比简单随机抽样或系统抽样的调查更能代表总体。