统计学中,确定样本容量时需要考虑哪些因素?
1、研究对象的变化程度
通常,总体方差越大,意味着总体内部各事物在调查表现上的差异程度越大,所以需要的样本容量越大,应该多抽一些样本单位。也就是说,研究的现象越复杂、差异越大,样本量要求就越大。
2、研究允许的误差大小(精确度)
一般来说,允许误差越大,意味着对抽样的估计精度要求不高,所以就可以少抽取一些样本单位,需要的样本容量较小。反之,如果允许误差很小,就是研究要求精确度较高,那么需要的样本量就会比较大。所以,精度要求越高,样本量越大。
3、要求推断的置信程度
在经验上,我们会选择0.05、0.01、0.001这三个水平作为可以接受的犯错概率。所以,0.05是统计上可以接受的最低标准,也是需要样本最少的情况,把犯错概率控制在0.001以下,是非常严格的标准,需要的样本量也越大。
同时,这三个犯错概率分别对应的可靠性系数为0.95、0.99、0.999。也就是说,可靠性系数越大,需要的样本容量越大。
4、抽样类型和方法
样本抽取的方法分为随机抽样和非随机抽样。
扩展资料
样本容量的相关性质:
研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值。
如果设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大。
多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。
参考资料来源:百度百科-样本容量