分层抽样是什么?
2019-06-21 · 农业农村部直属的大型综合出版社
(stratificationsampling)
(薛有祝)
按一定的属性将总体划分为若干层(副总体),按层抽样统计以估计总体的方法。又称类型抽样或分类抽样。当各层为简单随机样本时,称分层随机抽样,简称分层抽样;当各层为系统样本时,称分层系统抽样(见图)。通过分层可提高总体抽样精度;可得到各层资源数据和主要层估计精度;按林分分层可编制林相图、森林分布图等图面资料。但是,只有分层后各层的平均数存在显著差异时,分层才比不分层(简单随机)抽样好;层平均数差异越大,分层效率越高。同时,它要求:①各层的总体单元数或权重必须确知;②总体划分为数层后,各层间任何单元都没有重叠或遗漏;③在各层中进行的抽样是独立的。分层抽样有按地域分层、林分分层、样地分层等形式,这里侧重介绍按林分分层的方法。
应用情况
中国从1964年开始引用。主要应用于:①具有合适航空象片等图面资料、林相有利于分层、有一定专业技术力量的林业局、县、林场的二类调查。②森林资源汇总。把若干小总体合并成一个大总体,要根据由各个小总体中所抽取的随机样本或系统样本资料估计大总体时,可将每个小总体作为一个层,用分层抽样的估计方法对大总体进行估计。如根据县的森林资源抽样资料求全省的、根据省的森林资源抽样资料求全国的,都属于这种情况,类同按地域分层。此外,分层抽样也可用于小班调查。
分层抽样示意图
落叶松天然林分的分层级距和层代号表
郁闭度 层代号 龄组 疏 ≤0.3 中 0.4~0.6 密≥0.7 幼(≤40年) 落幼疏 落幼中 落幼密 中(41~100年) 落中疏 落中中 落中密 成(≥101年) 落成疏 落成中 落成密工作步骤
①分层方案的确定:主要根据生产需要、森林结构、航空象片判读性能等确定。要求:有利于缩小层内方差,扩大层间方差;层的划分尽量与经营单位一致;样本大小既定情况下,分层不宜过多、层面积不宜过小;正确确定分层因子及其级距。中国以清查森林蓄积量为目的的资源清查,一般按地类、优势树种、龄组、郁闭度作为分层因子。如落叶松天然林分的分层常采用表中标准。②准确求算各层面积及权重:通过分层判读、航空象片的森林调绘、编制分层平面图等,计算各层面积和权重。③样本单元数的确定与分配:有按面积比例分配、最优分配、任意分配等配置方式。生产中常用比例分层抽样。在重复抽样条件下,样本单元数的计算公式为
式中 t为可靠性指标;E为相对误差限;Wh为h层权重;δ2h为h层的总体方差;为总体平均数,根据已往资料或预备调查资料确定。在非重复抽样条件下,样本单元数为
式中 N为总体单元数;n/N为抽样比。④布点及样地调查(见系统抽样)。⑤内业计算:包括各层特征数计算(见随机抽样)和总体平均数估计值、总体平均数估计值方差、误差限、精度、总体蓄积量估计值等的计算。
总体平均数估计值:
总体平均数估计值的方差:
绝对误差限:
相对误差限:
估计精度:P=1-E总体蓄积量估计值:
总体蓄积量估计区间:
式中 L为总体内的层数;Yh为第h层的样本平均数;为第h层的标准误;t为可靠性指标,按自由度n-L查小样本t分布表;A为总体面积;a为样地面积。分层抽样的估计误差限,需按重复抽样、非重复抽样、各层样本单元数充分大和比较小等情况,分别进行正确估计。
评价
分层抽样是一种有较高效率的抽样方法,但下列情况下均不宜采用:当总体内各类型林分平均蓄积量相差不大、方差相似;不具备合适的航空象片等图面资料;林相破碎、零星插花严重,很难确切分层和总体各层权重不确知。同时,在应用中要注意:①在航空象片上必须分层正确、判读准确。②样地不跨层,正确处理样地错层问题。③样地落在有林地某层小空地内时,应做为该层的一个数值为零的样地。④在没有合适航空象片,用图进行分层抽样调查时(即布点前不知道层面积),采用一次外业,同时完成样地调查和层化小班,待内业再分层计算。但其抽样误差与上面介绍的先分层后抽样的抽样误差不同,它包括比例分层抽样误差和因总体中只有一次抽样且各层抽样又不独立所产生的误差。当各层方差相差不大或样本单元数很大时,后一项误差很小,可以略去。
参考书目
W.G.科克伦著,张尧庭、吴辉译:《抽样技术》,中国统计出版社,1985。(W.G.Cochran,Sampling Techniques,3rd Ed.,John Wiley and Sons,New York,1977.)
B.胡希、C.I.米勒、T.W.比尔斯合著,测树学翻译组译:《测树学》,中国林业出版社,1981。(B.Husch,C.I.Miller,T.W.Beers,Forest Mensuration,The Ronald Press Company,2nd Ed.,New York,1972.)
2023-06-12 广告