概率抽样有哪些

 我来答
长夜荧荧
2020-11-23 · TA获得超过1万个赞
知道大有可为答主
回答量:7233
采纳率:96%
帮助的人:219万
展开全部
简单随机抽样

简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。



比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出60人进行调查。为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)。抽样框编好后,他们又用300张小纸条分别写上001,002,…,300。他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。这种方法简便易学。但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。

对于总体元素很多的情形,我们则采用随机数表来抽样。本书后就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数表)。利用随机数表进行抽样的具体步骤是:

(1)先取得一份总体所有元素的名单(即抽样框);

(2)将总体中所有元素一一按顺序编号;

(3)根据总体规模是几位数来确定从随机数表中选几位数码;

(4)以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;

(5)根据样本规模的要求选择出足够的数码个数;

(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。

按上述步骤选择出来的元素的集合,就是所需要的样本。举例来说,某总体共3 000人(四位数),需要从中抽取100人作为样本进行调查。首先,我们要得到一份总体成员的名单;然后对总体中的每一个人从1到3 000进行编号;再根据总体的规模,确定从随机数表中选择四位数。具体的选法是从随机数表的任意一行和任意一列的某一个四位数开始,按照从上到下的顺序,或者从左到右的顺序,以3 000为标准,对随机数表中依次出现的每个四位数进行取舍:凡小于或等于3 000的数码就选出来,凡大于3 000的数码以及已经选出的数码则不要,直到选够100个数码为止;最后按照所抽取的数码,从总体名单中找到它们所对应的100个成员。这100个成员就构成一个随机样本。表6—2就是对3 000人的总体进行抽样时,我们采用随机数表对四位数码进行取舍的例子(采用后四位数,并按从上往下的顺序)。表6—2随机数表抽样例随机数表中的数码选用的数码不选用的原因843299090609061053873020后面四位数大于300094274100410041013902250725079361404310后面四位数大于30001359866042后面四位数大于3 000632191268326839420582507与所选的第三个数码重复27256511761176

如果采用前四位数字,仍按从上往下的顺序,那么从表6—2中我们又可以抽取出1 053、0 139、1 359、2 725这四个号码;如果取中间的四位数字,所得到的则是2 990、1 404、1 912和0 582这四个号码了。

二、系统抽样

系统抽样(systematic sampling)又称等距抽样或间隔抽样。它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。它和简单随机抽样一样,需要有完整的抽样框,样本的抽取也是直接从总体中抽取个体,而无其他中间环节。

系统抽样的具体步骤是:

(1)给总体中的每一个个体按顺序编号,即制定出抽样框。

(2)计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得:

K(抽样间距)=N(总体规模)n(样本规模)

(3)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点。

(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,…,A+(n-1)K。

(5)将这n个个体合起来,就构成了该总体的一个样本。

例如,要在某大学总共3 000名学生中,抽取一个容量为100的大学生样本。我们先将3 000名学生的名单依次编上号码,然后按上述公式可求得抽样间距为:

K=3 000/100=30

即每隔30人抽一名。为此,我们先在1~30的数码中,采用简单随机抽样的方法抽取一个数字,假如抽到的是12,那么就以12为第一个号码,每隔30名再抽一个。这样,我们便可得到12,42,72,…,2 982总共100个号码。我们再根据这100个号码,从总体名单中一一对应地找出100名学生,这100名学生就构成本次的一个样本。

从上面的过程中我们不难看出,系统抽样较之于简单随机抽样来说,显然简便易行多了,尤其是当总体及样本的规模都较大时更是如此。这也正是社会研究较少采用简单随机抽样而较多采用系统抽样的原因。

值得注意的是,系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布;否则,系统抽样的结果将会产生极大的偏差。因此,我们在使用系统抽样方法时,一定要注意抽样框的编制方法。特别要注意下列两种情况:

一是总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况。比如,我们要抽取若干家庭的样本进行消费状况调查。而家庭户的名单是按每个家庭总收入的多少由高到低顺序排列的。这样,如果有两个研究者都采取系统抽样的方法从这个总体中进行抽样,假设抽样间距为40,一个抽到的随机起点号较靠前为3;而另一个抽到的随机起点号较靠后为38。那么,从前一个研究者所抽样本中算出的家庭平均收入,一定大大高于后者所抽样本中算出的家庭平均收入。因为第一个样本中的每一个家庭都要比第二个样本中的每一个家庭在收入等级中靠前35个位置,即前者中的每一个家庭都比后者中的每一个家庭在总收入上高出35户家庭。如果我们事先注意到这种情况,就可以采用抽取中间位置,即20号的方法。

二是总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。比如,前面关于大学生一例中,我们计算出间距为30。如果此时总体名单是按教学班排列、每班也是30个左右的学生,并且每班的名单都是按学生学习成绩高低排列,或是按班干部、一般学生、较差学生的顺序排列的。那么,当所抽的随机起点号靠前时,样本就由各班上成绩优秀的学生组成,或是全由各班的班干部组成;
汇纳科技
2024-08-29 广告
汇纳科技作为行业领先的客流分析解决方案提供商,我们专注于通过先进的数据采集与分析技术,对商业空间、公共交通等场景下的客流量进行精准统计。我们的系统能够实时捕捉并分析顾客流动轨迹、停留时长及到访频次等关键指标,为商家提供科学的运营决策支持,优... 点击进入详情页
本回答由汇纳科技提供
调研工厂
2022-10-17 · 百度认证:清研灵智信息咨询(天津)官方账号
调研工厂
向TA提问
展开全部
抽样调查可以分为概率抽样和非概率抽样两类。
概率抽样:概率抽样调查的基本组织形式分为单阶段抽样和多阶段抽样两大类。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
秒懂百科
2021-01-25 · TA获得超过5.9万个赞
知道大有可为答主
回答量:25.3万
采纳率:88%
帮助的人:1.2亿
展开全部

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式