质量工程师中级理论辅导:统计整理

 我来答
为求星辰大海
2023-02-19 · TA获得超过775个赞
知道小有建树答主
回答量:1752
采纳率:100%
帮助的人:127万
展开全部
一、统计整理的概念和内容
  1、统计整理
  根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。
  统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。
  2、统计整理的意义
  通过统计调查所取得的总体各单位的资料是零星的,/考*试*大/分散的,只能说明总体单位的情况,而不能反映总体特征。统计整理对调查资料进行科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数量特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个统计工作中发挥着承上启下的作用。
  3、统计整理的方法
  统计整理的方法是分组、汇总和编表。
  分组是根据研究任务的要求,对调查所得的原始资料,/考*试*大/确定哪些分组或分类。统计分组是统计整理的关键。
  汇总是在统计分组的基础上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。
  编表是把汇总的资料按一定的规则在表格上表现出来。
  4、统计整理的内容和步骤
  ①确定应整理的指标和确定应分的组;
  ②对各项指标进行汇总,确定各组和总体的单位数和标志总量;
  ③用统计表现分组、汇总的结果。
  二、统计分组
  1、统计分组的意义
  根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。
  总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。
  2、统计分组的种类
  ①统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。
  ②统计分组按分组标志的多少分为简单分组和复合分组。/考*试*大/简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
  ③统计分组按分组标志的性质分为品质分组和变量分组。品质分组是将总体按品质标志进行分组,如企业按经济成份、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。
  3、分组体系与分组标志的选择
  ①分组体系统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是复合分组后形成的体系。
  ②分组标志的选择分组标志的选择是统计分组的关键。分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。
  正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。
  4、统计分组的方法
  品质标志分组方法品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
  数量标志分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,/考*试*大/而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:
  ①单项式分组和组距式分组对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。
  离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。/考*试*大/
  也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。
  连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。
  在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。
  组距式分组使资料的真实性受到一定程度的损害。组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。
  通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来。根据这个道理,如组距太小,分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。
  ②等距分组和不等距分组等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。
  统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。
  ③组限和组中值组距两端的数值称组限。/考*试*大/其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。
  组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。
  组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。一般情况下,组中值=(上限+下限)÷2对于第一组是 “多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限-1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。

 三、统计分布(分配数列)
  1、分配数列的概念、构成要素
  在统计分组的基础上,列出各组对应的单位数,形成总体单位数在各个组的分布,称统计分布,又称分配数列或次数分布。分配数列包括两个要素:总体按某标志所分的组和各组对应的单位数(频数)
  2、分配数列的类型
  分配数列包括品质分配数列和变量分配数列,分别由品质标志分组和数量标志分组形成。变量数列又有单项式数列和组距式数列,分别由单项式分组和组距式分组形成。
  3、频数和频率
  统计分组后各组对应的单位数称频数,也叫次数;各组单位数占总体单位总数的比重称频率。各组的频率大于0,所有组的频率总和等于1。
  在变量分配数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。
  组距数列中,影响各组次数分布的要素是组数、组距、组限和组中值。
  有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计有向上累计和向下累计的方法。向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重;向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。
  4、次数分布特征
  现象总体的性质不同,其次数分布也不同。归纳起来主要有四种类型:
  ①钟型分布。特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。
  ②U型分布。其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。如人口死亡现象按年龄分布便是如此。
  ③J型分布。在社会经济现象中,一些统计总体分布曲线呈J型。
  ④洛伦兹分布。洛伦兹曲线专门用以检定社会收入分配的平等程度。洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布集中状况或平均性。洛伦兹曲线又称集中曲线,其运作的条件是:现象总体各组频率与相应的各组标志总量的比重。
  5、变量分配数列编制的步骤
  ①将原始资料按其数值大小重新排列只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。
  ②确定全距全距是变量值中值和最小值的差数。确定全距,/考*试*大/主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。
  ③确定组距和组数前面已经介绍过组距数列有等距和不等距之分,应视研究对象的特点和研究目的而定。
  组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,是5或10的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。
  在等距分组条件下,存在以下关系:组数=全距/组距
  ④确定组限组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“××以下”表示),组只有下限(用“××以上”表示)。如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。
  在采用闭口式时,应做到最小组的下限低于最小变量值,组的上限高于变量值,但不要过于悬殊。
  ⑤编制变量数列经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。
  四、统计表
  1、统计表的概念、构成
  统计表是纵横交叉的线条所绘制表现统计资料的一种表格形式。广义统计表包括统计工作各阶段所使用的一切表格。
  从形式上看,统计表是由总标题,横行标题、/考*试*大/纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。
  2、统计表的种类
  统计表根据主词是否分组及分组情况分为简单表、简单分组表和复合分组表;统计表按作用不同分为调查表、汇总表和分析表。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式