用图表反应要统计的数据,最好用哪种统计图
2016-11-02
除了柱状图、条形图、折线图、饼图等常用图表之外,还有数据地图、瀑布图和散点图,旭日图,漏斗图等等。一起了解下不同图表的使用场景、优劣势!
1.柱状图
适用场景:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。
优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。
劣势:柱状图的局限在于只适用中小规模的数据集。
延伸图表:堆积柱状图、百分比堆积柱状图
不仅可以直观的看出每个系列的值,还能够反映出系列的总和,尤其是当需要看某一单位的综合以及各系列值的比重时,最适合。
2.条形图
适用场景:显示各个项目之间的比较情况,和柱状图类似的作用;
优势:每个条都清晰表示数据,直观;
延伸图表:堆积条形图、百分比堆积条形图
3.折线图
适用场景: 折线图适合二维的大数据集,还适合多个二维数据集的比较。
优势:容易反应出数据变化的趋势。
4.各种数据地图(一共有6种类型)
适用场景:适用于有空间位置的数据集;
优劣势:特殊状况下使用,涉及行政区域;
(1)行政地图(面积图)
(2)行政地图(气泡图)
(3)地图图表(根据经纬度,可做区域、全国甚至全球地图):点状图
(4)地图图表:热力图
(5)地图图表:散点图
(6)地图图表:地图+柱状/饼图/条形
5.饼图(环图)
适用场景:显示各项的大小与各项总和的比例。适用简单的占比比例图,在不要求数据精细的情况适用。
优势:明确显示数据的比例情况,尤其合适渠道来源等场景。
劣势:肉眼对面积大小不敏感。
6.雷达图
适用场景:雷达图适用于多维数据(四维以上),且每个维度必须可以排序,数据点一般6个左右,太多的话辨别起来有困难。
优势:主要用来了解公司各项数据指标的变动情形及其好坏趋向。
劣势:理解成本较高。
7.漏斗图
适用场景:漏斗图适用于业务流程多的流程分析,显示各流程的转化率。
优势:在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率,能够直观地发现和说明问题所在。
劣势:单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏。
8.词云
适用场景: 显示词频,可以用来做一些用户画像、用户标签的工作。
优势:很酷炫、很直观的图表。劣势:使用场景单一,一般用来做词频。
9.散点图
适用场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。散点图适用于三维数据集,但其中只有两维需要比较。
优势:对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。
劣势:在点状图中显示多个序列看上去非常混乱。
延伸图表:气泡图(调整尺寸大小就成气泡图了)
10.面积图
适用场景:强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。
延伸图表:堆积面积图、百分比堆积面积图还可以显示部分与整体之间(或者几个数据变量之间)的关系。
11.指标卡
适用场景:显示某个数据结果&同环比数据。
优势:适用场景很多,很直观告诉看图者数据的最终结果,一般是昨天、上周等,还可以看不同时间维度的同环比情况。
劣势:只是单一的数据展示,最多有同环比,但是不能对比其他数据。
12.计量图
适用场景:一般用来显示项目的完成进度。
优势:很直观展示项目的进度情况,类似于进度条。
劣势:表达效果很明确,数据场景比较单一。
13.瀑布图
适用场景:采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系,最终展示一个累计值。
优势:展示两个数据点之间的演变过程,还可以展示数据是如何累计的。
劣势:没有柱状图、条形图的使用场景多。
14.桑基图
适用场景:一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。
15.旭日图
适用场景:旭日图可以表达清晰的层级和归属关系,以父子层次结构来显示数据构成情况,旭日图能便于细分溯源分析数据,真正了解数据的具体构成。
优势:分层看数据很直观,逐层下钻看数据。
16.双轴图
适用场景:柱状图+折线图的结合,适用情况很多,数据走势、数据同环比对比等情况都能适用。
优势:特别通用,是柱状图+折线图的结合,图表很直观。
劣势:这个好像没什么劣势,个人感觉。
所有的数据图表均来自BDP个人版~~~数据图表(数据报告)综合效果如下:
每种图表的展示方法都有其自身的着重点,在绘图之前,一定要考虑清楚所选择的这种方式是要传达出数据的什么信息,哪种图表才能要让阅读者一眼看出你想表达的数据信息。大部分数据间的关系可以归纳为以下六种类型:成分、排序、时间序列、频率分布、相关性和多重数据比较。图表类型是需要根据所要表达的内容来加以选择的,例如表示构成比时,用饼图和柱形图;表示时间变迁时,用折线图;表示两种数值的关系时,用散点图;表示三个以上的数值的平衡时,用雷达图;对数值进行横排比较时,用柱形图;等等。
做问卷、做巡查、做暗访,就上调研工厂。
如何对不同的数据选择合适统计图
2016-01-02
(1)条图:又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。
(2)百分条图和圆图:描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。
(3)线图:用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。
(4)半对数线图:纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。
(5)直方图:描述计量资料的频数分布。
(6)散点图:描述两种现象的相关关系。
(7)统计地图:描述某种现象的地域分布。
条形图
用一个单位长度(如1厘米)表示一定的数量,根据数量的多少,画成长短相应成比例的直条,并按一定顺序排列起来,这样的统计图,称为条形统计图。条形统计图可以清楚地表明各种数量的多少。条形图是统计图资料分析中最常用的图形。按照排列方式的不同,可分为纵式条形图和横式条形图;按照分析作用的不同,可分为条形比较图和条形结构图。
条形统计图的特点:
(1)能够使人们一眼看出各个数据的大小。
(2)易于比较数据之间的差别。
(3)能清楚的表示出数量的多少。
扇形图
以一个圆的面积表示事物的总体,以扇形面积表示占总体的百分数的统计图,叫作扇形统计图。也叫作百分数比较图。扇形统计图可以比较清楚地反映出部分与部分、部分与整体之间的数量关系。
扇形统计图的特点:
(1)用扇形的面积表示部分在总体中所占的百分比。
(2)易于显示每组数据相对于总数的大小。
折线图
折线统计图
以折线的上升或下降来表示统计数量的增减变化的统计图,叫作折线统计图。与条形统计图比较,折线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。折线图在生活中运用的非常普遍,虽然它不直接给出精确的数据,但只要掌握了一定的技巧,熟练运用“坐标法”也可以很快地确定某个具体的数据。
折线统计图的特点: (1)能够显示数据的变化趋势,反映事物的变化情况。
网状图
网状统计图的特点是:
母代表的意义,在具体的答题过程中就可以脱离字母,较简便找出答案。
统计图的意义:
表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
茎叶统计图
茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
茎叶图有三列数:左边的一列数统计数,它是上(或下)向中心累积的值,中心的数(带括号)表示最多数组的个数;中间的一列表示茎,也就是变化不大的位数;右边的是数组中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。
茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转90度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。
茎叶图在质量管理上用途与直方图差不多,但它通常是作为更细致的分析阶段使用。由于它是用数字组成直方图,所以在做的时候比直方图时,通常我们常使用专业的软件进行绘制。
茎叶图的特征
1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。
统计图的意义:
表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
网状统计图的特点是这类统计图中只有一些字母,字母所代表的意义都在题外,在答题前必弄清这些字母代表的意义,在具体的答题过程中就可以脱离字母,较简便地得出答案。
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.
根据《中国小学教学百科全书》介绍,它是用原始数据制成的一种表格.为了实际需要,人们常常要把工农业生产、科学技术和日常工作中所得到的相互关联的数据,按照一定的要求进行整理、归类,并按照一定的顺序把数据排列起来,制成表格,这种表格叫做统计表.
它的作用是:①用数量说明研究对象之间的相互关系.②用数量把研究对象之间的变化规律显著地表示出来.③用数量把研究对象之间的差别显著地表示出来.这样便于人们用来分析问题和研究问题.
统计表的形式繁简不一,通常按项目的多少,分为单式统计表和复式统计表两种.只对某一个项目的数据进行统计的表格,叫做单式统计表,也叫做简单统计表.统计项目在两个或两个以上的统计表格,叫做复式统计表.
统计表的内容一般都包括总标题、横标题、纵标题、数字资料、单位、制表日期.总标题是指表的名称,它要能简单扼要地反映出表的主要内容,横标题是指每一横行内数据的意义;纵标题是指每一纵栏内数据的意义;数字资料是指各空格内按要求填写的数字;单位是指表格里数据的计量单位.在数据单位相同时,一般把单位放在表格的左上角.如果各项目的数据单位不同时,可放在表格里注明.制表日期放在表的右上角,表明制表的时间.各种统计表都应有“备考”或“附注”栏,以便必要时填入不属于表内各项的事实或说明.
直方图
直方图(Histogram)又称柱状图、质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。直方图法的涵义
在质量管理中,如何预测并监控产品质量状况?如何对质量波动进行分析?直方图就是一目了然地把
这些问题图表化处理的工具。它通过对收集到的貌似无序的数据进行处理,来反映产品质量的分布情况,判断和预测产品质量及不合格率。
直方图又称质量分布图,柱状图,它是表示资料变化情况的一种主要工具。用直方图可以的资料,解析出规则性,比较直观地看出产品质量特性的分布状态,对於资分布状况一目了然,便於判断其总体质量分布情况。在制作直方图时,牵涉学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键数位是分组数和组距。是一种几何形图表,它是根据从生产过程中收集来的质量数据分布情况,画成以组距为底边、以频数为高度的一系列连接起来的直方型矩形图,如图所示。
作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。具体来说,作直方图的目的有:
①判断一批已加工完毕的产品;
②验证工序的稳定性;
③为计算工序能力搜集有关数据。
直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。直方图的绘制方法
①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。分组的数量在6-20之间较为适宜。
③计算组距的宽度。用组数去除最大值和最小值之差,求出组距的宽度。
④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。