统计学中的箱线图的制作具体操作步骤怎么做?

 我来答
SPSSAU
2021-02-04 · 百度认证:SPSSAU官方账号,优质教育领域创作者
SPSSAU
SPSSAU,也称"在线SPSS",一款网页版数据科学算法平台系统,提供"拖拽点一下"的极致体验和智能化分析结果。
向TA提问
展开全部

箱盒图(也称盒图,箱线图等)是在1977年由美国统计学家John Tukey发明,分析数据需要为定量数据。通过箱盒图,可以直观的探索数据特征。

箱盒图共有两个用途,分别如下:

  • 直观地识别数据中异常值(离群点);

  • 直观地判断数据离散分布情况,了解数据分布状态。


  • 箱盒图共由五个数值点构成,分别是最小观察值(下边缘),25%分位数(Q1),中位数,75%分位数(Q3),最大观察值(上边缘)。

  • 中横线:中位数

  • IQR:75%分位数(Q3)-25%分位数(Q1)

  • 最小观察值(下边缘) = Q1 – 1.5 IQR

  • 最大观察值 (上边缘)= Q3 + 1.5 IQR

  • 箱盒图的使用场景情况如下:

  • 查看可能的异常值数据情况(比如在回归分析前查看是否有异常数据);

  • 非参数检验时查看不同类别X时,Y的数据分布情况;

  • 其它涉及查看数据分布或者异常值查看时。

  • SPSSAU操作截图如下:

    上图中直观展示出C2时共有2个异常值点,如果对C2进行分析,且分析方法对异常值敏感时(比如相关分析,回归分析等),此时需要对该2个异常值点进行处理成null或者填充,或者在分析时进行过滤。

    SPSSAU提供不同类别X时,Y的盒状图分布,比如上图中可以查看不同性别人群,C1,C2和C3共三项在区分性别时的盒状分布。

    得到结果比如C1的盒状图如下:

    上图可以看出,在男性时,C1中有2个异常点;女性时,C1共出现1个异常点。移动到异常点时会显示具体数据。此时如果有需要,可将此3个异常值进行处理,或者在分析时过滤掉异常值。

    除了异常值的观察,还可以通过数据盒状图直观看出,男性在C1上的整体打分,会明显高于女性打分。

BJ华夏艺匠
2024-08-09 广告
专业模型的生产商有很多,北京华夏艺匠模型科技有限公司值得了解一下。北京华夏艺匠模型科技有限公司 ,拥有十余年沙盘模型制作经验,公司占地约2047平米,拥有一支专业工业、机械设备、效果图设计、模型制作团队。公司目前总部设在北京、上海、两个生产... 点击进入详情页
本回答由BJ华夏艺匠提供
匿名用户
2013-09-18
展开全部
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
  [编辑]箱线图的绘制步骤
  1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。
  2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。在矩形盒内部中位数(Xm)位置画一条线段为中位线。
  3、在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在F+3IQR和F-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。
  4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。
  5、用“〇”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。至此一批数据的箱线图便绘出了。统计软件绘制的箱线图一般没有标出内限和外限。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式