浅谈指标
在日常工作中,数据同学经常会遇到以下问题
亦或是
如果大家经常遇到上述类似问题,说明需要一个“数据字典”或者“指标库”来对指标的定义进行规范化和维护。
本文将会对指标进行初步介绍,并就如何规范指标进行深入讨论。
我们经常听到以下类似的对话:
这些不准确、具体的话,我们平时说说倒是无妨——毕竟具体的消息需要一定的成本。但是在工作中如果还是这个态度的话,恐怕就不太合适了。如果每个项目、活动连每天多少用户数、花多少钱赚多少钱都说不明白,那这个项目想来也没什么价值。
指标,就是对抗这种不确定的描述。
我们先来看百度百科中指标的定义
简单的说,指标是衡量目标的方法,它为了衡量某个东西而存在。我们常说的日活、成本、利润、收入等,都是指标。
将刚才的话运用指标重新编辑下:
是不是显得准确了很多?
下面我们进一步介绍指标的构成
我们可以简单的分为3类:自身属性、业务和技术。
我们用DAU(日活跃用户数)来举一个例子
是不是顿时清晰了很多?
结果性指标 ,比如电商场景下的 GMV 或订单量,它通常是业务漏斗的底部,是一个不可更改的、后验性的指标。
过程性指标 ,可以简单理解为我到达这个结果之前经过的路径,以及通过这个路径去衡量转化好坏的过程,它是可干预的,而且通常是“用户行为”。
绝对指标 :是指统计量的绝对值,用于反映规模、大小的量级指标,如活跃用户数。
相对指标 :是指统计量的比率值,用于反映程度、质量的健康水平指标,如人均使用时长相对指标是由绝对指标通过计算得来。
可以说绝对指标是相对指标的基础,而相对指标常常蕴含着更大的信息量,两者相辅而成才能更好的分析。
这里主要根据是在用户的关键行为(例如用户下单支付)前还是后来判定。
虚荣指标指的是看起来很吊但仔细想想并没有卵用的指标,例如总用户数——你知道总用户数又有什么用呢?你需要的是用户的新增、质量、活跃。而不是它总共多少人。
在 Data Science 中,指标有很多相关的定义,以下介绍部分:
指标是度量,但度量不全是指标。
在数据中,度量更多是相比维度的一个连续性数值;可以说我们常说的指标都是度量。
单一的指标没有任何意义 ,至少需要有一个维度以上的对比才能产生价值,且只有放在同一个维度下对比才有意义
一个问题,往往有很多方面,只用一个指标不能充分说明问题。这就需要一组相关联的指标来描述,这就是数据 指标体系 。笔者会在后续进行详细深入的介绍。
2024-12-03 广告