
不是正态分布的数据怎么分析
1个回答
展开全部
不是正态的数据分析,第一反应是寻求变换,常用的就是Box-Cox变换。如果还不行的话,就直接上非参数了。
对待这种问题,一般要先弄清不正态的原因再说。
第一种情况:数据本来就不是正态的。
如果明确知道样本数据所代表的总体本来就不是正态分布的,可以考虑寻求变换,通常都会找到恰当的变换参数。但有些数据也不一定能够变换成功,这时可以采用非参数检验来进行分析。
第二种情况:存在异常点。
如果确认是异常点,可以考虑剔除。但如果找不到产生异常点的原因,它可能就是一个正常数据,此时可以考虑补充抽样,看看能不能把异常点与大多数数据中的空间填补上。
第三种情况:双峰(多峰)数据。
可能每组数据都服从正态分布,但混在一起就不行了。恰当的做法是尽可能把数据按不同属性分开分析。
第四种情况:平顶的数据。
平顶的数据是指在直方图上看到的图形是相对比较平坦的,这时就要考虑尽可能把混在一起的数据按其属性分开,每个属性的数据单独分析。同时还可以考虑只取近期的数据进行分析,历史数据在当前可能不那么适用了。

2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件...
点击进入详情页
本回答由光点科技提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询