数据处理的一般过程中,明确目标应注意

1个回答
展开全部
咨询记录 · 回答于2024-01-03
数据处理的一般过程中,明确目标应注意
亲,你好! 数据处理的一般过程中,明确目标应注意的问题如下: 一、核查 1. 确认输入的数据是有效的,进行数据范围检查。例如xing别只有1(男)和2(女),就不能出现3,4,5之类的无效数据。 2. 确认逻辑正确。例如存在跳转选项,是否符合,或者前部分的部分选项选择后某些部分不能出现一些结果。当然,这些可以在数据录入阶段就设置好逻辑。 3. 核查有无缺失值、离群值、异常值。 二、处理 1. 可疑值:先做个频数表和描述xing分析,看最大值、最小值等。出现可疑值,在条件允许的范围内,回看原始资料核对。核对录入错误的话及时纠正,核对还是可疑值的话,重新询问或测量,以反映真实情况。如果有误可删除,如果依然是离群值,可进行非参数估计或其他稳健统计方法来降低可疑值的影响。另外可以对可疑值删除前后作敏感xing分析。 2. 缺失值的处理:通常缺失值应控制在数据记录总量的10%以内。注意缺失值应该与0分开,若确实的比例较小,可以直接分析,舍弃却是记录。如果缺失值较多,或严重影响多元回归的效率,可进行插补,例如均值,或邻近值的补充等。
下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消