数据处理的一般过程中,明确目标应注意
1个回答
关注
展开全部
咨询记录 · 回答于2024-01-03
数据处理的一般过程中,明确目标应注意
亲,你好!
数据处理的一般过程中,明确目标应注意的问题如下:
一、核查
1. 确认输入的数据是有效的,进行数据范围检查。例如xing别只有1(男)和2(女),就不能出现3,4,5之类的无效数据。
2. 确认逻辑正确。例如存在跳转选项,是否符合,或者前部分的部分选项选择后某些部分不能出现一些结果。当然,这些可以在数据录入阶段就设置好逻辑。
3. 核查有无缺失值、离群值、异常值。
二、处理
1. 可疑值:先做个频数表和描述xing分析,看最大值、最小值等。出现可疑值,在条件允许的范围内,回看原始资料核对。核对录入错误的话及时纠正,核对还是可疑值的话,重新询问或测量,以反映真实情况。如果有误可删除,如果依然是离群值,可进行非参数估计或其他稳健统计方法来降低可疑值的影响。另外可以对可疑值删除前后作敏感xing分析。
2. 缺失值的处理:通常缺失值应控制在数据记录总量的10%以内。注意缺失值应该与0分开,若确实的比例较小,可以直接分析,舍弃却是记录。如果缺失值较多,或严重影响多元回归的效率,可进行插补,例如均值,或邻近值的补充等。
本回答由壹寰(深圳)科技文化有限公司提供