stata中删除两列中都缺失的部分

1个回答
展开全部
摘要 stata如何处理缺失值和异常值
方法一:直接删除----适合缺失值数量较小,并且是随机出现的,删除它们对整体数据影响不大的情况。
方法二:使用一个全局常量填充---譬如将缺失值用“Unknown”等填充,但是效果不一定好,因为算法可能会把它识别为一个新的类别,一般很少用。
方法三:使用均值或中位数代替----优点:不会减少样本信息,处理简单。缺点:当缺失数据不是随机数据时会产生偏差.对于正常分布的数据可以使用均值代替,如果数据是倾斜的,使用中位数可能更好。
咨询记录 · 回答于2022-03-13
stata中删除两列中都缺失的部分
stata如何处理缺失值和异常值方法一:直接删除----适合缺失值数量较小,并且是随机出现的,删除它们对整体数据影响不大的情况。方法二:使用一个全局常量填充---譬如将缺失值用“Unknown”等填充,但是效果不一定好,因为算法可能会把它识别为一个新的类别,一般很少用。方法三:使用均值或中位数代替----优点:不会减少样本信息,处理简单。缺点:当缺失数据不是随机数据时会产生偏差.对于正常分布的数据可以使用均值代替,如果数据是倾斜的,使用中位数可能更好。
就是两列都都缺失的行删除
你好就假定第一列是b,第二列是a,假定a是组号,b是变量。现在a = 5的那个组里面有一个b是缺失的,所以你打算删除第5组,对吧?如果是这个思路,那么请看下列代码:bys a: egen missing = sum(mi(b))drop if missing第一行代码,mi(b)是指b是否有缺失值,如果该行有则为1,没有则为0,因此a所代表的每个组内加总(egen sum函数),得到missing变量,missing为每个组内部缺失值的个数第二行代码,如果missing不为0,则删除希望有所帮助~
下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消