SAS数据的对比和清洗

 我来答
新科技17
2022-07-27 · TA获得超过5904个赞
知道小有建树答主
回答量:355
采纳率:100%
帮助的人:74.9万
展开全部

SAS中对比两个数据集的命令是proc compare,它的基本格式如下:

其中, proc compare 语句是调用数据比较过程,选项 base 和 compare 分别指定被比较的两个数据集; nosummary 的作用是不显示一些概括性的结果;而 transpose 则是按记录显示不一致的结果,默认是按变量显示不一致的结果。

而 id 语句通常指定索引变量,如id号,默认显示行号。举例说明:

一旦发现输入错误的数据集,便可以使用 if ...then... 语句进行修改,举例说明:

SAS利用 proc sort 过程来查找和删除重复值,它的基本格式如下:

其中,若不指定 out 选项,那么排序后的数据集将覆盖原有数据集; nouniquekey 的作用是输出重复值, nodupkey 选项是输出唯一值。

by 语句指定排序的变量,可以指定多个,默认按升序排序。

SAS的sort过程会自动产生两个变量:first.变量和last.变量,这两个变量分别表示 某变量某个值 的第一个和最后一个观测。直接举例说明其用法:

在上述例子中,需要注意的是,用 set 语句赋值数据集时,也要加上 by 语句,否则SAS不认 first.id last.id

除此之外,如果想要过滤掉观测的第一行,可以在 proc print; 前面加一句 if not first.id;

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
仁科信息
2024-07-24 广告
Oracle EBS运维是确保企业资源规划系统稳定、高效运行的关键环节。它涵盖了系统监控、性能优化、故障排查与恢复等多方面内容。通过持续的监控和数据分析,运维团队能够及时发现并解决潜在问题,保障系统的稳定性和安全性。同时,他们还需要与业务部... 点击进入详情页
本回答由仁科信息提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式