SAS如何产生新变量
这一节我学的是SAS如何产生新变量,其中涉及到了很多细节,让我不紧翻起了🙄,emmmmm,算了,还是老实的做笔记吧。
注意若变量名是已有变量,表示用新值代替原有值,表达式的范围很广,常见的运算符如下:
注意SAS中,不等于符是“^=”不是“!=”,新变量要放在“input”和“cards”之间。另外,如果使用比较运算,SAS会根据比较的结果产生0和1。
日期常量要写成“日月年”d这种格式,月是英文的前三个字母。
SAS读取数据时有一特点,就是有遗忘症,它每读完一条观测返回到data语句的时候,会忘掉刚才读取的值,因此若想实现累加效果,需要用到 retain 语句或者累加语句。
它的作用是生成一个变量,指定它的初始值,并保留该变量每次计算的结果,若没有指定初始值,默认为缺失值。
它的作用时产生一个累加的变量值,注意是没有左边的“变量=”部分,直接写右边的表达式,它的默认值为0。另外,累加语句表达式中第一个出现的变量就是新产生的变量名。
do语句适用于有规律的变量,比如1~12月。初始值、最终值、增加量可以是数值,也可以是字符。若没有增加值,则默认为1。下面是几个常见的do 循环语句的格式:
新变量是需要 提前 指定与之对应的变量类型和长度,SAS中主要是用 length 语句,它的格式如下:
如果新变量是字符型,需要加上"$"符号,数值型变量的长度可以指定3~8,字符型变量的长度则可以指定1~32767。另外,length语句一定要在新变量产生之前就设定好,否则不起作用。
需要特别注意:SAS中,字符型变量的长度是由第一个遇到的值得长度决定的,而且字符变量一旦产生,它的长度就无法改变。举例说明:
在左例中,由于事先未指定lx2的长度,而且lx2第一个遇到的值是“无效”,所以它的长度就固定在了4,因此最后打印出来的lx2列也只能有2个汉字。