SAS之大话PDV

之所以说是数据源,而非输入缓冲区的原因上一条推送已经说明,这里就不再啰嗦啦。

这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。

IF语句 & WHERE语句

这两个语句均是用于条件选择,但二者作用时机却大有不同。简单来说,if语句作用于观测出PDV到生成数据集时;而where语句则作用于观测进入PDV之时。这也奠定了二者效率上的差别。由于where语句作用于观测进入PDV之时,SAS读入的观测已经过选择,读入观测数较少,所以在读入较大数据之时,where语句的优势就尤为明显了。

但又是因为where语句作用于观测进入PDV之时,也带来了一些限制,如:

当提交如上语句之时,SAS将会报错:

ERROR: 变量 x 不在文件“WORK.B”中。

而使用if语句则不会出现此ERROR。

对于这些选项的作用,相信大家也都有所了解;如不了解,那就得好好补补基础咯

言归正传,对于这些语句的作用时机,就不再一一演示,简单来说,rename、keep、drop语句用于PDV到生成数据集的过程中。而对于选项,则需看选项的位置:

对于上述代码,大家可自行敲击运行,就会发现在数据集b生成过程中出现NOTE:
变量 age 未初始化。
 原因就在于当选项用于set语句时,作用时机为原始数据至PDV之间;而当选项用于data语句时,则作用于PDV至生成数据集之间。

SASDATA步中使用SET语句、MERGE语句和UPDATE语句读入变量时(除赋值语句和input语句外),SAS将会自动retain,即由这些语句读入的变量将不会被置缺失。

不多说,上例子:

例1:merge

结果:

运行过程:

从a读入第1条观测,从b读入第1条观测,查看id(即by变量)是否匹配,若不匹配,则读入id较小的观测,若匹配则一起读入PDV。此例为匹配。

到达RUN语句,将PDV写入数据集

从a、b分别读入第2条观测,检查发现不匹配。检查id是否与PDV中相同,若是,则读入匹配的观测(即a中第二条观测),若都不同,则将较小的id观测读入。

达到run语句,OUTPUT;

读入a的第3条观测,b的第2条观测,检查发现不匹配。再检查id发现a中第3条与PDV中id匹配,将其写入。后output。

读入a的第4条观测,b的第2条观测,检查发现匹配,再检查发现与PDV中id不同;此时进入另一个by组,初始化DVP。将匹配的观测写入DVP。

读入a中第5条观测,b中第3条观测,发现id不匹配,再检查发现b中第3条观测id与PDV中id匹配,将其读入,后output。

读入a中第5条观测,b中第4条观测,发现id匹配并与PDV中id不同,初始化pdv,将两条观测整合写入PDV,后output。

由于a中观测已读完(EOF),读入b中第5条观测,发现与PDV中id不同,初始化PDV,读入b中第5条观测,output。注意此时由于没有匹配,且为新的by组,不存在retain的x变量,所以最后一条观测中x为空。

a、b数据集均到达EOF,程序运行结束,保存数据集。

例2:set

结果:

这时候大家可能会发现,第二条观测不是同一个by组吗?为什么第2条观测的x变量不是第一条中x的值呢?为什么没有retain?

然而,其实还是有retain的,只不过数据集中体现不出来,而结果为什么会是那样呢?这就涉及到PDV的又一个原则,当PDV从一个新的数据集中读入观测时,会将PDV置缺失。

若你想看出retain的效果呢,有个办法:

对于UPDATA等其他语句,就不再举例啦,有兴趣者可自行探索。

最新文章

  1. Java里面获取当前服务器的IP地址
  2. WPF快速入门系列(7)——深入解析WPF模板
  3. 最小生成树---Kruskal/Prime算法
  4. Python的regex模块——更强大的正则表达式引擎
  5. Codeforces Round #373 (Div. 2) B
  6. XML通過XSD產生CLASS
  7. SQL 获取各表记录数的最快方法
  8. cocos2d-x图片变灰或者变亮
  9. Prefix.pch的作用和用法
  10. ZYB's Game(博弈)
  11. iOS开发之自定义导航栏返回按钮右滑返回手势失效的解决
  12. mac提升yosemite后php 扩展修复
  13. Cocos2d 使用控制台打印的方法
  14. PHP页面提示与跳转
  15. arm-linux内核编译过程小结
  16. OAuth 2.0 认证的原理与实践
  17. 性能超前,详解腾讯云新一代Redis缓存数据库
  18. openlayers4 入门开发系列之地图属性查询篇(附源码下载)
  19. springboot之JdbcTemplate
  20. List、Set、数据结构、Collections

热门文章

  1. 定时ping取返回值并绘图
  2. List --搜索列表
  3. light oj 1068 数位dp
  4. 移动端iPhone系列适配问题
  5. HDFS 数据节点(DataNode)
  6. /etc/inittab配置文件详解
  7. BZOJ2982: combination Lucas模板
  8. Redis源码解析:16Resis主从复制之主节点的完全重同步流程
  9. BaiduTemplate [ 百度模板引擎 ]
  10. sublime中用less实现css预编译