《SAS编程与数据挖掘商业案例》学习笔记之五
六:merge語句的使用(一個指針,一個pdv)
merge語句是橫向合并數據集,合并前必須兩個數據集都要按照合并變量進行排序;
proc sort data=chapt3.merge_a;by x;run;
proc sort data=chapt3.merge_b;by bx;run;
data ed;
merge chapt3.merge_a(in=a)?????chapt3.merge_b(rename=(bx=x)????in=b);
by x;
Ina=a;inb=b;
run;
以兩個數據集的x變量為關鍵表鏈兩個表相連,由于兩個表中都有一個y變量,由于同名b表中的y會覆蓋對應匹配到的a中的y的值;
七:update語句(一個指針,一個pdv)
update在橫向合并兩個數據集時的方式和merge相似,都是用更新數據集修改主數據集。
proc sort data=chapt3.merge_a;by x;run;
proc sort data=chapt3.merge_b;by bx;run;
data ed;
Update??chapt3.merge_a chapt3.merge_b(rename=(bx=x));
by x;
run;
update語句一定要和by語句一起;這個by語句給出了主數據集和更新數據集共有的變量;
update語句必須先對數據集按照by后面的變量進行排序;
主數據集中by后面指定的變量對應的觀測值最好是唯一的,因為如果不唯一,則只會替代第一個記錄;
更新數據集存在的缺失值處理是通過updatemode來完成的,updatemode=missingcheck,則檢查修改數據集,若存在缺失值,則保留主數據集中相應數據,該選項為默認值;
Updatemode=nomissingcheck,不檢查修改數據集,主數據集中相應值一概被替換
總結
以上是生活随笔為你收集整理的《SAS编程与数据挖掘商业案例》学习笔记之五的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《SAS编程与数据挖掘商业案例》学习笔记
- 下一篇: 《SAS编程与数据挖掘商业案例》学习笔记