hadoop hive窗口函数求和
生活随笔
收集整理的這篇文章主要介紹了
hadoop hive窗口函数求和
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
聚合函數:例如sum()、avg()、max()等,這類函數可以將多行數據按照規則聚集為一行,一般來講聚集后的行數是要少于聚集前的行數的。
窗口函數:既能顯示聚集前的數據,又能顯示聚集后的數據。窗口函數又叫OLAP函數/分析函數,窗口函數兼具分組和排序功能。
? 窗口函數最重要的關鍵字是 partition by 和 order by。
核心語法:over (partition by xxx order by xxx)
案例【求和】
原始數據:
--只使用聚合函數sum來對數據進行操作
select? sum(pv) from itcast_t1;?
結果如下:
--sum函數搭配窗口函數的使用【根據cookieid分組,根據createtime排序】
select cookieid,createtime,pv,
sum(pv) over(partition by cookieid order by createtime) as pv1?
from itcast_t1;
結果:
--此時sum聚合:默認是第一行到當前行聚合
--還可以通過window子句 來控制聚合的行的范圍:rows between含義,也叫做window子句
--除了sum之外 avg max min都可以配合窗口函數使用
總結
以上是生活随笔為你收集整理的hadoop hive窗口函数求和的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PS插件的作用
- 下一篇: 思科模拟器实验7:OSPF配置命令