日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

oracle数据倾斜优化,Hive数据倾斜优化 - ericquan8的个人页面 - OSCHINA - 中文开源技术交流社区...

發布時間:2023/12/10 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 oracle数据倾斜优化,Hive数据倾斜优化 - ericquan8的个人页面 - OSCHINA - 中文开源技术交流社区... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據傾斜成因:由于數據分布不均勻,造成數據大量的集中到一點,造成數據熱點。具體為某一個reduce接收到的數據是其他reduce的n倍,導致明顯的木桶效應。

癥狀:

1,對表做select count(1) from tb group by key,看表中是否有大量相同的key。

2,查看監控界面,任務進度長時間維持在99%(或100%),只有少量(1個或幾個)reduce子任務未完成或某幾個reduce子任務是平均reduce時長的n倍;

上圖的其中的一個job的reduce時間遠遠超出其他reduce時長,表明該reduce處理的數據遠超出其他的reduce,可見此次統計發生數據傾斜。

解決方案

參數調優:

1,set hive.groupby.skewindata=true:這個參數的意思是做Reduce操作的時候,拿到的key并不是所有相同值給同一個Reduce,而是隨機分發,然后Reduce做聚合,做完之后再做一輪MR,拿前面聚合過的數據再算結果。所以這個參數其實跟Hive.Map.aggr做的是類似的事情,只是拿到Reduce端來做,而且要額外啟動一輪Job,所以其實不怎么推薦用,效果不明顯。

2,set hive.skewjoin.key=100000:這個是join的鍵對應的記錄條數超過這個值則會進行優化。

3,set mapred.reduce.tasks=500:增加Reducer個數,通常數據(KV數值對)Shuffle到某個Reducer是根據Key進行Hash然后對Reducer個數進行取模。

HQL語句優化:

1,小表join大表:

將小表放在join左邊,減少oom的幾率;

使用mapjoin,小表數據最好在1000條以內。select /*+mapjoin(a)*/ count(1) from tb_a a left outer join tb_b b on a.uid=b.uid;

2,大表join大表:

把空值的key變成一個字符串加上隨機數,把傾斜的數據分到不同的reduce上,由于null值關聯不上,處理后并不影響最終結果。

select * from tb_a a left outer join tb_b b on (case when a.userid is null then concact('xxx', rand()) else a.userid end = b.userid);

3,不同數據類型關聯產生數據傾斜,在join之前先轉換數據類型:

select * from users a left outer join logs b on a.usr_id = cast(b.user_id as string);

4,count distinct優化

采用sum() group by的方式來替換count(distinct )進行計算

原語句:select a, count(distinct b) as c from tbl group by a;

改寫后:select a, count(*) as c from (select distinct a, b from tbl) group by a;

另外,count distinct時,將值為空的情況單獨處理,如果是計算count distinct,可以不用處理,直接過濾,在最后結果中加1。如果還有其他計算,需要進行group by,可以先將值為空的記錄單獨處理,再和其他計算結果進行union。

總結

以上是生活随笔為你收集整理的oracle数据倾斜优化,Hive数据倾斜优化 - ericquan8的个人页面 - OSCHINA - 中文开源技术交流社区...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 天堂久久网 | 欧美一线高本道 | 99精品视频在线播放免费 | 国产午夜在线一区二区三区 | 重口另类 | 国产成人精品无码片区在线 | 国产美女视频91 | 日本a级黄色 | 狠狠爱天天干 | 国产aa毛片 | www.香蕉.com| 欧美精品v | 香蕉狠狠爱视频 | 久久调教视频 | 亚洲一区影院 | 伊人精品久久 | 综合色婷婷一区二区亚洲欧美国产 | 免费一级毛片麻豆精品 | 成人久久网站 | 亚洲综合在线一区二区 | 久久久久久无码午夜精品直播 | 精品无码人妻一区二区三 | 岛国精品一区 | 第一色综合 | 久久国内免费视频 | 一级草逼片 | 在线综合视频 | 色盈盈影院 | 国产香蕉一区二区三区 | 青青草.com | www.好吊色| 真实乱视频国产免费观看 | 日本一区二区人妻 | 青娱乐欧美 | 日韩成人精品在线 | 一区二区乱子伦在线播放 | 国产做爰免费视频观看 | 99成人在线 | 国产欧美精品一区二区色综合朱莉 | 成人黄色电影在线 | 九色麻豆 | 男人和女人日批视频 | 99久久国产热无码精品免费 | 成熟了的熟妇毛茸茸 | 久久久久无码精品国产 | 日日噜噜噜噜久久久精品毛片 | 国产福利免费在线观看 | 超级砰砰砰97免费观看最新一期 | 涩涩视频软件 | 国产精品.www | 黄色免费网站在线 | 欧美与黑人午夜性猛交久久久 | 涩涩涩涩av | 国产精品3 | 久久久精品视频免费 | www.av日韩| 日日做夜夜爽毛片麻豆 | 亚洲伊人天堂 | 青青草原在线免费 | 日韩视频一区二区三区 | 国产探花一区二区三区 | 一级中文片 | 国产小视频91 | 在线看国产| 三上悠亚人妻中文字幕在线 | 国产精品腿扒开做爽爽爽挤奶网站 | 91精品综合久久久久久 | 夜夜天天操 | 亚洲三级网站 | 91丨九色丨蝌蚪丨老版 | 河北彩花av在线播放 | 亚洲一区在线视频观看 | 亚洲乱色熟女一区二区三区 | 久久久久亚洲AV成人网人人小说 | 日韩欧美一区二区三区四区 | 黄色一级视频在线观看 | 欧美理伦片在线播放 | 这里有精品视频 | 黄色av国产 | 国产精品无码成人片 | 国产成人午夜高潮毛片 | 最色网站 | 相亲对象是问题学生动漫免费观看 | 日本啊啊视频 | 中文字幕人妻一区二区三区 | 亚洲一区二区视频在线观看 | 日本在线视频不卡 | 激情文学综合网 | 视频一区 中文字幕 | 日韩三级黄色片 | 能直接看的av网站 | 国产精品第四页 | 在线1区 | 捆绑无遮挡打光屁股 | 中文字幕av无码一区二区三区 | 精品无人国产偷自产在线 | 中文字幕素人 | 一区二区三区爱爱 | 久久免费国产视频 |