日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

为什么MaxCompute采用列式存储?列式存储和行式存储的主要区别在哪

發布時間:2024/8/23 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 为什么MaxCompute采用列式存储?列式存储和行式存储的主要区别在哪 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
摘要: 1 為什么要按列存儲 列式存儲(Columnar or column-based)是相對于傳統關系型數據庫的行式存儲(Row-basedstorage)來說的。簡單來說兩者的區別就是如何組織表(翻譯不好,直接抄原文了): ? Row-based storage stores atable in a sequence of rows. ? Column-based storage storesa table in a sequence of columns. 下面來看一個例子: 從上圖可以很清楚地看到,行式存儲下一張表的數據都是放在一起的,但列式存儲下都被分開保存了。
點此查看原文:?http://click.aliyun.com/m/41691/
1 為什么要按列存儲 列式存儲(Columnar or column-based)是相對于傳統關系型數據庫的行式存儲(Row-basedstorage)來說的。簡單來說兩者的區別就是如何組織表(翻譯不好,直接抄原文了): ?? Row-based storage stores atable in a sequence of rows. ?? Column-based storage storesa table in a sequence of columns. ? 下面來看一個例子: ?
從上圖可以很清楚地看到,行式存儲下一張表的數據都是放在一起的,但列式存儲下都被分開保存了。所以它們就有了如下這些優缺點:
? 行式存儲 列式存儲
優點 ? 數據被保存在一起
? INSERT/UPDATE容易
? 查詢時只有涉及到的列會被讀取
? 投影(projection)很高效
? 任何列都能作為索引
缺點 ? 選擇(Selection)時即使只涉及某幾列,所有數據也都會被讀取 ? 選擇完成時,被選擇的列要重新組裝
? INSERT/UPDATE比較麻煩
注:關系型數據庫理論回顧 - 選擇(Selection)和投影(Projection)

2數據壓縮 剛才其實跳過了資料里提到的另一種技術:通過字典表壓縮數據。為了方面后面的講解,這部分也順帶提一下了。 下面中才是那張表本來的樣子。經過字典表進行數據壓縮后,表中的字符串才都變成數字了。正因為每個字符串在字典表里只出現一次了,所以達到了壓縮的目的(有點像規范化和非規范化Normalize和Denomalize)
3查詢執行性能
下面就是最牛的圖了,通過一條查詢的執行過程說明列式存儲(以及數據壓縮)的優點:

關鍵步驟如下: 1.?????去字典表里找到字符串對應數字(只進行一次字符串比較)。 2.?????用數字去列表里匹配,匹配上的位置設為1。 3.?????把不同列的匹配結果進行位運算得到符合所有條件的記錄下標。 4.?????使用這個下標組裝出最終的結果集。


掃描二維碼獲取更多消息:


總結

以上是生活随笔為你收集整理的为什么MaxCompute采用列式存储?列式存储和行式存储的主要区别在哪的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。