日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Amazon Redshift 架构

發布時間:2025/4/16 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Amazon Redshift 架构 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Amazon Redshift 的混合架構可提供無與倫比的性能

共享存儲功能支持無限并發擴展,同時 Redshift 的實例存儲功能支持低延遲訪問無法通過其他方式訪問的數據。? 這兩個策略的獨特組合使得 Redshift 目前具備一流的性能,并能在日后不斷改進。

領導節點通過機器學習和結果緩存路由查詢并加快查詢速度 計算擴展至處理高并發和數據湖查詢 存儲擴展至 Amazon S3 數據湖中的數 EB 數據(多種開放格式,包括 Parquet 和 ORC)? ? ? ? ? ?

?

Amazon Redshift 將數據倉庫查詢擴展到您的數據湖,無需加載。您可以針對 Redshift 中本地存儲的 PB 級數據運行分析查詢,以及直接針對 Amazon S3 中存儲的 EB 級數據運行分析查詢。設置和自動執行大多數管理任務以及在任意規模中提供快速性能都非常簡單。

Amazon S3 數據湖:Amazon Redshift 是將您的查詢擴展到 Amazon S3 數據湖而無需加載數據的唯一數據倉庫。您可以直接在 S3 中查詢已使用的開放文件格式,例如 Avro、CSV、Grok、JSON、ORC 和 Parquet 等。

AWS 分析生態系統:Amazon Redshift 與 AWS 分析生態系統進行原生集成。AWS Glue 可以將數據提取、轉換和加載 (ETL) 到 Redshift 中。Amazon Kinesis Data Firehose 是捕獲、轉換流數據并將其加載到 Redshift 以實現近乎實時分析的一種簡單方式。您可以使用 Amazon QuickSight 創建報告、可視化和控制面板。?為了加速向 Amazon Redshift 的遷移,您可以免費使用 AWS Database Migration Service (DMS) 六個月。

Redshift Spectrum 是 Amazon Redshift 的一項功能,借助這項功能,您可以對 Amazon S3 中 EB 級非結構化數據運行查詢,而無需進行加載或 ETL 操作。當您發布查詢時,查詢會進入 Amazon Redshift SQL 終端節點,該終端節點會生成查詢方案并對其進行優化。Amazon Redshift 會確定哪些數據存儲在本地以及哪些數據存儲在 Amazon S3 中,然后生成一種方案來盡可能減少需要讀取的 Amazon S3 數據量,從共享資源池中請求 Redshift Spectrum 工作線程來讀取和處理 Amazon S3 中的數據。

?

Amazon Redshift 使用各種創新技術,與傳統的數據倉庫存儲及分析用數據庫相比,其性能提高將近十倍:

  • 列式數據存儲:Amazon Redshift 以列組織數據,并非以一系列的行來存儲數據。與適用于事務處理的基于行的系統不同,基于列的系統適用于數據倉庫存儲及分析,在此系統中,查詢經常涉及到對大型數據集進行聚合。由于僅對涉及查詢的列進行處理,且列式數據按順序存儲在存儲介質上,故基于列的系統所需的 I/O 要少得多,從而顯著提高了查詢性能。
  • 高級壓縮:與基于行的數據存儲相比,列式數據存儲可進行更大程度的壓縮,因為類似的數據是按順序存儲在硬盤上。Amazon Redshift 擁有多種壓縮技術,與傳統的關系數據存儲相比,通常可進行較大程度的壓縮。此外,與傳統的關系數據庫系統相比,Amazon Redshift 不需要索引或具體化視圖,因此使用的空間較少。將數據加載到空表中時,Amazon Redshift 會自動對您的數據進行采樣并選擇最合適的壓縮方案。
  • 大規模并行處理 (MPP):Amazon Redshift 可以自動將數據與查詢負載分配到所有節點。借助 Amazon Redshift,您可以輕松將節點添加至數據倉庫,而且隨著您的數據倉庫規模的擴大,仍能維持快速的查詢性能。
  • Redshift Spectrum:借助 Redshift Spectrum,您可以對 Amazon S3 中的 EB 級數據運行查詢,且無需進行加載或 ETL 操作。即使沒有在 Amazon Redshift 中存儲任何數據,您仍然可以使用 Redshift Spectrum 查詢 Amazon S3 中的 EB 級數據集。當您發布查詢時,查詢會進入 Amazon Redshift SQL 終端節點,該終端節點會生成查詢方案。Amazon Redshift 會確定哪些數據存儲在本地以及哪些數據存儲在 Amazon S3 中,然后生成一種方案來盡可能減少需要讀取的 Amazon S3 數據量,從共享資源池中請求 Redshift Spectrum 工作線程來讀取和處理 Amazon S3 中的數據,然后將結果返回 Amazon Redshift 群集進行任何剩余處理。

您可以使用 AWS 管理控制臺或 Amazon Redshift API 輕松創建 Amazon Redshift 數據倉庫群集。您可以從單節點 160GB 數據倉庫開始,然后在 AWS 控制臺中單擊幾下或調用一個 API,一路擴展到 1PB 或更大。

單節點配置使您能夠開始經濟快速地使用 Amazon Redshift,而且隨著您的需求的增長,單節點配置可擴展為多節點配置。?一個 Redshift 數據倉庫群集中可以包含 1 到 128 個計算節點,具體取決于節點類型。

  • 多節點配置需要一個領導節點來管理客戶端的連接并接收查詢,以及兩個計算節點來存儲數據并執行查詢和計算。系統將自動為您配置領導節點,并且您無需為其付費。僅需指定您的首選可用區(可選項)、節點數量、節點類型、主機名稱和密碼、安全組、您對備份保留期的首選項及其他系統設置。在您選定理想配置后,Amazon Redshift 將預置所需資源并建立數據倉庫群集。
  • 領導節點接收來自客戶端應用程序的查詢,分析查詢并制定執行計劃,是對查詢進行處理的一套有序步驟。然后領導節點和計算節點協調這些計劃的并行執行,聚合來自這些節點的中間結果,并將這些結果最終返回至客戶端應用程序。
  • 計算節點執行執行計劃所規定的步驟,并在這些計劃之間傳輸數據,從而為這些查詢進行服務。中間結果會先被送回至領導節點進行聚合,然后才會被送回至客戶端應用程序。
    • 密集存儲 (DS) 節點類型提供兩種大小:超大型節點和八倍超大型節點。超大型節點 (XL) 有 3 個硬盤,總共 2TB 的磁盤存儲,而八倍超大型節點 (8XL) 有 24 個硬盤,總共 16TB 的磁盤存儲。DS2.8XLarge 有 36 個 Intel Xeon E5-2676 v3 (Haswell) 虛擬內核和 244GiB RAM,DS2.XL 有 4 個 Intel Xeon E5-2676 v3 (Haswell) 虛擬內核和 31GiB RAM。請參閱定價頁面了解更多詳細信息。您可從每小時 0.85 USD 的單個超大型節點 2TB 數據倉庫開始,然后擴展至 1PB 或更大。您可按小時付費或使用預留實例定價,將價格降低到每年每 TB 不到 1000 USD。
    • 密集計算 (DC) 節點類型也提供兩種大小。大型節點具有 160GB 的 SSD 存儲、2 個 Intel Xeon E5-2670v2 (Ivy Bridge) 虛擬核心和 15GiB 的 RAM。八倍超大型節點是大型節點的 16 倍,具有 2.56TB 的 SSD 存儲、32 個 Intel Xeon E5-2670v2 虛擬核心和 244GiB 的 RAM。您可從每小時 0.25 USD 的單個 DC2.Large 節點開始,然后一路擴展至 128 個 8XL 節點,從而具有 326TB 的 SSD 存儲、3200 個虛擬內核和 24TiB 的 RAM。
    • Amazon Redshift 的 MPP 架構意味著可以通過增加數據倉庫群集中的節點數來提升性能。每個計算節點的最佳數據量取決于您的應用程序特點和查詢性能需求。一個 Amazon Redshift 數據倉庫群集中可以包含 1 到 128 個計算節點,具體取決于節點類型。

    盡管 Redshift Spectrum 非常適用于對 Amazon Redshift 和 S3 中的數據運行查詢,但它真的不適合企業通常需要使用 Amazon EMR 之類的處理框架進行處理的使用案例類型。Amazon EMR 的功能遠不止于運行 SQL 查詢。Amazon EMR 是一種托管服務,可讓您使用最新版本的常用大數據處理框架(如 Spark、Hadoop 和 Presto)在完全自定義的群集上處理和分析極大的數據集。借助 Amazon EMR,您可以為機器學習、圖形分析、數據轉換、流式處理數據以及您可以編寫代碼的幾乎任何應用程序運行各種擴展的數據處理任務。

    您可以將 Redshift Spectrum 與 EMR 配合使用。Redshift Spectrum 存儲表定義的方式與 Amazon EMR 相同。Redshift Spectrum 可以支持 Amazon EMR 使用的相同 Apache Hive 元數據倉來查詢數據和表定義。如果您使用的是 Amazon EMR 并擁有 Hive 元數據倉,則只需配置 Amazon Redshift 群集即可使用 Redshift Spectrum。然后,您可以馬上開始查詢這些數據和 Amazon EMR 任務。因此,如果您已經在使用 EMR 處理大型數據存儲,則可同時使用 Redshift Spectrum 來查詢這些數據,而不會影響 Amazon EMR 任務。

    ?

    Amazon Athena 是讓任何員工都能對 Amazon S3 中的數據運行臨時查詢的最簡單方式。Athena 是無服務器服務,因此您無需設置或管理基礎設施,即可立即開始分析數據。

    如果您擁有需要以一致且高度結構化的格式進行存儲的頻繁訪問數據,那么您應該使用 Amazon Redshift 之類的數據倉庫。這樣一來,您就可以在 Amazon Redshift 中靈活存儲結構化的頻繁訪問數據,并使用 Redshift Spectrum 將 Amazon Redshift 查詢擴展到 Amazon S3 數據湖中的所有數據。此外,您還可以靈活地將數據以您想要的格式存儲在您想要的位置,并在需要時即時可用。

    ?

    如果數據倉庫群集的可用區 (AZ) 發生故障,那么對數據倉庫群集可用性和數據持久性有何影響?

    如果 Amazon Redshift 數據倉庫群集的可用區無法使用,那么在 AZ 的電源及網絡訪問恢復之前,您將無法使用您的群集。數據倉庫群集的數據將被保留下來,一旦 AZ 重新可供使用,那么您就能夠開始使用 Amazon Redshift 數據倉庫。此外,您也可選擇將任何現有快照恢復到同一區域中的新 AZ 中。Amazon Redshift 將首先恢復您最頻繁訪問的數據,這樣您就能盡快地恢復查詢。

    當前 Amazon Redshift 僅支持單一可用區部署。通過將數據從同一組 Amazon S3 輸入文件加載到各個 AZ 中的兩個 Amazon Redshift 數據倉庫群集中,您便可在多個 AZ 中運行數據倉庫群集。借助 Redshift Spectrum,您可以跨可用區運行多個群集,并訪問 Amazon S3 中的數據,而無需將其加載到群集中。此外,您也可將數據倉庫群集從數據倉庫群集快照恢復至其他可用區。

    在加載數據時,Amazon Redshift 會復制數據倉庫群集內的所有數據并將其連續備份至 S3。Amazon Redshift 始終嘗試維持至少三份數據(計算節點上的正本數據、副本數據和 Amazon S3 上的備份數據)。Redshift 還能將您的快照異步復制到另一個區域的 S3 中進行災難恢復。默認情況下,Amazon Redshift 以一天的保留期啟用數據倉庫群集的自動化備份。您可將其配置為 35 天之久。免費備份存儲受限于數據倉庫群集中節點上的總存儲大小,并僅適用于已激活的數據倉庫群集。

    如何管理自動備份及快照保留期?

    您可以使用 AWS 管理控制臺或 ModifyDBInstance API,通過修改 RetentionPeriod 參數來管理自動備份的保留時間段。如果您希望關閉自動備份,則可以通過將保留期設置為 0(不建議)來執行該操作。Elastic Resize 幾分鐘內即可在單個 Redshift 集群中添加或刪除節點,以管理其查詢吞吐量。例如,一天內某幾個小時的 ETL 工作負載或月末報告可能需要額外 Redshift 資源才能按時完成。并發擴展會添加額外集群資源來提高整體查詢并發量。

    Redshift Spectrum 目前支持許多開源數據格式,其中包括 Avro、CSV、Grok、Ion、JSON、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV。

    Redshift Spectrum 目前支持 Gzip 和 Snappy 壓縮。

    轉載于:https://www.cnblogs.com/cloudrivers/p/11255311.html

    總結

    以上是生活随笔為你收集整理的Amazon Redshift 架构的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 中文字幕第4页 | 亚洲av无码精品色午夜 | 欧美黄网在线观看 | 亚洲一区二区在线电影 | 可以在线观看的av网站 | 亚洲av无码国产精品久久久久 | 国产淫片av片久久久久久 | 夜夜噜噜噜 | 一区二区三区丝袜 | 爱爱三级视频 | 7x7x7x人成影视| 国产精品成人一区二区网站软件 | 99日韩精品 | 亚洲中文字幕无码不卡电影 | 免费看麻豆 | 欧美激情免费在线观看 | 超碰人人人人人人人 | 亚洲经典三级 | 日本免费毛片 | 免费国产网站 | 撸啊撸在线视频 | 欧美丝袜视频 | 在线黄网站 | 天天爱天天色 | 九九热在线视频观看 | 国产欧美一区二区视频 | 性盈盈影院中文字幕 | 午夜精品久久久 | 亚洲欧洲中文 | 91精品人妻互换一区二区 | 51久久久 | 波多野结衣视频一区 | 四虎免费观看 | 欧美在线激情视频 | 奇米四色7777 | 久久久亚洲天堂 | 国产一区二区三区免费视频 | 毛片网站入口 | 亚洲激情啪啪 | 福利亚洲 | 四虎国产在线 | 国产91精品欧美 | 亚洲天堂久久 | 嫩草精品 | 日本色一区 | 久操久操| 国产欧美日韩精品在线 | 乱码一区二区三区 | 91看片视频 | 香蕉一级视频 | 国产视频麻豆 | 99久久综合网 | 双腿张开被9个男人调教 | 凹凸精品熟女在线观看 | 少妇太爽了太深了太硬了 | 超碰免费91 | 日韩av综合网站 | 蜜臀久久精品 | 日本一区二区三区在线免费观看 | 视频在线观看电影完整版高清免费 | 亚洲精品小视频 | 综合av第一页 | 亚洲精品综合 | 久久亚洲综合网 | 成人免费看片网站 | 欧美日韩一本 | 影音先锋成人资源网站 | 永久免费成人代码 | 亚洲欧洲成人精品久久一码二码 | 都市激情校园春色亚洲 | 久久这里有精品视频 | 色爱综合区 | 亚洲男女一区二区三区 | 秋霞在线观看视频 | 亚洲黄色在线播放 | 亚洲影视网 | 成人久久久精品国产乱码一区二区 | 色视频一区二区 | 性欧美一区二区 | 快色视频在线观看 | 国产激情一区二区三区四区 | 精品爆乳一区二区三区无码av | 国产精一区| 亚洲免费视频观看 | 凹凸av在线 | 色婷婷97| 国产三区在线播放 | 婷婷丁香激情 | 一区二区精品久久 | 日韩在线你懂的 | 午夜电影天堂 | 中文字幕av亚洲精品一部二部 | 欧美成人乱码一二三四区免费 | 视频在线看 | 国产盗摄精品 | 免费看裸体网站 | 日韩av手机在线播放 | 在线观看日韩视频 | 老司机精品视频网站 |