當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

HDFS读写数据的原理

發布時間：2023/12/20 编程问答 22 豆豆

生活随笔收集整理的這篇文章主要介紹了 HDFS读写数据的原理小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄
- 1 概述
- 2 HDFS寫數據流程
- 3 HDFS讀數據流程

2.1 概述
客戶端要向HDFS寫數據，首先要跟namenode通信以確認可以寫文件并獲得接收文件block的datanode，然后，客戶端按順序將文件逐個block傳遞給相應datanode，并由接收到block的datanode負責向其他datanode復制block的副本
2.2 詳細步驟圖

2.3 詳細步驟解析
1、根namenode通信請求上傳文件，namenode檢查目標文件是否已存在，父目錄是否存在
2、namenode返回是否可以上傳
3、client請求第一個 block該傳輸到哪些datanode服務器上
4、namenode返回3個datanode服務器ABC
5、client請求3臺dn中的一臺A上傳數據（本質上是一個RPC調用，建立pipeline），A收到請求會繼續調用B，然后B調用C，將真個pipeline建立完成，逐級返回客戶端
6、client開始往A上傳第一個block（先從磁盤讀取數據放到一個本地內存緩存），以packet為單位，A收到一個packet就會傳給B，B傳給C；A每傳一個packet會放入一個應答隊列等待應答
7、當一個block傳輸完成之后，client再次請求namenode上傳第二個block的服務器。

3 HDFS讀數據流程

3.1 概述
客戶端將要讀取的文件路徑發送給namenode，namenode獲取文件的元信息（主要是block的存放位置信息）返回給客戶端，客戶端根據返回的信息找到相應datanode逐個獲取文件的block并在客戶端本地進行數據追加合并從而獲得整個文件
3.2 詳細步驟圖

3.3 詳細步驟解析
1、跟namenode通信查詢元數據，找到文件塊所在的datanode服務器
2、挑選一臺datanode（就近原則，然后隨機）服務器，請求建立socket流
3、datanode開始發送數據（從磁盤里面讀取數據放入流，以packet為單位來做校驗）
4、客戶端以packet為單位接收，先在本地緩存，然后寫入目標文件

總結

以上是生活随笔為你收集整理的HDFS读写数据的原理的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Matlab2016a安装libsvm
下一篇： iOS 蓝牙开发用到的一些格式转换

编程问答

HDFS读写数据的原理

目錄

1 概述

2 HDFS寫數據流程

3 HDFS讀數據流程

總結