日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

HDFS--Hadoop分布式文件系统

發布時間:2025/4/5 windows 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 HDFS--Hadoop分布式文件系统 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


HDFS是什么


HDFS設計特性和概念


HDFS,全稱是Hadoop Distributed Filesystem,是一個分布式的文件系統,以流式數據訪問模式來存儲超大文件(一次寫入、多次讀取)。

HDFS具有如下設計特性:

(1)處理超大文件,指的是GB、TB、PB級別的文件。百度、淘寶都有PB級別的HDFS,百度應該有國內最大規模的HDFS,幾十PB。

(2)流式數據訪問,一次寫入,多次讀取,所處理的場景中,讀取整個數據的延遲比讀取第一條記錄的時間延遲重要。

(3)運行在普通商用PC即可,比如3萬級別的普通PC服務器(16-32G ECC內存,8-16核CPU)。

(4)是為高數據吞吐量優化的,以高時間延遲為代價。

(5)推薦處理大量小文件,由于namenode將文件系統的元數據存儲在內存中,故文件總數受制于namenode節點內存。根據經驗,一個文件/目錄/block大約占用150自己,所以億級別文件還可以,10億級別內存就不夠了。

(6)對于寫入,只能有一個寫入操作,也只能把內容添加在文件的末尾。

總結

以上是生活随笔為你收集整理的HDFS--Hadoop分布式文件系统的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。