當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

大数据初探——Hadoop历史

發布時間：2023/12/10 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了大数据初探——Hadoop历史小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Hadoop是一個開源的分布式框架，是Apache下的一個開源項目。Hadoop運行可以在成千上萬個普通機器節點組成的集群上，通過分布式的計算模型和存儲模型來處理大數據集。Hadoop具有高容錯性、工作在普通的機器節點上擴展性強等眾多的優點，是企業選擇處理大數據集工具的不二“人”選。

這個框架是另一個大項目的一部分，有數據庫管理專家Mike Cafarella與開源技術的支持者DougCutting所構建。兩人創建了一個名叫Nutch的網絡爬蟲與分析系統，該系統使用集群運算同時執行多項任務。之后Nutch演化成兩個系統，其中之一就是Hadoop分布式管理系統。

一個HDFS集群主要由Namenode和Datanode組成，其中Namenode只有一個，主要用于管理存儲數據的元數據，而Datanode可以有多個，主要用于直接存儲數據。

以上是生活随笔為你收集整理的大数据初探——Hadoop历史的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。