Hadoop1.0和2.0的主要区别
Hadoop 1.0指的是版本為Apache Hadoop0.20.x、1.x或者CDH3系列的Hadoop,組件主要由HDFS和MapReduce兩個系統組成,HDFS是一個分布式文件存儲系統,MapReduce是一個離線處理框架,分為三部分,運行時環境為JobTracker和TaskTracker,編程模型為Map映射和Reduce規約,數據處理引擎為MapTask和ReduceTask,Hadoop1.0資源管理由兩部分組成:資源表示模型和資源分配模型,其中,資源表示模型用于描述資源的組織方式,Hadoop 1.0采用“槽位”(slot)組織各節點上的資源,而資源分配模型則決定如何將資源分配給各個作業/任務,在Hadoop中,這一部分由一個插拔式的調度器完成。
Hadoop 2.0指的是版本為Apache Hadoop 0.23.x、2.x或者CDH4系列的Hadoop,組件主要由HDFS、MapReduce和YARN三個系統組成,其中,YARN是一個2.0新增的一個通用的資源管理系統(也可以作為spark,storm等的資源調度器),負責集群資源管理和調度,而MapReduce得運行時環境則是運行在YARN上。
Hadoop1.0和2.0的主要區別:
1.新增yarn,1.0時mr的運行環境為JobTracker和TaskTracker,2.0則取消了JobTracker和TaskTracker,使用yarn作為mr的資源調度調度器
2.解決了hadoop1.0中NN的單點故障,可以使用NN的Ha
3.Hadoop 2.x默認的block大小是128MB,Hadoop 1.x默認的block大小是64MB
總結
以上是生活随笔為你收集整理的Hadoop1.0和2.0的主要区别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是情感能力?
- 下一篇: Material Design学习