日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

FreeBSD下安装配置Hadoop集群(性能调优)

發(fā)布時(shí)間:2025/3/20 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 FreeBSD下安装配置Hadoop集群(性能调优) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
hadoop的性能調(diào)優(yōu)是個(gè)比較艱難的事情,由于這個(gè)系統(tǒng)的整個(gè)環(huán)境比較復(fù)雜,對(duì)于接觸時(shí)間不長(zhǎng)的人來說,配置都很難,更別說找出性能優(yōu)化的點(diǎn)了。
性能優(yōu)化涉及的方面很廣,操作系統(tǒng),網(wǎng)絡(luò)配置,配置文件,調(diào)度器等等,抓出幾點(diǎn)來說,但不敢說這幾點(diǎn)就是別人所遇到的性能瓶頸,拋磚引玉而已。應(yīng)用場(chǎng)景不同,優(yōu)化配置肯定是各不相同的。
對(duì)于操作系統(tǒng)和網(wǎng)絡(luò)環(huán)境的調(diào)優(yōu),這個(gè)需要講的東西就太多了,無(wú)法在一篇文章里贅述。集中于幾個(gè)關(guān)鍵詞:sysctl,ulimit,hosts文件,內(nèi)網(wǎng)配置。
盡量把hadoop集群配置在內(nèi)網(wǎng)地址上,這就不用多說了吧。
下面主要探討hadoop的配置文件和調(diào)度器的選擇和開發(fā)。
以我公司的hadoop集群舉例來說,主要是用了數(shù)據(jù)壓縮和索引和對(duì)調(diào)度器策略的優(yōu)化。
使用壓縮是一個(gè)不錯(cuò)的選擇,比如我們自己的集群用的是LZO的壓縮方式,壓縮比大概是原始數(shù)據(jù)的1/3,也就是說,1G的原始日志大概能壓縮成300Mb左右,一方面壓縮比不錯(cuò),另一方面,讀取速度也很不錯(cuò),配合的是Native的lzo庫(kù)。一個(gè)叫hadoop-gpl的東西。前一陣子泰國(guó)水災(zāi),硬盤難買,以壓縮的方式也可以多撐一陣子。
如果給lzo建立索引,效果就更好了
當(dāng)然你需要先安裝hadoopgpl。core-site.xml <property>
????????????????<name>io.compression.codecs</name>
????????????????<value>org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache
.hadoop.io.compress.BZip2Codec</value>
? ? ? ??</property>
????????<property>
????????????????<name>io.compression.codec.lzo.class</name>
????????????????<value>com.hadoop.compression.lzo.LzoCodec</value>
? ? ? ??</property>
mapred-site.xml <property>
????????????????<name>mapred.compress.map.output</name>
????????????????<value>true</value>
? ? ? ??</property>
????????<property>
????????????????<name>mapred.map.output.compression.codec</name>
????????????????<value>com.hadoop.compression.lzo.LzoCodec</value>
? ? ? ??</property>
????????<property>
????????????????<name>mapred.child.java.opts</name>
????????????????<value>-Djava.library.path=/opt/hadoopgpl/native/Linux-amd64-64</value>
? ? ? ??</property>
當(dāng)然每臺(tái)服務(wù)器都需要定義這個(gè)才可以。
還有一個(gè)很重要的優(yōu)化是槽位的設(shè)置和調(diào)度器的選擇,這個(gè)直接關(guān)系到hadoop的計(jì)算能力。相同硬件情況下,配置好的集群的在計(jì)算相同任務(wù)的情況下,要比配置糟糕的集群快幾倍乃至幾十倍。
對(duì)于map/reduce槽位的配置還有job對(duì)java虛擬機(jī)的配置,我目前總結(jié)的規(guī)律大概是這樣,namenode的槽位總數(shù)相加和等于CPU數(shù)量,同時(shí)map槽位數(shù)大概是reduce槽位的3倍,也就是這樣,如果你有一個(gè)8核的服務(wù)器,map數(shù)量就應(yīng)該是6,reduce數(shù)量是2。對(duì)于datanode,我們需要他的計(jì)算能力強(qiáng)一些,就把map和reduce槽位總和設(shè)置成cpu數(shù)量的2倍,同時(shí)map數(shù)是reduce數(shù)量的3倍,同樣是8核的datanode,map數(shù)就是12,reduce數(shù)就是4。對(duì)于內(nèi)存的使用,還是拿配置文件舉例說明吧。
mapred-site on namenode:<property>
????????<name>mapred.tasktracker.map.tasks.maximum</name>
????????<value>6</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.tasktracker.reduce.tasks.maximum</name>
????????<value>2</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.child.java.opts</name>
????????<value>-Xmx1536M</value>
????</property>
mapred-site on datanode:<property>
????????<name>mapred.tasktracker.map.tasks.maximum</name>
????????<value>12</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.tasktracker.reduce.tasks.maximum</name>
????????<value>4</value>
????????<final>true</final>
????</property>
????<property>
????????<name>mapred.map.child.java.opts</name>
????????<value>-Xmx1224M</value>
????</property>
????<property>
????????<name>mapred.reduce.child.java.opts</name>
????????<value>-Xmx2048M</value>
????</property>
對(duì)于map槽位的內(nèi)存占用,我的理解是這樣,內(nèi)存總數(shù)/CPU核數(shù)/4,上下可以浮動(dòng)幾百兆。對(duì)于reduce槽位是內(nèi)存總數(shù)/cpu核數(shù)/2。
然后簡(jiǎn)單說下調(diào)度器的問題,hadoop默認(rèn)的調(diào)度器是FIFO,就是先入先出,通常來說,這就比較夠用了。但是如果集群規(guī)模較小,計(jì)算任務(wù)又比較多,還需要細(xì)分不同任務(wù)的槽位分配,就還是配置其他的調(diào)度器比較好。
常用的有兩種第三方調(diào)度器,yahoo開發(fā)的Capacity Scheduler和Facebook貢獻(xiàn)的Fair Scheduler。翻譯過來叫計(jì)算能力調(diào)度器和公平調(diào)度器,可能大家聽公平調(diào)度器聽的比較多,不過目前我們公司主要是用計(jì)算能力調(diào)度器。
因?yàn)榕渲玫腦ML太長(zhǎng),我就不貼了,需要了解計(jì)算能力調(diào)度器的配置方法,可以訪問我的同事老趙的技術(shù)博客。
http://blog.csdn.net/azhao_dn/article/details/7070327

在我們的應(yīng)用場(chǎng)景里,計(jì)算能力被分為了3類,每個(gè)分類的map/reudce槽位數(shù)是不同的,根據(jù)統(tǒng)計(jì)平時(shí)的計(jì)算量來固定分配的槽位數(shù)。default,rush,和hive,其中普通的streaming的計(jì)算方式放入default的分類中執(zhí)行,日志清洗和入庫(kù)單獨(dú)使用rush分類,hive,顧名思義,就是給hive數(shù)據(jù)庫(kù)單獨(dú)使用的。這個(gè)分配的map/reduce是最多的。平時(shí)定時(shí)任務(wù)的70%左右都是用hive跑的,臨時(shí)數(shù)據(jù)查詢95%依賴hive。
這樣做的好處是計(jì)算任務(wù)的計(jì)算能力被隔離,互不干擾。可根據(jù)業(yè)務(wù)需求進(jìn)行分類。避免任務(wù)搶占造成的資源大量消耗。

轉(zhuǎn)載于:https://blog.51cto.com/slaytanic/823321

總結(jié)

以上是生活随笔為你收集整理的FreeBSD下安装配置Hadoop集群(性能调优)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲国产精品狼友在线观看 | 久久成人免费网站 | 亚洲清色| 日韩社区 | 奇米777视频 | 天堂中文在线免费观看 | 欧洲xxxxx| 老熟妇一区二区三区啪啪 | 少妇又色又紧又黄又刺激免费 | 清纯粉嫩极品夜夜嗨av | av第一福利大全导航 | 国产91高清 | 国产激情在线视频 | 美女黄色影院 | 91艹| 日本成人黄色片 | 美女视频黄a视频全免费观看 | 少妇高潮毛片色欲ava片 | 中文字幕电影一区二区 | jizz韩国| 免费看日批视频 | 国产网友自拍 | 手机在线观看免费av | 肉色超薄丝袜脚交一区二区 | 超级砰砰砰97免费观看最新一期 | 91看片就是不一样 | 少妇人妻偷人精品无码视频新浪 | 日韩一区二区三区视频在线观看 | 久青草免费视频 | 91精品视频在线免费观看 | 日本黄色动态图 | 中文字幕在线观看一区二区三区 | 黄色小视屏| 国产一区二区三区四区三区四 | 成年人国产视频 | 美女福利影院 | 欧美人与牲动xxxx | 亚洲无码高清精品 | 欧美亚洲国产另类 | 成人黄色激情视频 | 国产尤物视频在线观看 | 熟妇人妻av无码一区二区三区 | 温柔女教师在线观看 | 色男天堂 | 草av| 久久av红桃一区二区小说 | 国产日韩成人 | 亚洲欧美自偷自拍 | 美女av一区二区 | 欧美一区二区三区久久久 | 91新网站 | 亚洲综合另类 | 中文字幕3| 69国产在线 | 黄色无毒网站 | 欧洲亚洲女同hd | 久久精品美女视频 | 人妻av一区二区 | 毛片91| 天堂www中文在线资源 | 俺也去网站 | 人妻互换一区二区激情偷拍 | 梦梦电影免费高清在线观看 | 丰满女人又爽又紧又丰满 | 狠狠操av| 亚一区二区 | 妻子的性幻想 | 黄色短视频在线播放 | 91亚洲成人 | 97caoporn| 国产xxx| 亚洲精品a区 | 丁香社区五月天 | 在线免费看黄 | 舐め犯し波多野结衣在线观看 | 伊人天堂av| 黄色片99| 麻豆乱码国产一区二区三区 | av免费的 | 在线观看av的网站 | 国产日韩欧美精品在线 | 草草福利视频 | 久久久久国产精品一区二区 | 国产精品v欧美精品v日韩精品 | 亚洲精品一级二级 | 99re这里只有精品66 | 公交上高潮的丁芷晴 | 国产二区免费 | 调教一区二区 | m3u8成人免费视频 | 男人的天堂免费视频 | 欧美日韩视频在线观看一区 | 欧美αv| 日批av| 国产精品视频区 | 色图自拍 | 日本午夜在线 | 欧美精品日韩在线观看 | 激情视频在线播放 |