日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > linux >内容正文

linux

linux下的单机工具,Linux下单机模式的Hadoop部署

發(fā)布時(shí)間:2024/7/19 linux 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 linux下的单机工具,Linux下单机模式的Hadoop部署 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

需要軟件:

ssh:fedore 9 自帶。

jdk:http://java.sun.com/javase/downloads/index.jsp,下最近版本jdk-6u18-linux-i586

Hadoop:http://apache.etoak.com/hadoop/core/hadoop-0.20.1/,最新版本0.20.1,據(jù)說(shuō)這個(gè)版本jdk必須1.6以上。

三種運(yùn)行模式:

單機(jī)(非分布式)模式,偽分布式運(yùn)行模式(用不同進(jìn)程模仿分布式運(yùn)行中的各類結(jié)點(diǎn)),分布式運(yùn)行模式。

其中前兩種運(yùn)行模式體現(xiàn)不了Hadoop分布式計(jì)算的優(yōu)勢(shì),并沒(méi)有什么實(shí)際意義,但對(duì)程序的測(cè)試及調(diào)試很有幫助。現(xiàn)在只有一臺(tái)機(jī)器, 主要想了解基于Hadoop的分布式并行程序是如何運(yùn)行的。

單機(jī)模式安裝步驟:

1.解壓安裝包至:/usr/local/hadoop

如果安裝jdk已經(jīng)設(shè)置了路徑,安裝完畢。否則:

2.cd /usr/local/hadoop/conf,修改hadoop-env.sh,最后一行添加:export JAVA_HOME=/usr/local/jdk1.6.0_18(jdk路徑).

看看這玩意怎么跑的:

1.

[root@localhost hadoop]# mkdir input

[root@localhost hadoop]# cp conf/*.xml input

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar grep input output 'dfs[a-z.]+'

10/01/26 00:22:54 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:22:54 INFO mapred.FileInputFormat: Total input paths to process : 5

...

[root@localhost hadoop]# cat output/*

1??? dfsadmin

[root@localhost hadoop]# ls output/

part-00000

程序是hadoop自帶的,把conf下的xml文件拷貝到input下作為輸入,找到并顯示所有與最后一個(gè)正則表達(dá)式匹配的行,輸出到output.

jar 是 bin/hadoop 腳本定義的參數(shù),會(huì)調(diào)用 Hadoop 自己的一個(gè)工具類 RunJar,這個(gè)工具類能夠執(zhí)行一個(gè) Jar 文件。

2.

[root@localhost hadoop]# mkdir test-in

[root@localhost hadoop]# echo "hello world bye world" > test-in/file1.txt

[root@localhost hadoop]# echo "hello hadoop googbye hadoop" > test-in/file2.txt

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar wordcount? test-in test-out

10/01/26 00:43:46 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:43:46 INFO input.FileInputFormat: Total input paths to process : 2

...

[root@localhost hadoop]# cat test-out/*

bye??? 1

googbye??? 1

hadoop??? 2

hello??? 2

world??? 2

[root@localhost hadoop]# ls test-out/

part-r-00000

這個(gè)程序也是hadoop自帶的,統(tǒng)計(jì)各個(gè)單詞出現(xiàn)次數(shù)。

剛開(kāi)始上網(wǎng)搜的結(jié)果都是修改fs.default.name,mapred.job.tracker等等,都是分布式運(yùn)行模式的配置,沒(méi)想到單機(jī)模式這么簡(jiǎn)單,浪費(fèi)了不少時(shí)間。

總結(jié)

以上是生活随笔為你收集整理的linux下的单机工具,Linux下单机模式的Hadoop部署的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。