當(dāng)前位置：首頁(yè) > 运维知识 > linux >内容正文

linux

linux下的单机工具,Linux下单机模式的Hadoop部署

發(fā)布時(shí)間：2024/7/19 linux 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 linux下的单机工具,Linux下单机模式的Hadoop部署小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

需要軟件：

ssh：fedore 9 自帶。

jdk：http://java.sun.com/javase/downloads/index.jsp，下最近版本jdk-6u18-linux-i586

Hadoop：http://apache.etoak.com/hadoop/core/hadoop-0.20.1/，最新版本0.20.1，據(jù)說(shuō)這個(gè)版本jdk必須1.6以上。

三種運(yùn)行模式:

單機(jī)(非分布式)模式，偽分布式運(yùn)行模式(用不同進(jìn)程模仿分布式運(yùn)行中的各類結(jié)點(diǎn))，分布式運(yùn)行模式。

其中前兩種運(yùn)行模式體現(xiàn)不了Hadoop分布式計(jì)算的優(yōu)勢(shì)，并沒(méi)有什么實(shí)際意義，但對(duì)程序的測(cè)試及調(diào)試很有幫助。現(xiàn)在只有一臺(tái)機(jī)器，主要想了解基于Hadoop的分布式并行程序是如何運(yùn)行的。

單機(jī)模式安裝步驟：

1.解壓安裝包至：/usr/local/hadoop

如果安裝jdk已經(jīng)設(shè)置了路徑，安裝完畢。否則：

2.cd /usr/local/hadoop/conf,修改hadoop-env.sh，最后一行添加：export JAVA_HOME=/usr/local/jdk1.6.0_18(jdk路徑).

看看這玩意怎么跑的：

[root@localhost hadoop]# mkdir input

[root@localhost hadoop]# cp conf/*.xml input

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar grep input output 'dfs[a-z.]+'

10/01/26 00:22:54 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:22:54 INFO mapred.FileInputFormat: Total input paths to process : 5

...

[root@localhost hadoop]# cat output/*

1??? dfsadmin

[root@localhost hadoop]# ls output/

part-00000

程序是hadoop自帶的,把conf下的xml文件拷貝到input下作為輸入，找到并顯示所有與最后一個(gè)正則表達(dá)式匹配的行，輸出到output.

jar 是 bin/hadoop 腳本定義的參數(shù)，會(huì)調(diào)用 Hadoop 自己的一個(gè)工具類 RunJar，這個(gè)工具類能夠執(zhí)行一個(gè) Jar 文件。

[root@localhost hadoop]# mkdir test-in

[root@localhost hadoop]# echo "hello world bye world" > test-in/file1.txt

[root@localhost hadoop]# echo "hello hadoop googbye hadoop" > test-in/file2.txt

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar wordcount? test-in test-out

10/01/26 00:43:46 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:43:46 INFO input.FileInputFormat: Total input paths to process : 2

...

[root@localhost hadoop]# cat test-out/*

bye??? 1

googbye??? 1

hadoop??? 2

hello??? 2

world??? 2

[root@localhost hadoop]# ls test-out/

part-r-00000

這個(gè)程序也是hadoop自帶的，統(tǒng)計(jì)各個(gè)單詞出現(xiàn)次數(shù)。

剛開(kāi)始上網(wǎng)搜的結(jié)果都是修改fs.default.name，mapred.job.tracker等等，都是分布式運(yùn)行模式的配置，沒(méi)想到單機(jī)模式這么簡(jiǎn)單，浪費(fèi)了不少時(shí)間。

總結(jié)

以上是生活随笔為你收集整理的linux下的单机工具,Linux下单机模式的Hadoop部署的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：华为云占用443端口_关于XAMPP默认
下一篇： linux 其他常用命令