Hadoop入門 - Linux下偽分布式計算的安裝與wordcount的實例展示

fmms 13年前發布 | 27K 次閱讀 Hadoop 分布式/云計算/大數據

本人是在ubuntu下進行實驗的，java和ssh安裝就不在這里講了，這兩個是必須要安裝的，好了我們進入主題安裝hadoop：

1.下載hadoop-0.20.1.tar.gz：
http://www.apache.org/dyn/closer.cgi/hadoop/common/

解壓：$ tar –zvxf hadoop-0.20.1.tar.gz
把Hadoop 的安裝路徑添加到環/etc/profile 中:
export HADOOP_HOME=/home/hexianghui/hadoop-0.20.1

export PATH=$HADOOP_HOME/bin:$PATH

2.配置hadoop
hadoop 的主要配置都在hadoop-0.20.1/conf 下。
(1)在conf/hadoop-env.sh 中配置Java 環境(namenode 與datanode 的配置相同)：
$ gedit hadoop-env.sh
$ export JAVA_HOME=/home/hexianghui/jdk1.6.0_14

3.3)配置conf/core-site.xml, conf/hdfs-site.xml 及conf/mapred-site.xml(簡單配
置，datanode 的配置相同)
core-site.xml:
<configuration>

<property>
<name>hadoop.tmp.dir</name>
<value>/home/yangchao/tmp</value>
<description>A base for other temporary directories.</description>
</property>

<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hdfs-site.xml:( replication 默認為3，如果不修改，datanode 少于三臺就會報錯)
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

4.運行hadoop

首先進入hadoop所在目錄，執行格式化文件系統 bin/hadoop namenode –format

啟動hadoop: bin/start-all.sh

用jps命令查看進程，顯示：

本文由用戶 fmms 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1330005291202.html

Hadoop 分布式/云計算/大數據

Hadoop入門 - Linux下偽分布式計算的安裝與wordcount的實例展示

相關經驗

相關資訊

相關文檔

目錄