hadoop配置文件

NevMMQ 8年前發布 | 18K 次閱讀 Linux

來自: http://my.oschina.net/673236963/blog/634873


hadoop 1X系列的五大守護進程:

1.NameNode,

它是hadoop中的主服務器,管理文件系統名稱空間和對集群中存儲的萬能鍵

2.DataNode,

負責管理連接到節點存儲(一個 集群中可以有多個節點),每個存儲數據的節點運行一個datanode守護進程.

3.SecondaryNameNode

它不是namenode的哦冗余守護 進程,而是提供周期檢查點和清理任務,出于對可擴展性和容錯性考慮,一般我們把它和namenode放開放在兩臺不同的服務器上

4.JobTracker,5.TaskTracker

負責調度datanode上的工作,每個datanode上有個tasktracker,它們執行實際工作.JobTracker和TaskTracker采用主-從形式.JobTracker跨Datanode分發工作,TaskTracker執行任務.JobTracker還檢查請求的工作,如果一個DataNode由于某種原因失敗,JobTracker會重新調度以前的任務.


一.基礎配置文件

1.core-site.xml    配置hadoop common project相關的屬性配置,也就是以前的hadoop core project項目的相關配置.屬于基礎框架的配置


上一個是namenode守護進程.主機名和端口號.下面一個是hadoop臨時目錄,也是文件系統的目錄.

2.hdfs-site.xml    配置HDFS project文件系統的相關屬性配置

上一個是設置hdfs的副本數,第二個是文件的權限,這里設置不檢查權限

3mapred-ste.xml    配置與mapreduce框架的相關配置.

制定JobTracker的主機和端口號.

二.額外配置文件

4.Masters:主節點,但并不是配置hadoop中的主節點的相關信息,配置hdfs輔助節點輔助節點的信息

指定SecondaryNameNode的位置,一行代表一個主機,可以配置多個.

5.slaves:從節點,配置hdfs和mapreduce框架的從節點信息

指定DataNode和TaskTracker的位置,這里和Masters一樣,也可以配置多臺機器.

小結:從上面我們可以看到hadoop的五大守護進程其實就是上面的1.3.4.5四點去配置的.


 本文由用戶 NevMMQ 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!