• 0推薦
    8K 瀏覽

    Hadoop2.2.0單節點安裝和配置環境圖文詳解

    摘要:最近也是剛剛入門hadoop,配置環境就折騰了很久,在網上也查看了給位大神的帖子,從中也學到 了很多東西,但是很多都是比較雜,在這里我就貼出我配置的一些心得,望各位指教。
    0推薦
    19K 瀏覽

    Hadoop主要子項目介紹(Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra )

    現在Hadoop已經發展成為包含多個子項目的集合。雖然其核心內容是MapReduce和Hadoop分布式文件系統(HDFS),但Hadoop下的Common、Avro、Chukwa、Hive、H...
    0推薦
    24K 瀏覽

    徹底厘清真實世界中的分布式系統

    編者的話:本文從一個實踐者的角度,首先介紹了分布式系統的一些理論結果,例如 FLP 不可能性和 CAP 定理等;然后介紹了構建實際分布式系統最重要的一個原則:端到端;最后討論了實際系統經常用到的協調服務。
    0推薦
    22K 瀏覽

    zookeeper C API指南

    zookeeper C API指南:? 由于所接手的項目里面用到了zookeeper,所以就收集了zookeeper相關的知識: Zookeeper ...
    0推薦
    19K 瀏覽

    hadoop再次集群搭建(5)-CDH Install

    Cloudera Manager 5.3 提供了單用戶模式,從而滿足了對些類環境的要求。在單用戶模式中,Cloudera Manager Agent 和所有由 Cloudera Manager ...
    0推薦
    14K 瀏覽

    hadoop再次集群搭建(4)-Cloudera Manager Installation

    Cloudera Manager在集群已經實現ssh免秘鑰登錄,能夠訪問網絡資源和本地資源的情況下,可以自動安裝和配置CDH(Cloudera distributed hadoop),以及...
    0推薦
    9K 瀏覽

    hadoop再次集群搭建(3)-如何選擇相應的hadoop版本

    1.x版本,比較經典,使用者很多。2.x版本,和1.x并不兼容。2.x完全推翻了1.x的代碼,重新編寫的。內部思想有借鑒。
    0推薦
    17K 瀏覽

    hadoop再次集群搭建(2)-配置免秘鑰ssh登錄

    第一種級別(基于口令的安全驗證)只要你知道自己帳號和口令,就可以登錄到遠程主機。所有傳輸的數據都會被加密,但是不能保證你正在連接的服務器就是你想連接的服務器。可能會有別的服務器在冒充真正的服務器...
    0推薦
    9K 瀏覽

    hadoop再次集群搭建(1)-安裝系統

    從8月份到現在12月份,中間有四個月的時間沒有學習hadoop系統了。其實適應新的環境,到現在一切塵埃落定,就應該靜下心來,好好學習一下hadoop以及我之前很想學習的mahout。個人對算法比...
    0推薦
    11K 瀏覽

    hadoop集群ambari搭建(2)之制作hadoop本地源

    準備好源資源服務器,我使用之前的一臺node4,配置都是1GB內存20GB存儲 集群最好的安裝方式一定是通過本地源的,如果是公共源,那么網絡將會嚴重影響我們的安裝進度。所以制作本地源是每一...
    0推薦
    61K 瀏覽

    hadoop集群ambari搭建(1)之ambari-server安裝

    Apache Ambari是一種基于Web的工具,支持Apache Hadoop集群的供應、管理和監控。Ambari目前已支持大多數Hadoop組件,包括HDFS、MapReduce、Hive、...
    0推薦
    18K 瀏覽

    MapReduce中combine、partition、shuffle的作用是什么

    Mapreduce在hadoop中是一個比較難以的概念。下面需要用心看,然后自己就能總結出來了。
    0推薦
    12K 瀏覽

    MapReduce?圖解流程

    MapReduce 圖解流程
    0推薦
    39K 瀏覽

    MapReduce 圖解流程超詳細解答(1)-【map階段】

    在MapReduce中,一個YARN 應用被稱作一個job, MapReduce 框架提供的應用,master的一個實現被稱作MRAppMaster
    0推薦
    10K 瀏覽

    MapReduce 圖解流程超詳細解答(2)-【map階段】

    MapReduce 圖解流程超詳細解答(2)-【map階段】
    0推薦
    7K 瀏覽

    Hadoop構架概覽

    hadoop是一個開源的軟件框架,是一個利用商業硬件處理和存儲大型數據的軟件。從下到上主要有五個主要的組成部分:
    0推薦
    9K 瀏覽

    Zookeeper簡單概念介紹

    過去,每個應用都是一個CPU,一個主機上的單一系統。然而今天,隨著大數據和云計算時代的到來,任何相互獨立的程序都可以運行在多個計算機上。然而面臨的問題是,協調這些集群的系統比在單一主機上要復雜的...
    0推薦
    7K 瀏覽

    提高hadoop的mapreduce job效率筆記—–修改mapper和reducer數量

    hadoop 的mapreduce 的作業在運行過程中常常碰到一些這樣的情況: ?
    0推薦
    9K 瀏覽

    Spark Streaming使用Kafka保證數據零丟失

    源文件放在github,隨著理解的深入,不斷更新,如有謬誤之處,歡迎指正。 原文鏈接https://github.com/jacksu/utils4s/blob/master/spark-kno...
    0推薦
    20K 瀏覽

    HBase之一【HBase基礎】HBase技術介紹

    HBase是Google Bigtable的開源實現,類似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統;Google運行Ma...
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色