• 0推薦
    72K 瀏覽

    利用Mahout實現在Hadoop上運行K-Means算法

    Mahout是Apache下的開源機器學習軟件包,目前實現的機器學習算法主要包含有協同過濾/推薦引擎,聚類和分類三 個部分。Mahout從設計開始就旨在建立可擴展的機器學習軟件包,用于處理大...
    jopen 11年前   
    算法   Hadoop   Mahout  
    0推薦
    20K 瀏覽

    Hadoop2.2.0安裝配置手冊

    Hadoop我們從Apache官方網站直接下載最新版本Hadoop2.2。官方目前是提供了linux32位系統可執行文件,所以如果需要在64位系統上部署則需要單獨下載src 源碼自行編譯(1...
    0推薦
    56K 瀏覽

    Hadoop完全分布式搭建

    Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺。以Hadoop分布式文件系統(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
    0推薦
    29K 瀏覽

    Hadoop上時實類SQL查詢系統對比

    以前只用過Hive與impala兩個類SQL查詢系統,最近又將Hortonworks開源的Stinger與Apache的Drill做了些調研。累死累活搞了一天的資料,頭都大了。為了紀念我那逝去的...
    0推薦
    306K 瀏覽

    hadoop框架詳細分析

    mapreduce是一種模式,一種什么模式呢?一種云計算的核心計算模式,一種分布式運算技術,也是簡化的分布式編程模式,它主要用于解決問題的程序開發模型,也是開發人員拆解問題的方法。
    0推薦
    33K 瀏覽

    Hadoop完全分布式模式的安裝和配置

    Hadoop完全分布式模式的安裝和配置
    0推薦
    199K 瀏覽

    Hadoop家族學習路線圖

    主要介紹Hadoop家族產品,常用的項目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增...
    0推薦
    70K 瀏覽

    Hadoop集群部署及常見問題超細詳解答

    Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺。以Hadoop分布式文件系統(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
    0推薦
    16K 瀏覽

    Hadoop資源管理器:Apache Hadoop NextGen MapReduce (YARN)

    YARN是新一代Hadoop資源管理器,通過YARN,用戶可以運行和管理同一個物理集群機上的多種作業,例如MapReduce批處理和圖形處理作業。這樣不僅可以鞏固一個組織管理的系統數目,而且可以...
    0推薦
    22K 瀏覽

    Hadoop安裝配置(入門)

    本文主要記錄Hadoop-0.20.2安裝過程,包括安裝過程中的關鍵問題的解決。這里將安裝過程分為三步: 第一步,打通筋脈,也就是配置各個節點間的環境,如創建hadoop用戶和用戶組,配置節點...
    0推薦
    35K 瀏覽

    Hadoop 中利用 mapreduce 讀寫 mysql 數據

    有時候我們在項目中會遇到輸入結果集很大,但是輸出結果很小,比如一些 pv、uv 數據,然后為了實時查詢的需求,或者一些 OLAP 的需求,我們需要 mapreduce 與 mysql 進行數據的...
    0推薦
    31K 瀏覽

    Android(HTC G7) 安裝 Hadoop 偽分布

    在HTC G7 上運行 ubuntu for android。并安裝jdk1.7 arm 和 hadoop。 期間遇到了ssh問題,等各種問題,對于需要安裝Ubuntu系統的手機,首先需要獲...
    0推薦
    33K 瀏覽

    使用 Azure、Hadoop 和 Mahout 構建一個推薦系統

    使用 Azure、Hadoop 和 Mahout 構建一個推薦系統
    jopen 11年前   
    Hadoop   Mahout  
    0推薦
    26K 瀏覽

    Hadoop 實現多文件輸出

    Hadoop 實現多文件輸出
    0推薦
    39K 瀏覽

    Hadoop 統計文件中某個單詞出現的次數

    Hadoop 統計文件中某個單詞出現的次數
    0推薦
    84K 瀏覽

    Hadoop HDFS文件操作的Java代碼

    Hadoop HDFS文件操作的Java代碼
    0推薦
    15K 瀏覽

    在Ubuntu上安裝集群模式的Hadoop

    在安裝好單機模式的hadoop之后,我們就可以著手來在集群模式下安裝hadoop了。在安裝了單機版hadoop的機器上將hadoop轉成集群模式是很容易的。首先來設置網絡。
    0推薦
    27K 瀏覽

    Hadoop的架構知識

    Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,實現了Google的MapReduce編程模型和框架,能夠把應用程序分割成許多小的工作單元,并把這些單元放到任何集群節點上執行。在Map...
    0推薦
    49K 瀏覽

    淘寶Hadoop作業平臺:宙斯Zeus

    淘寶Hadoop作業平臺宙斯(zeus)開源啦!一站式作業平臺,分布式設計,集中式管理,云一般的服務。功能與交互的深度契合。一切只為提供絕佳的用戶體驗。宙斯不僅僅是開源技術,更是開源一個融入了我...
    0推薦
    17K 瀏覽

    在 OpenStack 上運行:Hadoop Savanna

    因為有了 Savanna ,兩個最大的開源項目 Hadoop 和 OpenStack 可以在一起工作。這是紅帽、Hortonworks 和 Mirantis 新開發的 OpenStack 組件。...
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色