• 0推薦
    32K 瀏覽

    hadoop分布式集群搭建

    hadoop分布式集群搭建
    0推薦
    67K 瀏覽

    海量數據的二度人脈挖掘算法(Hadoop 實現)

    最近做了一個項目,要求找出二度人脈的一些關系,就好似新浪微博的“你可能感興趣的人” 中,間接關注推薦;簡單描述:即你關注的人中有N個人同時都關注了 XXX 。
    openkk 12年前   
    算法   Hadoop  
    0推薦
    38K 瀏覽

    HDFS NameNode HA框架設計文檔(HDFS-1623:High Availability Framework for HDFS NN)

    有很多方式可以使得NN更加的Available,例如:減少啟動時間,配置熱刷選,減少升級時間,NN的手動或自動的Failover。本文檔通過Failover來解決NN的SPOF問題 有很多種...
    0推薦
    23K 瀏覽

    hadoop執行分布式Process

    要把N個超級大表導入HBase,N是按月來分的,表:億+的行數,100+的字段。測試過sqoop,JDBC,性能都不滿意,對任務失敗重做也很麻煩,HBase的批量導出還靠譜點
    0推薦
    23K 瀏覽

    百度的Hadoop分布式文件系統圖解:4000節點集群

    百度的高性能計算系統(主要是后端數據訓練和計算)目前有4000節點,超過10個的集 群,最大的集群規模在1000個節點以上。每個節點由8核CPU以及16G內存以及12TB硬盤組成,每天的數據生成量在3PB以上。
    0推薦
    17K 瀏覽

    Drill 一個分布式系統用于大型數據集的互動分析

    Drill是一個分布式系統用于大型數據集的互動分析,類似于 Google 的 Dremel。
    0推薦
    19K 瀏覽

    開發基于VMware虛擬平臺的Hadoop應用 Serengeti

    全球虛擬化和云基礎架構領導廠商VMware公司公布了最新開源項目 - Serengeti,支持企業能夠在虛擬和云環境中快速部署、管理和擴展Apache Hadoop。用于在虛擬平臺上快速開發一個...
    0推薦
    25K 瀏覽

    Hadoop和數據庫數據遷移工具 Sqoop

    Sqoop是一個用來將Hadoop和關系型數據庫中的數據相互轉移的工具,可以將一個關系型數據庫(例如 : MySQL ,Oracle ,Postgres等)中的數據導入到Hadoop的HDFS中...
    0推薦
    28K 瀏覽

    Spring Hadoop - 在 Spring 框架下編寫 Hadoop 應用的支持。

    在Spring框架下支持編寫 Hadoop 應用。Spring Hadoop使MapReduce、Streaming、Hive、Pig和級聯工作能夠通過Spring容器執行。Hadoop分布式文...
    0推薦
    27K 瀏覽

    Cascading - 基于Hadoop的數據管理和分析框架

    Cascading是一個應用程序框架,能夠幫助開發人員快速開發基于Apache Hadoop 的 健壯數據分析和數據管理應用程序。
    0推薦
    16K 瀏覽

    Hadoop批處理調度器 Azkaban

    Azkaban是個簡單的批處理調度器,用來構建和運行Hadoop作業或其他脫機過程。
    0推薦
    39K 瀏覽

    HCatalog - 基于Hadoop數據表和存儲管理服務

    Apache HCatalog是基于Apache Hadoop之上的數據表和存儲管理服務。
    0推薦
    20K 瀏覽

    Hadoop標準化安裝工具 Cloudera

    Cloudera 的定位在于 Bringing Big Data to the Enterprise with Hadoop
    0推薦
    30K 瀏覽

    Hadoop的Python封裝 Dumbo

    著名音樂站點Last.fm發布了基于Python的Dumbo(小 飛象)項目,Dumbo能夠幫助Python開發者更方便的編寫Hadoop應用,并且Dumbo為MapReduce應用提供了靈活易...
    0推薦
    17K 瀏覽

    Hadoop的Jython封裝 Happy

    Happy 為Jython開發者使用Hadoop框架提供了便利,Happy框架封裝了Hadoop的復雜調用過程,讓Map-Reduce開發變得更為容易。
    0推薦
    97K 瀏覽

    Hadoop 的分布式架構改進與應用

    談到分布式系統,就不得不提到Google的三駕馬車:GFS[1],MapReduce[2]和BigTable[3]。 雖然Google沒有開源這三個技術的實現源碼,但是基于這三篇開源文檔, Nu...
    0推薦
    36K 瀏覽

    hadoop mapreduce核心功能描述

    應用程序通常會通過提供map和reduce來實現 Mapper和Reducer接口,它們組成作業的核心。
    0推薦
    20K 瀏覽

    MongoDB Hadoop Adapter

    Hadoop的MongoDB適配器。需要MongoDB Java Driver 2.7.3+支持。
    0推薦
    86K 瀏覽

    Hadoop在Windows環境下的部署

    經過一整天的折騰,參考了網上很多資料,我機器上的Hadoop似乎是配置成功了。下面分享一下詳細的配置過程。也祝愿大家在配置的過程中少走彎路。
    0推薦
    99K 瀏覽

    Hadoop 集群常見錯誤

    這里將自己在初識hadoop過程中遇到的一些錯誤做一個簡單總結:
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色