• P18

      MapReduce 源碼分析完整版 文檔

    unt是Hadoop自帶的一個例子,目標是統計文本文件中單詞的個數。假設有如下的兩個文本文件來運行WorkCount程序: Hello World Bye World Hello Hadoop GoodBye

    wanghaoms 2013-03-05   3360   0
    P8

      Google Dremel 原理-如何能3秒分析1PB 文檔

    ,Google在處理大數據方面,果真有得天獨厚的優勢。下面的內容,很大部分來自這篇論文。 隨著Hadoop的流行,大規模的數據分析系統已經越來越普及。數據分析師需要一個能將數據“玩轉”的交互式系統。如

    beijixing022 2013-12-12   363   0
    Go  
    P19

      (1)Spark簡介 文檔

    大數據學習網介紹我們的網址是:bigdatastudy.cn 我們提供專業的大數據學習視頻,包括Hadoop,Spark,Storm,Mahout,機器學習等。 我們定價合理,讓每個人都學得起大數據。 3

    ngn6 2015-08-12   775   0
    P18

      (2)Spark 基礎知識 文檔

    大數據學習網介紹我們的網址是:bigdatastudy.cn 我們提供專業的大數據學習視頻,包括Hadoop,Spark,Storm,Mahout,機器學習等。 我們定價合理,讓每個人都學得起大數據。 3

    ngn6 2015-08-12   631   0
    P9

      Namenode 啟動過程分析 文檔

    ?Namenode啟動過程分析 我這里所講的是hadoop-0.20.2-cdh3u1版本已regular方式啟動時的代碼流程分析。 在namenode啟動時會首先去構造Configuration對象

    光榮復興 2014-03-30   2154   0
    P9

      一位架構師談海量計算存儲 文檔

    上宣布,他們每天的數據凈增量達到了1個PB,每個禮拜需要新增1000臺服務器存儲這些數據。 再來看看我們自己公司內部的情況,基于hadoop的云梯一群集已經達到了1400臺服務器的規模,淘寶數據倉庫的數據量已經達到了1PB(實際存儲3

    videostorm 2013-10-26   485   0
    P10

      Apache Mahout:適合所有人的可擴展機器學習框架 文檔

    部分,特別是《Mahout 實戰》 一書。此外,我假設讀者具備 Apache Hadoop 和 Map-Reduce 范式方面的基本知識。(有關 Hadoop 的更多信息,請參閱 參考資料 部分。) Mahout 現狀

    beiwei1121 2014-09-23   492   0
    P7

      大數據存儲和處理技術 文檔

    ?大數據存儲和處理技術 ? Hadoop:分布式存儲和計算平臺 ? HDFS:分布式文件系統 ? MapReduce:分布式計算框架 ? NOSQL:分布式數據庫 ? MPP、內存計算與流計算平臺 ?

    loveqiqi 2015-05-09   693   0
    P64

      大數據智能分析解決方案介紹-ibm 文檔

    8. 大數據主要與大型數據集相關 在大數據的新世界中,我們必須更換所有陳舊系統 大數據就是 Hadoop 較為陳舊的事務數據已經不再重要 數據倉庫已是昨日黃花 大數據適合熟知互聯網的企業。傳統業務與大數據毫無關系

    guet_lee 2017-01-15   10670   0
    P26

      Hive and Hbase入門 文檔

    ??Hive是Hadoop項目中的一個子項目,由FaceBook向Apache基金會貢獻,其中TaoBao也是其中一位使用者+貢獻者,Hive被視為一個倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并可以將sql語句轉換為

    hywhyw1985 2013-05-24   3884   0
    P4

      ganglia的安裝與配置 文檔

    ?Ganglia的安裝與配置 0 ?前記: ? ? ? ?之前由于Hadoop集群的搭建和數據的收集,再一次部署了Ganglia來收集系統層監測數據。 ? ? ? ?雖然之前已經部署過一次,但是此次部

    真不是夢 2017-01-05   1860   0
    P4

      MapReduce 程序編程框架 文檔

    numPartitions); 函數返回 對于的reduce task ID 用戶也可以不提供Partitioner,這是Hadoop會使用默認的。 2.4 Combiner Combiner使得map task與reduce

    gaofei8704 2013-06-19   624   0
    P4

      MapReduce 實例 文檔

    (Java私塾)MapReduce實例 第一部分:?什么是?MapReduce ????????????? Hadoop Map/Reduce是一個使用簡易的軟件框架,基于它寫出來的應用程序能夠運行在由上千個商用機

    singing 2014-01-09   2559   0
    P4

      MapReduce 程序編程框架 文檔

    numPartitions); 函數返回 對于的reduce task ID 用戶也可以不提供Partitioner,這是Hadoop會使用默認的。 2.4 Combiner Combiner使得map task與reduce

    gaofei8704 2013-06-25   290   0
    P35

      pivotal-bigdata-suite-overview 文檔

    管理不同類型企業數據資源的典型技術半/非結構化數據以批量結構化處理為主 主要用于與結構化數據整合的大數據分析場景 Hadoop的分布式計算架構非常適合處理社交媒體、移動互聯等典型的半/非結構化數據,被廣泛應用于大數據領域

    gavin_xzw 2017-04-09   10339   0
    方案   報告   Apache   Intel   Go  
    P11

      hbase 數據表介紹 文檔

    操作工具類代碼 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HColumnDescriptor;

    beauty2003 2016-05-10   2073   0
    P76

      淘寶數據開發平臺介紹 文檔

    審計系統自動化運維系統Hive運行時 監控 系統 實時分析系統可視化引擎數據 監控 和 管理 系統Hadoop Map ReduceHadoop HDFSDatax報表需求(淘數據)數據開發界面Hbase元數據中心

    hans511002 2012-06-24   4302   0
    P4

      一個hive hbase hdoop+eclipse的實例 文檔

    ?hbase,hive,hadoop一個演示的例子。 1. 在終端上創建表;(hive) CREATE EXTERNAL TABLE MYRELATION( key INT, name STRING,telphone1

    xnbw 2016-01-11   472   0
    P10

      MapReduce 數據分析實戰 文檔

    /bin/hadoop fs -copyFromLocal test.log /hdfs/ 三、運行map red /bin/hadoop jar contrib/streaming/hadoop-streaming-0

    gppxm 2012-10-19   449   0
    P39

      騰訊TDW分布式數據倉庫用戶手冊 文檔

    1安裝客戶端 首先獲得客戶端軟件,然后解壓安裝包(以下用$HADOOP_HOME代替hadoop客戶端解壓后的路徑): $ tar -xzvf hadoop-0.20.1-tdw-0.1-lite.tar.gz

    gtimehero 2013-01-04   1102   1
    1 2 3 4 5 6 7 8 9 10
  • sesese色