• P31

      畢玄-HBase簡介與實踐分享 文檔

    HBase Features(Cont.)和Hadoop無縫集成 Hadoop分析后的結果可直接寫入HBase; 存放在HBase的數據可直接通過Hadoop來進行分析。 12. HBase能用于Online場景嗎?Why

    hadoopfans 2011-08-16   4086   0
    P27

      APM Python Application Performance 文檔

    Cassandra(FB) Elasticsearch Hadoop 基于Hadoop及Elasticsearch的大數據存儲根據不同的業務需求選擇適合的技術方案 云智慧選擇Hadoop及Elasticsearch作為最終存儲系統

    cd62 2015-01-29   509   0
    P11

      HIVE 入門 文檔

    org/hadoop/HiveHIVE入門劉春安 2. Hive定義,作用 數據類型 創建表 查看表結構命令 修改表 導入數據 編寫HQL 自定義函數目錄 3. Hive 是建立在 Hadoop 上的數

    kunshou 2012-09-13   533   0
    P3

      QJM源碼分析 文檔

    ?QJM源碼分析 Hadoop QJM的實現用到了paxos算法,pasos算法是是萊斯利·蘭伯特于1990年提出的一種基于消息傳遞的一致性算法。?這個算法被認為是類似算法中最有效的。pasos算法用在hadoop

    光榮復興 2014-03-30   1921   0
    P50

      Java計算池技術架構 文檔

    千兆網絡,分層 負載均衡-lvs Terracotta, JVM-level cluster 存儲池-hadoop 數據庫集群-Continuent,squeoia,mysql 自動化維護管理-cfengine+SVN

    huafenged 2011-08-18   518   0
    P6

      HDFS架構設計 文檔

    ?引言 Hadoop分布式文件系統(HDFS)被設計成適合運行在通用硬件(commodity hardware)上的分布式文件系統。它和現有的分布式文件系統有很多共同點。但同時,它和其他的分布式文件系

    yun007x 2010-12-28   6248   0
    P29

      搜索離線生產集群中的流計算 文檔

    阿里云(云計算服務團隊) 淘寶/一淘(網頁抓取團隊) 技術方向:搜索離線系統2 3. 提綱搜索離線系統技術體系 Hadoop-2.0 YARN介紹 Stream Service 計算模型 Stream Service 服務調度

    defeqw 2015-11-30   546   0
    P17

      Avro 簡介中文文檔 文檔

    ?Avro簡介 一、avro產生的背景 Avro(讀音類似于[?vr?])是Hadoop的一個子項目,由Hadoop的創始人Doug Cutting(也是Lucene,Nutch等項目的創始人)牽頭開發,當前最新版本1

    zhangym 2014-11-26   1225   0
    P1

      系統設計面試題思路綜述 文檔

    數據(有可能重復),如何找出這三十臺機器中,根據某關鍵字,重復出現次數最多的前100條?要求用Hadoop來做。 (4) 設計一個系統,要求寫速度盡可能高,說明設計原理。 (5) 設計一個高并發系統,說明架構和關鍵技術要點。

    wujiuliu 2013-06-01   8501   0
    P27

      淘寶數據應用開發平臺idata 文檔

    術服務基礎服務項目實施流程數據工場產品架構 11. Hadoop MRJob/Task級別運行日志MR級別運行日志各個環節延遲系統吞吐Hadoop HDFS文件Meta目錄Meta文件,目錄統計信息權

    lxz 2014-01-03   2361   0
    P44

      the log:每個程序員都應該知道有關實時數據的統一抽象 文檔

    database)、分布式搜索后端(distributed search backend)、?Hadoop以及第一代和第二代鍵值數據存儲(key-value store),而且這套系統一直運行至今。

    june.zk 2016-09-12   479   0
    P19

      Spark streaming 的監控和優化 文檔

    processing. Speed Ease of Use Generality Integrated with Hadoop 3. Spark Ecosystem 4. What is spark streamingSpark

    nn34 2014-12-16   789   0
    P19

      Spark streaming 的監控和優化 文檔

    processing. Speed Ease of Use Generality Integrated with Hadoop 3. Spark Ecosystem 4. What is spark streamingSpark

    jszhaogy 2016-01-28   387   0
    P19

      全文檢索原理 文檔

    舉個例子,用戶輸入語句:lucene AND learned NOT hadoop。 說明用戶想找一個包含lucene和learned然而不包括hadoop的文檔。 第二步:對查詢語句進行詞法分析,語法分析,及語言處理。

    jianhu01 2012-07-01   3204   0
    P4

      hbase優化 文檔

    hbase master 占一臺,其他7臺作為hbase的region server 注意:此處不討論hadoop 情景: ? ?? ?? ? 我們有7億的數據,需要做查詢操作,需要從1.7億的表中查找一個字段,并寫入到7億數據的表中。

    beauty2003 2016-05-10   2312   0
    P18

      淘寶TFS 文檔

    shtml hadoop: Yahoo!在06年雇傭Doug Cotting,希望通過支持Hadoop來提高其計算能力,以對抗Google的GFS。Hadoop實現了一個分布式文件系統(Hadoop Distributed

    gonow86 2013-01-30   680   0
    P48

      大數據(離線/實時)計算架構 文檔

    是為分布式應用程序提供高性能協調服務的工具集合,也是Google的Chubby一個開源的實現,是Hadoop 的分布式協調服務。它包含一個簡單的原語集5,分布式應用程序可以基于它實現配置維護、命名服務、

    sum154346 2017-07-25   1698   0
    P31

      pentaho61教學文件 文檔

    ParallelGzipCsvInput Parallel GZIP CSV file input reader 79 Hadoop File Input Big Data HadoopFileInputPlugin Read

    chiangandy 2017-04-01   981   0
    數據挖掘   教學   手冊   HTTP   Go  
    P8

      HBase Architecture(譯):上(2) 文檔

    的:高效存儲HBase數據。它基于Hadoop的TFile類,模仿了Google的Bigtable架構中使用的SSTable格式。之前HBase采用的是Hadoop MapFile類,實踐證明性能不夠高。圖8展示了具體的文件格式:

    lanbocui 2012-08-21   2112   0
    P60

      開源的SaaS解決方案_0.9 文檔

    Case 2 –hadoop HBase& Hive2003年Google三篇論文:GFS,MapReduce,Bigtable Hbase是一個分布式開源數據庫,基于Hadoop分布式文件系統,模

    xrogzu 2015-11-13   731   0
    方案   Apache   HTTP   Java   Go  
    1 2 3 4 5 6 7 8 9 10
  • sesese色