• P37

      淘寶Hive分享 文檔

    其實HIVE就是一個SQL解析引擎,它將SQL語句轉譯成M/R JOB然后在Hadoop執行,來達到快速開發的目的。撥開HIVE的神秘面紗之后來看它的表其實就是一個Hadoop的目錄/文件(HIVE默認表存放路徑一般都是在你工

    copen 2011-08-09   519   0
    P12

      HBase Architecture(譯):上 文檔

    方法 Put.setWriteToWAL(boolean) 所設置的flag。WAL是一個標準的Hadoop SequenceFile,里面存儲了HLogKey實例。這些keys包含一個序列號和實際的數

    lanbocui 2012-08-21   604   0
    P29

      海量數據處理的大殺器 - 騰訊分布式數據倉庫(TDW) 文檔

    distributed Data Warehouse 騰訊海量數據處理平臺的核心部件 基于開源軟件hadoop和hive,大量的優化和改造 7. TDW特性列表(部分)特性說明存儲和計算天然容災集群中個別

    andyxiemu 2012-08-13   1111   0
    P14

      HDFS小文件處理解決方案總結+facebook(HayStack)+淘寶(TFS) 文檔

    對于小文件問題,hadoop自身提供了三種解決方案:Hadoop Archive、 Sequence File 和 CombineFileInputFormat (1)??????Hadoop Archive

    平江夜彈 2012-08-23   5511   0
    P5

      Hive性能調校 文檔

    reducer是1GB,也可以改變這個值。 如何自己評估輸入數據的大小? [edward@etl02 ~]$ hadoop dfs -count /user/media6/fracture/ins/* | tail -4

    xnbw 2016-01-12   1164   0
    P34

      Apache Cassandra 的初步使用及一些簡單的操作 文檔

    配置集群 1 配置集群節點信息 hadoop2 hadoop3 hadoop4 hadoop5 hadoop6 hadoop7 hadoop8 hadoop9 hadoop10 2 配置集群節點之間交互的監聽地址

    akingde 2012-07-07   878   0
    P51

      7種分布式文件系統介紹 文檔

    些限制,比如一個目錄中的最大文件數。你可以放心的使用。 HDFS HDFS簡介 HDFS全稱是Hadoop Distributed FileSystem。目前HDFS支持的使用接口除了Java的還有,

    cellcomcn 2012-09-18   6062   0
    P18

      100+經典java面試題及答案解析 文檔

    北京尚學堂-cctv央視網廣告合作伙伴,專業IT培訓機構,口碑最好的java培訓、iOS培訓、android培訓、hadoop大數據培訓、web前端培訓機構,0元入學,先就業后付款,平均就業薪水9500以上 多態是編程語

    chi 2017-04-01   667   0
    P119

      Hive Data Definition Language 文檔

    OutputFormat class as a string literal, e.g. 'org.apache.hadoop.hive.contrib.fileformat.base64.Base64TextInputFormat'

    xnbw 2016-01-12   1589   0
    P57

      大數據中心建設方案 文檔

    云計算數據中心通過運行在單獨的服務器上的云操作系統對服務器、存儲、網絡等資源進行虛擬化管理,提供可以自定義的虛擬機,在虛擬機上安裝Hadoop、hbase等Nosql分布式數據庫集群,對現有的數據ETL采集、清洗、轉換、匯總進來,使用海

    guet_lee 2017-01-12   1207   0
    P16

      深度學習及TensorFlow簡介 文檔

    orFlow與HDFS集成示例如下: #配置JAVA和HADOOP環境變量 source $HADOOP_HOME/libexec/hadoop-config.sh export LD_LIBRARY

    huafenged 2017-03-09   668   0
    P18

      hbase 簡介 文檔

    HBase prototype created as Hadoop contrib 2007.10 First useable Hbase 2008.1 Hadoop become Apache top-level

    xnbw 2016-01-11   1539   0
    P4

      gartner 2016年數據倉庫和數據管理解決方案魔力象限-publicpptx 文檔

    退出者:惠普 還有幾家公司則從挑戰者象限進入到了遠見者象限,包括Cloudera和MapR,這兩家Hadoop發行版公司列入了去年的數據倉庫魔力象限數據報告。這意味著“執行力”分數下降,不過“前瞻性”排名上升。

    zhonghua98 2016-09-28   2411   0
    方案   報告   SQL  
    P2

      熱點關注:解析云計算的核心技術 文檔

    ,用冗余存儲的方式保證數據的可靠性。云計算系統中廣泛使用的數據存儲系統是Google的GFS和Hadoop團隊開發的GFS的開源實現HDFS。GFS即Google文件系統(Google File Sy

    jq_one 2011-12-06   499   0
    P3

      Hive 小結 文檔

    format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; ?#執行Map前進行小文件合并 在開啟了org.apache.hadoop.hive.ql.io

    cczzhh 2013-12-30   450   0
    P5

      Linux中使用eclipse編譯nutch-0.9 文檔

    Linux中使用eclipse編譯nutch-0.9 (4)至此,nutch-0.9工程沒有錯誤。 (5)修改配置文件 hadoop-site.xml,單機編譯測試不做任何配置。 nutch-default.xml,修改配置參數。

    ggyi2003 2011-07-31   475   0
    搜索引擎   HTTP   Java   nutch  
    P26

      如何讓Docker容器在企業中投產 文檔

    場景2:企業應用商店和一鍵部署應用12應用上架一鍵部署 14. BMC Remedy,安裝包有十幾GB 15. 14Hadoop 集群一鍵部署Hadoop 集群和一鍵部署 16. 場景3: 多環境,多資源池的DevOps流水線15Dev

    zhu1531 2016-08-02   5529   0
    容器  
    P31

      HBase - 介紹 文檔

    Put使用客戶端Cache Scan使用Cache/Batch 24. 運維技巧 25. HBASE 部署Hadoop版本 Hadoop 0.20.x Append補丁 ZooKeeper Metric 內存 RegionServer

    liu2511981 2012-05-17   4773   0
    P31

      HBase 介紹 文檔

    Put使用客戶端Cache Scan使用Cache/Batch 24. 運維技巧 25. HBASE 部署Hadoop版本 Hadoop 0.20.x Append補丁 ZooKeeper Metric 內存 RegionServer

    dfzha 2013-09-27   371   0
    P5

      淘寶實時數據傳輸平臺-TimeTunnel介紹 文檔

    galaxy是一套支持SQL定義業務邏輯的流計算服務化平臺 galaxy之于storm,就類似hive之于hadoop的關系 下圖為Galaxy的一個架構圖: 組件 Time Tunnel大概有幾部分組成,TTm

    daliao8888 2014-11-26   6634   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色