• 大眾點評數據平臺架構變遷 經驗

    4. 開發了一些自定義的UDF 架構: 1. 存儲和計算都基于HIVE 2. GREENPLUM作為HIVE的“cache”存在,供用戶做一些小數據的快查詢,報表存儲。 3. 調度

    jopen 2013-12-23   66221   0

    Hadoop - Zeppelin 使用心得 經驗

    1.概述 在編寫 Flink,Spark,Hive 等相關作業時,要是能快速的將我們所編寫的作業能可視化在我們面前,是件讓人興奮的時,如果能帶上趨勢功能就更好了。今天,給大家介紹這么一款工具。它就

    ti826184 2016-01-21   32642   0

    Hadoop數據傳輸工具sqoop 經驗

    者將數據從HDFS導出到關系數據庫。 sqoop架構: sqoop架構非常簡單,其整合了Hive、Hbase和Oozie, 通過map-reduce任務來傳輸數據,從而提供并發特性和容錯 。

    jopen 2013-12-28   25466   0

    詳解Hadoop核心架構 經驗

    通過對Hadoop分布式計算平臺最核心的分布式文件系統HDFS、MapReduce處理過程,以及數據倉庫工具Hive和分布式數據庫Hbase的介紹,基本涵蓋了Hadoop分布式平臺的所有技術核心。 通過這

    jopen 2015-07-30   19557   0

    英語流利說基礎數據平臺 經驗

    EMR Amazon EMR 在于我們可以很方便并快速的構建一個基于 Hadoop,Spark,Hive等大數據產品的計算集群,如果不是需要長久服役,我們可以在其所有 Job 完成之后,銷毀集群,而并

    hh306311 2016-08-09   22195   0

    Facebook官方詳解:使用Apache Spark進行大型語言模型訓練 經驗

    用 Spark 重新設計一個大型、復雜(100 余級)的管道,而這個管道最初是使用 HQL 在 Hive 上編寫的。在此之中,我們會介紹如何控制數據分布,避免數據偏移,并實現對特定應用程序的優化,以構建高性能及可靠的數據管道。與原來的

    v9z1n9e0vl 2017-02-12   13014   0

    京東開源的分布式SQL查詢引擎:Presto 經驗

    業數據倉庫的交互式分析和處理速度的問題。 它可以做什么? Presto支持在線數據查詢,包括Hive, Cassandra, 關系數據庫以及專有數據存儲。 一條Presto查詢可以將多個數據源的數據進行合并,可以跨越整個組織進行分析。

    wge7 2015-06-25   32952   0
    Presto  

    MySQL推出Applier,可實時復制數據到Hadoop 資訊

    Apache Hive ,它使用 Hadoop 分布式文件系統( HDFS )作為數據存儲區。如果你有一個與 HDFS 相關的 Hive 元存儲,Hadoop Applier 就可以實時填充 Hive 數據表。數據是從

    jopen 2013-04-23   17156   0
    Hadoop  

    Hadoop家族學習路線圖 經驗

    主要介紹Hadoop家族產品,常用的項目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的項目包括,YARN

    jopen 2013-11-10   199151   0

    Hadoop生態系統學習路線 經驗

    主要介紹Hadoop家族產品,常用的項目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的項目包括,YARN

    jopen 2014-10-29   43441   0

    HDFS Federation在美團點評的應用與改進 經驗

    4、1.5,同時使用了Zeppelin作為Spark notebook的開發工具;在查詢引擎方面Hive有0.13和1.2兩個版本,同時重度依賴Presto和Kylin;除此之外,也對dmlc提供了平臺性支持。

    juce7588 2017-04-11   36681   0

    為啥HBase需要搭建SQL引擎層 資訊

    決方案和現實。 1.Hive整合HBase Hive與HBase的整合功能從Hive0.6.0版本已經開始出現,利用兩者對外的API接口互相通信,通信主要依靠hive_hbase-handler

    jopen 2016-02-19   19689   0
    HBase   SQL  

    Cloudera Manager安裝部署 經驗

    -nfs3?hadoop-httpfs?hadoop-kms?hbase-solr?hive-hbase?hive-webhcat?hue-beeswax?hue-hbase?hue-impala?h

    BettieDanne 2016-01-28   21166   0

    面向Hadoop框架的高級語言: Apache Pig 經驗

    HDFS最終存儲數據的部分。 與Hive對比 Language:在Hive中可以執行?“插入/刪除”等操作,但是Pig中我沒有發現有可以“插入”數據的方法。 Schemas:Hive中至少還有一個“表”的概

    jopen 2014-12-04   22140   0

    菜鳥也能玩轉大數據:Airbnb開源Presto數據庫SQL工具 資訊

    在Airpal問世之前,互聯網公司普遍使用Hive分析Hadoop系統中的數據,但是在Airbnb只有不到15個人能夠為Hive編寫復雜的SQL查詢請求,因為Hive基于Hadoop最常見的批處理引擎——MapReduce,而且運行速度很慢。

    jopen 2015-03-10   19193   0
    Airbnb  
    P25

      hadoop生產集群規劃 文檔

    標準的X86服務器 以太網 軟件環境 Hadoop-2.2.0 Jdk-1.7 Zookeeper-3.4.5 hive-0.12.0 mysql-5.6.1 eclipse-jee-kepler-SR2-linux-gtk-x86_64

    sunny-1 2017-02-13   2107   0

    Ambari部署hadoop集群 經驗

    remove?-y??libconfuse.x86_64 yum remove?-y??webhcat- tar -hive.noarch yum remove?-y??ganglia-gmetad.x86_64

    jopen 2014-01-19   49758   0

    Spark運行環境的安裝 經驗

    sc. 15/06/21?21:24:03?INFO?hive.HiveContext:?Initializing?execution?hive,?version?0.13.1 15/06/21?21

    jopen 2015-06-25   207580   0

    Hadoop/Spark生態圈里的新氣象 資訊

    合處理許多任務,但有時候你需要像Impala這樣的大規模并行處理(MPP)解決方案來達到目的,而Hive仍是一種有用的文件到表管理系統。即使你因為專注于Spark的內存中實時分析技術而沒有使用Hado

    jopen 2016-02-16   35271   0
    Hadoop   Spark  
    P147

      在Centos5中安裝Qmail商業郵件系統 文檔

    ?在CentOS5中安裝Qmail商業郵件系統(20070702更新) 系統性能簡介 本文是者在業余時間和研究Qmail系統時所做的, 全部資料均來自Google網上所搜索到公開資源(Open Source)

    frankliu 2012-07-29   4161   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色