• 0推薦
    22K 瀏覽

    英語流利說基礎數據平臺

    隨著大數據產品的日益成熟與穩定,如今不少互聯網公司在數據產品所投入的運維工作已經越來越少,另外,加上國內云服務的不斷普及,建立一套自己的大數據基礎平臺的成本也將變的更低。本文將向大家簡要介紹流利...
    0推薦
    23K 瀏覽

    從零自學Hadoop(18):Hive的CLI和JDBC

    文章是哥(mephisto)寫的,SourceLink 上一篇,我們對hive的數據導出,以及集群Hive數據的遷移進行描述。了解到了基本的hive導出操作。這里,我們將對hive的CL...
    0推薦
    76K 瀏覽

    Hive HWI 安裝及配置

    備忘,HWI安裝過程,整理以前的記錄,今又想起來重裝一次,居然又遇到新的問題,由于是筆記,有點雜亂。 Hive Web Interface(HWI)簡介:Hive自帶了一個Web-GUI,功...
    0推薦
    16K 瀏覽

    Hive安裝手冊

    Hive安裝手冊
    jopen 9年前   
    0推薦
    14K 瀏覽

    Hive運行架構及配置部署

    由Facebook開源,最初用于解決海量結構化的日志數據統計問題:ETL工具; 構建于Hadoop的HDFS和MapReduce智商,用于管理和查詢結構化/非結構化數據的數據倉庫;
    0推薦
    16K 瀏覽

    Impala與Hive的比較

    Impala是Cloudera在受到Google的Dremel啟發下開發的實時交互SQL大數據查詢工具,Impala沒有再使用緩慢的 Hive+MapReduce批處理,而是通過使用與商用并行...
    0推薦
    36K 瀏覽

    深入淺出數據倉庫中SQL性能優化之Hive篇

    一個Hive查詢生成多個Map Reduce Job,一個Map Reduce Job又有Map,Reduce,Spill,Shuffle,Sort等多個階段,所以針對Hive查詢的優化可以大致...
    jopen 9年前   
    SQL   Hive  
    0推薦
    18K 瀏覽

    基于Docker的共享計算能力的工具:Hive

    Hive是一個基于Docker的共享計算能力的工具,用戶只需要在自己的機器上啟動Docker進程并提交到Hive平臺即可。
    0推薦
    80K 瀏覽

    Hive在騰訊數據倉庫TDW中的應用

    Hive是Apache基金會下的一個在Hadoop上構建數據倉庫的開源軟件,它支持通過類SQL的HQL語言操作結構化數據。Hive的主要功 能是將類SQL的HQL語言翻譯成MapReduce代碼...
    jopen 10年前   
    0推薦
    24K 瀏覽

    Hive:基于hadoop的數據倉庫工具

    Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供完整的sql查詢功能,可以將sql語句轉換為 MapReduce任務進行運行。其優點是學習成本低,可...
    jopen 10年前   
    0推薦
    24K 瀏覽

    Hive:基于hadoop的數據倉庫工具

    Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件 映射為一張數據庫表,并提供完整的sql查詢功能,可以將sql語句轉換為MapReduce任務進行運行。其優點是學習成本低,可...
    0推薦
    31K 瀏覽

    Hive實戰之日志分析

    本文主要講述使用 hive 的實踐,業務不是關鍵,簡要介紹業務場景,本次的任務是對搜索日志數據進行統計分析。 集團搜索剛上線不久,日志量并不大 。這些日志分布在 5 臺前端機,按小時保存,并以...
    0推薦
    37K 瀏覽

    Hive學習的思維導圖

    Hive學習的思維導圖
    0推薦
    19K 瀏覽

    Hive分區

    1、在Hive Select查詢中一般會掃描整個表內容,會消耗很多時間做沒必要的工作。有時候只需要掃描表中關心的一部分數據,因此建表時引入了partition概念。
    0推薦
    111K 瀏覽

    Hive權限介紹

    目前hive支持簡單的權限管理,默認情況下是不開啟,這樣所有的用戶都具有相同的權限,同時也是超級管理員,也就對hive中的所有表都有查看和改動的權利,這樣是不符合一般數據倉庫的安全原則的。Hiv...
    jopen 10年前   
    0推薦
    28K 瀏覽

    數據倉庫中的 SQL 性能優化(Hive篇)

    一個Hive查詢生成多個map reduce job,一個map reduce job又有map,reduce,spill,shuffle,sort等多個階段,所以針對hive查詢的優化可以大致...
    jopen 10年前   
    0推薦
    64K 瀏覽

    Hive深入淺出

    Hive 是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hi...
    jopen 10年前   
    0推薦
    76K 瀏覽

    基于 Hive 的文件格式:RCFile 簡介及其應用

    Hadoop 作為MR 的開源實現,一直以動態運行解析文件格式并獲得比MPP數據庫快上幾倍的裝載速度為優勢。不過,MPP數據庫社區也一直批評Hadoop由于文件格式并非為特定目的而建,因此序列化...
    0推薦
    176K 瀏覽

    Hive SQL 編譯過程詳解

    Hive是基于Hadoop的一個數據倉庫系統,在各大公司都有廣泛的應用。美團數據倉庫也是基于Hive搭建,每天執行近萬次的Hive ETL計算流程,負責每天數百GB的數據存儲和分析。Hive的穩...
    jopen 10年前   
    0推薦
    59K 瀏覽

    Hive詳細教程

    基于Hadoop的大數據的計算/擴展能力 支持SQL like查詢語言 統一的元數據管理 簡單編程
    jopen 10年前   
    Hive  
    1 2

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色