• 0推薦
    27K 瀏覽

    Hive與HBase集成

    Hive與HBase集成
    jopen 11年前   
    0推薦
    23K 瀏覽

    Hive查詢

    通過Hive提供的order by子句可以讓最終的輸出結果整體有序。但是因為Hive是基于Hadoop之上的,要生成這種整體有序的結果,就必須強迫Hadoop只利用一個Reduce來完成處理。這...
    jopen 11年前   
    0推薦
    43K 瀏覽

    Hive配置運行及表的操作

    Hive的配置文件名為hive-site.xml,你可以在Hive安裝目錄下的conf目錄下找到這個文件。如果你發現該目錄下沒有這個文件,你可以通過復制hive-default.xml.temp...
    jopen 11年前   
    0推薦
    20K 瀏覽

    Hive安裝簡介

    Hive是基于Hadoop的數據倉庫平臺。 Hive提供了類SQL查詢語言。Hive的數據存儲于HDFS中。一般情況下,用戶提交的查詢將被Hive轉換為MapReduce作業并提交給Had...
    jopen 11年前   
    0推薦
    20K 瀏覽

    Hive自定義函數

    當Hive提供的內置函數無法滿足你的業務處理需要時,此時就可以考慮使用用戶自定義函數(UDF:user-defined function)。
    jopen 11年前   
    0推薦
    32K 瀏覽

    從 MapReduce 到 Hive —— 一次遷移過程小記

    早先的工作中,有很多比較復雜的分析工作,當時對hive還不熟悉,但是java比較熟悉,所以在進行處理的時候,優先選擇了MR. 但是隨著工作的數據內容越來越多,越來越復雜,對應的調整也越來越多,越來越復雜.
    0推薦
    23K 瀏覽

    hive指南

    hive是基于hadoop構建的數據倉庫基礎架構,通過提供一系列的工具,使得用戶能夠方便的做數據ETL,數據結構化,并針對存放在hadoop上的海量數據進行查詢和分析。
    0推薦
    62K 瀏覽

    Hive函數大全

    Hive函數大全
    jopen 11年前   
    0推薦
    48K 瀏覽

    基于hive的日志數據統計實戰

    hive 是一個基于 hadoop 的開源數據倉庫工具,用于存儲和處理海量結構化數據。 它把海量數據存儲于 hadoop 文件系統,而不是數據庫,但提供了一套類數據庫的數據存儲和處理...
    0推薦
    24K 瀏覽

    Hive代碼組織及架構簡單介紹

    Serialzers/Deserialzers(trunk/serde) 此組件允許用戶自己開發自定義序列化、反序列化文件解析器,hive自身也內置了一些序列化解析類。 MetaSto...
    jopen 11年前   
    0推薦
    26K 瀏覽

    hive優化要點總結

    個人認為總體兩種思想: 1、讓服務器盡可能的多做事情,榨干服務器資源,以最高系統吞吐量為目標 再好的硬件沒有充分利用起來,都是白扯淡。
    jopen 11年前   
    0推薦
    107K 瀏覽

    Hive 查詢優化總結

    Join查找操作的基本原則:應該將條目少的表/子查詢放在 Join 操作符的左邊。原因是在 Join 操作的 Reduce 階段,位于 Join 操作符左邊的表的內容會被加載進內存,將條目少的表...
    0推薦
    35K 瀏覽

    Hive 安裝過程

    Hive 安裝過程
    0推薦
    32K 瀏覽

    數據倉庫Hive管理軟件 phpHiveAdmin

    這是一個由php編寫的hadoop hive查詢工具,可以方便的查詢hive中的數據和相關信息。
    fmms 13年前   
    0推薦
    44K 瀏覽

    hadoop hive sql語法詳解

    hadoop hive sql語法詳解
    1 2

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色