• P49

      文檔式數據庫在Hadoop集群中的應用 文檔

    ConnectorNoSQLTransformLoad 可直接從HDFS加載數據 優化并行 支持Pig、Hive與MapReduce 18. 查詢謂詞下壓,利用數據庫索引提升性能查詢關聯索引掃描T.Price

    tony2007 2015-06-19   1856   0

    Hadoop與關系數據庫數據相互遷移工具 Apache Sqoop 1.4.5 發布 資訊

    13 in Sqoop builds [ SQOOP-1324 ] - Support new hive datatypes in Sqoop hcatalog integration [ SQOOP-1325

    jopen 2014-08-13   13701   0
    P2

      big資料 文檔

    運行在計算機集群上面,用于管理Hadoop操作。 5) HiveHive類似于SQL高級語言,用于運行存儲在Hadoop上的查詢語句,Hive讓不熟悉MapReduce開發人員也能編寫數據查詢語句,

    fangunun 2016-12-22   643   0

    Hbase基于Mapreduce的編程 經驗

    分布式數據庫中HBase中,一個例子,求各url的訪問pv數據,由于用到rcfile格式需要導入hive-exce包,還需要加載hbase包,如果這兩個包都已經被集群管理員放到各節點的hadoop/l

    openkk 2012-08-26   34241   0

    不得不了解的Hadoop知識 經驗

    S,支持健全的 SQL子集JDBC和其運作。雖然Phoenix的速度比Hive快,但是我并不認為它們會取代Hive,因為Hive目前仍然非常適合那些你不想遷移至 HBase但又想以其它方式進行分析的平面文件。Pheonix由James

    fn67 2015-03-21   15211   0
    P27

      Hadoop與數據分析 文檔

    周敏日期:2010-05-26 2. OutlineHadoop基本概念 Hadoop的應用范圍 Hadoop底層實現原理 Hive與數據分析 Hadoop集群管理 典型的Hadoop離線分析系統架構 常見問題及解決方案 3. 關于打撲克的哲學

    zhpboy 2013-10-12   4361   0

    大數據領域開源技術 除了Hadoop你還知道哪些 經驗

    的用戶界面和良好的數據回溯工具。堪稱大數據工具箱里的瑞士軍刀。 Apache Hive 2.1——Hive是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具,可以用來進行數據提

    黃色騰堡 2016-09-29   12525   0

    Hadoop工具在其不斷進化中披荊斬棘 資訊

    務。 H adoop的簡單數據管理需求用HDFS就可以做到,但是更復雜的應用需要HBase和Hive。 HBase是一種列數據存儲類型的NoSQL數據庫。它被設計成可以支持十億級別的行和列的超

    jopen 2014-12-17   9930   0
    Hadoop  

    統一數據分析接口,Apache Lens 2.4.0-beta 發布 資訊

    該項目主要特性: 簡單元數據層為數據存儲提供抽象視圖層 單一的共享模式服務器,基于 Hive 元存儲。模式通過數據管道 HCatalog 和分析應用進行共享: OLAP Cube QL

    c8yy 2015-11-24   11048   0

    13款開源Java大數據工具 經驗

    ra的數據模型提供了方便的二級索引(column indexe)。 5. Hive Apache Hive是Hadoop的一個數據倉庫系統,促進了數據的綜述(將結構化的數據文件映射為一張數

    jopen 2014-04-30   52548   0
    開源  

    大數據環境下互聯網行業數據倉庫/數據平臺的架構之漫談 經驗

    離線數據分析與計算,也就是對實時性要求不高的部分,在我看來,Hive還是首當其沖的選擇,豐富的數據類型、內置函數;壓縮比非常高的ORC文件 存儲格式;非常方便的SQL支持,使得Hive在基于結構化數據上的統計分析遠遠比Ma

    jopen 2015-10-17   110870   0
    數據  

    對Hadoop目前使用情況的調查和采訪 資訊

    在開始使用 Hadoop,但是在很多情況下他們的使用僅限于大量數據的存儲和對這些數據執行簡單的 Hive/SQL 查詢。你認為這種趨勢將會繼續么? McJannet : 我認為 Hadoop 在某

    jopen 2013-12-19   14151   0
    Hadoop  
    P14

      Pig 介紹 文檔

    //wiki.apache.org/pig/EmbeddedPig 12. Pig與RDBMS、Hive比較 Pig Latin是一種數據流編程語言,而SQL是一種描述性編程語言。換句話說,Pig程序

    706394187 2015-05-23   2379   0

    Spark SQL 初探: 使用大數據分析2000萬數據 經驗

    k類似“SQL on Spark”,是一個在Spark上數據倉庫的實現,在兼容Hive的情況下,性能最高可以達到Hive的一百倍。 Apache Spark 是在 Scala 語言中實現的,它將 Scala

    jopen 2014-12-11   177140   0
    P158

      apache-spark源碼走讀 文檔

    是,”直接使用sql語句來對數據進行分析“。 這也是為什么Hive興起的原因了。Hive的流行直接證明這種設計迎合了市場的需 求。由于Hive是采用了Hadoop的MapReduce作為分析執行引擎,

    bxingqing 2017-06-12   1332   0
    P25

      機器學習十大算法 文檔

    支持向量機,英文為Support Vector Machine,簡稱SV機(論文中一般簡稱svm)。它是一種監督式的方法,它廣泛的應用于統計分類以及回歸分析中。 支持向量機屬于一般化線性分類器.他們也可以認為是提克洛夫規范化(Tikhonov

    岳麓丹楓 2014-09-29   800   0

    解讀2015之Spark篇:新生態系統的形成 資訊

    存使用情況;計算直接發生在二進制格式上,省去了序列化和反序列化時間。 像傳統的Hadoop/Hive系統,磁盤IO是一個很大的瓶頸。而對于像Spark這樣的計算框架,主要的瓶頸在于CPU和內存。下

    jopen 2016-01-07   38554   0

    分布式分析引擎 Apache Kylin v1.5.3 正式發布 資訊

    )能力以支持超大規模數據,最初由eBay Inc. 開發并貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。 KYLIN是什么? - 可擴展超快OLAP引擎: Kylin是為減少在Hadoop上百億規模數據查詢延遲而設計

    jopen 2016-07-29   12355   0

    分布式數據庫架構--排序、分頁、分組、實現 經驗

    方案 解決方案1:Hadoop + Hive。 思路:使用Hadoop HDFS來存儲數據,通過Hdoop MapReduce完成數據計算,通過Hive HQL語言使用部分與RDBBS一樣的表格查詢特性和分布式存儲計算特性。

    jopen 2014-09-20   40840   0
    P3

      hadoop客戶端部署 文檔

    HADOOP_HOME=/opt/sohuhadoop/hadoop export HIVE_HOME=/opt/sohuhadoop/hive export CLASSPATH=.:$JAVA_HOME/lib/tools

    wkz_214 2011-09-14   8264   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色