• 2014年Hadoop大事件盤點 資訊

    下一個數據孤島,因此SQL-on-Hadoop獲得了越來越多的關注。 Apache Hive 0.13發布。Hive是最早的基于Hadoop的SQL引擎。 Apache 基金會宣布Apache Dri

    jopen 2015-01-12   14522   0
    Hadoop  
    P25

      Hadoop進階 文檔

    五,Hadoop結合項目說明 六,性能測試 七,擴展產品 1,云計算產品概況 Hadoop數據倉庫Hive,可以學習學習,Hive提供了SQL編程接口,為Hadoop在數據倉庫應用邁出了一大步。數據倉庫通常將大量數

    7at7 2011-04-27   3440   0

    通過cloudera-manager來安裝hadoop 經驗

    rpm hbase-0.92.1-cdh4.1.2.p0.24.el5.noarch.rpm hive-0.9.0-cdh4.1.2.p0.21.el5.noarch.rpm oozie-3.2

    jopen 2013-12-18   40475   0
    P76

      淘寶數據開發平臺介紹 文檔

    Data IntegrationDB syncTT調度 系統安全 控制系統 審計系統自動化運維系統Hive運行時 監控 系統 實時分析系統可視化引擎數據 監控 和 管理 系統Hadoop Map ReduceHadoop

    hans511002 2012-06-24   4302   0

    開源集群計算環境,Spark 1.1.0 發布 資訊

    學習、即席查詢(ad-hoc query)、圖計算等應用,Spark版本比基于MapReduce、Hive和Pregel的實現快上十倍到百倍。其中內存計算、數據本地性 (locality)和傳輸優化、調

    jopen 2014-09-12   16979   0
    Spark  

    分布式大規模數據庫系統 HadoopDB 簡介 經驗

    領導的開發團隊利用不同的組件,包括開源數據庫、 PostgreSQL 、 Apache Hadoop 數據分類技術和 Hive ( Facebook 公司開發的內部 Hadoop 項目)開發出的新型數據庫。 HadoopDB

    fmms 2012-01-28   45083   0

    Spark生態頂級項目匯總 資訊

    SQL:可以執行 SQL 查詢,包括基本的 SQL 語法和 HiveQL 語法。讀取的數據源包括 Hive 表、Parquent 文件、JSON 數據、關系數據庫(MySQL 等)等。 Spark Streaming:Spark

    jopen 2016-03-07   7128   0
    Spark  

    開源的分布式的 OLAP 分析引擎,Apache Kylin 提供二進制安裝包 資訊

    運行環境要求: Hadoop Hadoop: 2.2.0.2.0.6.0-61 or above Hive: 0.12.0.2.0.6.0-61 or above HBase: 0.96.0.2.0

    jopen 2015-03-06   15918   0

    谷歌再曝Windows 8.1漏洞,微軟真的怒了 資訊

    “當用戶登錄到計算機時,系統會調用用戶配置文件服務來創建特定的目錄并掛載用戶注冊表 Hive 文件(普通賬戶沒有該權限)。在理論上,除了加載 Hive 文件之外,特權賬戶需要做的唯一事情就是創建基礎配置文件目錄。這應該

    jopen 2015-01-15   18279   0

    Apache Drill 1.0發布 資訊

    是眾多SQL on Hadoop中的一個,此外還包括: Hadoop上原生的Hive Hortonworks主導的Hive演進項目Stinger Cloudera主導的Impala MapR主導的Apache

    jopen 2015-05-20   10665   0

    分布式分析引擎,Apache Kylin v1.0 發布 資訊

    增強了清理任務以確保Cube構建成功后在本地操作系統,HDFS/HBase等不遺留垃圾文件等 添加配置項允許講Hive中間表輸出到指定數據庫 增強HBase Corprocessor 以提升查詢性能 Kylin

    jopen 2015-09-06   16414   0

    大數據(一) - hadoop生態系統及版本演化 經驗

    (發表于2004年12月),是Google MapReduce克隆版 Hive:由facebook開源,基于MR的 數據倉庫 ,數據計算使用MR,數據存儲使用HDFS,Hive 定義了一種類 SQL 查詢語言——HQL: 類似SQL,但不完全相同

    jopen 2016-01-20   22814   0
    P18

      admaster海量數據分析架構-admaster_謝超 文檔

    行列混合存儲+Mapreduce EMC Greenplum Teradata Asterdata Hive(RCFile) 9. Google 數據分析技術列表MapReduce GFS Bigtable

    mvpzhou 2013-10-08   3208   0
    Intel   Java   Scala   SQL   Go  

    數據虛擬化系統 Teiid 7.6 Final 發布 資訊

    Reference and Developers Guide for more. Hive Translator - Hive translator has been added as a technology

    fmms 2011-11-29   6791   0
    Java  

    開源分布式計算系統,Spark 1.2 發布 資訊

    parquet.compression.codec: snappy -> gzip spark.sql.hive.convertMetastoreParquet: false -> true spark.sql

    jopen 2014-12-19   23822   1
    Spark  
    P23

      Jbpm5 持久化及流轉流程剖析 文檔

    actorId.全部初始化到表中。 2.2 啟動流程 1)根據路徑解析*.bpmn2或*.bpmn 檔,放入到憶體中。 在該類註冊了相關的物件org.jbpm.bpmn2.xml.BPMNSemanticModule

    huav06 2012-11-27   427   0

    60款頂級大數據開源工具 經驗

    dist/hadoop-hdfs/HdfsUserGuide.html 9. Hive Apache Hive是面向Hadoop生態系統的數據倉庫。它讓用戶可以使用HiveQL查詢和管理大數據,這是一種類似SQL的語言。

    jopen 2015-11-14   179651   0

    Hadoop和大數據:60款頂級大數據開源工具 資訊

    t-dist/hadoop-hdfs/HdfsUserGuide.html 9. Hive Apache Hive是面向Hadoop生態系統的數據倉庫。它讓用戶可以使用HiveQL查詢和管理大數據,這是一種類似SQL的語言。

    jopen 2015-10-23   46305   0
    Hadoop  

    Spark在騰訊數據倉庫TDW的應用 經驗

    以及內存表等優勢,承擔了日志數據的即席 查詢工作。在性能方面,普遍比Hive高2-10倍,如果使用內存表的功能,性能將會比Hive快百倍。 Yahoo 。Yahoo將Spark用在Audience E

    jopen 2014-11-29   53806   0

    Spark介紹 經驗

    用其基于內存的特點,特別擅長迭代式和交互式數據處理;Shark處理大規模數據的 SQL查詢,兼容Hive的HQL。本文要重點介紹的Spark??? Streaming,在整個BDAS中進行大規模流式處理。

    jopen 2014-11-17   109482   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色