• 微軟的開源 Hadoop 的 .NET SDK 開發包 經驗

    和一些集成管理 Powershell 腳本)。同時也提供庫給MapReduce 和 LINQ to Hive。后者更有趣,因為是建立在現有的技術上,.NET 開發者可以訪問大部分的數據源,提供 Hadoop

    jopen 2014-04-08   63765   0

    Hue - 開源的 Apache Hadoop UI 經驗

    特性:一個HDFS的文件瀏覽器,一個MapReduce/YARN的Job瀏覽器,一個 HBas的瀏覽器,Hive,Pig,Cloudera Impala 和 Sqoop2 的查詢編輯器。 它還附帶了一個O

    jopen 2014-03-04   157515   0

    AirPal - AirBnb開源的查詢Presto的WebUI 經驗

    QL查詢。 項目特性 可選的用戶訪問控制 SQL語法高亮 查詢結果導出到CSV文件,或者存到Hive表中 可查看SQL查詢的歷史記錄 可保存查詢 根據表名搜索對應的表 可查看表結構,并預覽前1000行數據

    jopen 2015-06-26   26797   0
    Airpal  

    Hadoop 的數據處理解決方案:Cascalog 經驗

    主要的作用是處理 Hadoop 上的“大數據”或者分析你的本地電腦, Cascalog 是替代 Pig 和 Hive 的工具,而且比這些工具都有更高的抽象級別。 跟著 Cascalog 開始步驟做,五分鐘就可以玩轉

    jopen 2014-10-29   14108   0

    Apache Spark 1.5.0正式發布 資訊

    APIs:RDD, DataFrame 和 SQL 后端執行:DataFrame 和 SQL 集成:數據源,Hive, Hadoop, Mesos 和集群管理 R 語言 機器學習和高級分析 Spark Streaming

    jopen 2015-09-09   22147   0

    大數據相關技術、Hadoop生態、LinkedIn內部實戰 經驗

    on,在外圍有NoSQL: Cassandra, HBase, 有Facebook開發的數據倉庫Hive,有Yahoo主力研發的Pig工作流語言,有機器學習算法庫Mahout,工作流管理軟件Oozie,在很多

    jopen 2015-01-26   192894   0

    講給硅谷創業者的大數據精華集合 經驗

    HDFS,MapReduce,Common,在外圍有NoSQL:?Cassandra,?HBase,?有Facebook開發的數據倉庫Hive, 有Yahoo主力研發的Pig工作流語言,有機器學習算法庫Mahout,工作流管理軟件Oozi

    jopen 2015-01-25   84829   0

    Spark 1.4:SparkR發布,鎢絲計劃鋒芒初露 資訊

    Data Sources API:通過Spark SQL的數據源API,API SparkR可以從包括Hive tables、JSON files、Parquet files等各種來源中讀取數據。 Data

    jopen 2015-06-26   20979   0
    Spark  

    Hadoop數據傳輸工具:Sqoop 經驗

    Sqoop 的幫助下,輕松地把關系型數據庫的數據導入到 Hadoop 與其相關的系統 (如HBase和Hive)中;同時也可以把數據從 Hadoop 系統里抽取并導出到關系型數據庫里。除了這些主要的功能外,Sqoop

    jopen 2014-12-02   18913   0
    P31

      基于Hadoop生態技術構建阿里搜索離線系統 文檔

    (SQL)OpenTSDB (metrics)MapReduce (Batch)iStream (Streaming)Hive (SQL)Ganglia & MonitorOtherHQueue (Queue)Application

    byc2 2014-11-19   1874   0

    Kiji - 基于Apache HBase構建實時的可擴展的數據應用 經驗

    的公共 API 上,借用 HBase 既有的能力實現所需的功能,這一點和 Hive On Hbase 有些類似。與 Hive 不同的是, kiji 表的 Metadata 信息也是以 HBase 表的形式存在的。所以

    jopen 2012-11-19   24363   0
    HBase  

    Azure HDInsight與Hadoop周邊系統集成 資訊

    。在計算的方面,目前HDInsight提供了3種不同的Cluster類型,標準的 Hadoop(HIVE),HBaseCluster,StormCluster,未來Azure還會根據用戶的需求引入其他Hadoop的集群。每種不

    jopen 2015-02-14   12214   0
    Hadoop  
    P38

      spark 文檔

    2.根據lac、ci關聯小區表,得出結果為 手機號碼、lac、ci、省、市、小區、總流量 ? hive執行 總時間 = 42.618 seconds? + 743.56 seconds? =?786

    516304276 2016-11-23   980   0
    SQL   Basic  
    P31

      Hadoop的體系結構 文檔

    周期性把日志數據導入到hdfs中 周期性把明細日志導入hbase存儲 周期性使用hive進行數據的多維分析 周期性把hive分析結果導入到mysql中 28. 案例三:Hadoop在淘寶的應用搜索計算平臺架構

    x7430657 2016-07-18   502   0

    Hadoop即將過時了嗎? 資訊

    MapReduce 技術。雖然 Apache 項目和 Hadoop 商業發行版本試圖通過 HBase 、 Hive 和 下一代 MapReduce (亦 即 YARN)彌補 Hadoop 的短板。但筆者認為只有用全新的,非

    jopen 2012-07-11   31665   4
    Hadoop  

    Netflix的開源文化與技術 資訊

    擁有一套完善的大數據技術生態系統用于用戶數據的分析和挖掘。Netflix不僅使用 Hadoop、Hive、Pig、Parquet、Presto以及Spark等被廣泛采用的開源技術,同時還開發并貢獻了一些其他的工具和服務。

    jopen 2015-11-24   31689   0
    Netflix  

    7種常見的hadoop和spark項目 資訊

    的公司”的第一步;有時,或許你僅僅需要一份漂亮的報告。“企業級數據中心”通常由HDFS文件系統和HIVE或IMPALA中的表組成。未來,HBase和Phoenix在大數據整合方面將大展拳腳,打開一個新的局面,創建出全新的數據美麗新世界。

    jopen 2016-02-04   10075   0
    Hadoop   Spark  

    一篇文章讀懂大數據的黃色小象幫手––Hadoop 經驗

    式,名稱不會與主要功能實際相關,而是採用與大象或其他動物有關的名稱作為其開發代號,像是 Pig、Hive、ZooKeeper 等等。 什么是 Hadoop? 首先,想像有個檔案大小超過 PC 能夠

    jopen 2015-03-13   25945   0
    P5

      10分鐘內理解云計算分布式大數據處理框架Hadoop 文檔

    海量數據的存儲和分析,其它的項目,例如Hive、HBase等都是基于HDFS和MapReduce,是為了解決特定類型的大數據處理問題而提出的子項目,使用Hive、HBase等子項目可以在更高的抽象的基

    xcxc 2015-08-23   651   0
    P35

      The Spark Project Today 文檔

    non-example source linesShark* Streaming* also calls into Hive 29. 60000 40000 20000 0Code Size 140000 120000 100000

    aacall 2014-06-25   2747   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色