• 0推薦
    90K 瀏覽

    Spring Hadoop - 整合Spring框架和Apache Hadoop平臺的開源項目

    這個項目整合了 Spring 框架和 Apache Hadoop 平臺。該項目提供了一種方便的機制,讓我們可以通過 Spring 容器來配置、創建和執行各種各樣的服務和工具,像 MapReduc...
    0推薦
    244K 瀏覽

    HDFS小文件處理解決方案總結+facebook(HayStack) + 淘寶(TFS)

    HDFS小文件處理解決方案總結+facebook(HayStack) + 淘寶(TFS)
    0推薦
    27K 瀏覽

    Spring Hadoop - 為開發 Apache Hadoop 應用程序提供支持

    Spring Hadoop為開發 Apache Hadoop 應用程序提供支持,充分利用不著Spring, Spring Batch 和 Spring Integration 等項目提供的功能。
    0推薦
    45K 瀏覽

    基于Hadoop的數據收集系統 - Chukwa

    什么是 Chukwa,簡單的說它是一個數據收集系統,它可以將各種各樣類型的數據收集成適合 Hadoop 處理的文件保存在 HDFS 中供 Hadoop 進行各種 MapReduce 操作。Chu...
    0推薦
    27K 瀏覽

    Hadoop入門 - Linux下偽分布式計算的安裝與wordcount的實例展示

    本人是在ubuntu下進行實驗的,java和ssh安裝就不在這里講了,這兩個是必須要安裝的,好了我們進入主題安裝hadoop。
    0推薦
    57K 瀏覽

    Hadoop Distributed System (HDFS) 寫入和讀取流程

    HDFS全稱是Hadoop Distributed System。HDFS是為以流的方式存取大文件而設計的。適用于幾百MB,GB以及TB,并寫一次讀多次的場合。而對于低延時數據訪問、大量小文件、...
    0推薦
    67K 瀏覽

    Hadoop - 你不得不了解的大數據工具

    如今Apache Hadoop已成為大數據行業發展背后的驅動力。Hive和Pig等技術也經常被提到,但是他們都有什么功能,為什么會需要奇怪的名字(如Oozie,ZooKeeper、Flume)。
    0推薦
    48K 瀏覽

    Hadoop快速部署工具 EasyHadoop

    EasyHadoop 是一個Hadoop一鍵安裝腳本,方便大家更容易安裝部署Hadoop軟件。
    0推薦
    112K 瀏覽

    為什么Hadoop將一定會是分布式計算的未來?

    Hadoop的創始源頭在于當年Google發布的3篇文章,被稱為Google的分布式計算三駕馬車(Google還有很多很牛的文章,但是在分布式計算方面,應該這三篇的影響力最大了)。
    0推薦
    57K 瀏覽

    Hadoop HDFS分布式文件系統設計要點與架構

    Hadoop簡介:一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。Hadoop實現了一個分布式文件系統...
    0推薦
    44K 瀏覽

    hadoop hive sql語法詳解

    hadoop hive sql語法詳解
    0推薦
    151K 瀏覽

    Hadoop 實戰實例

    Hadoop 是Google MapReduce的一個Java實現。MapReduce是一種簡化的分布式編程模式,讓程序自動分布到一個由普通機器組成的超大集群上并發執行。就如同java程序員可以...
    0推薦
    170K 瀏覽

    Nutch+Hadoop集群搭建

    Apache Nutch是一個用于網絡搜索的開源框架,它提供了我們運行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬蟲。
    fmms 13年前   
    0推薦
    15K 瀏覽

    分布式存儲系統 Katta

    Katta是一個可擴展的、故障容錯的、分布式實施訪問的數據存儲。
    0推薦
    121K 瀏覽

    Hadoop 集群配置(最全面)

    通常,集群里的一臺機器被指定為 NameNode,另一臺不同的機器被指定為JobTracker。這些機器是masters。余下的機器即作為DataNode也作為TaskTracker。
    0推薦
    180K 瀏覽

    Hadoop Hive與Hbase整合

    用hbase做數據庫,但由于hbase沒有類sql查詢方式,所以操作和計算數據非常不方便,于是整合hive,讓hive支撐在hbase數據庫層面 的 hql查詢.hive也即 做數據倉庫
    0推薦
    249K 瀏覽

    工作流引擎服務器 Hadoop Oozie 介紹

    Oozie是一個工作流引擎服務器,用于運行Hadoop Map/Reduce和Pig 任務工作流.同時Oozie還是一個Java Web程序,運行在Java Servlet容器中,如Tomcat.
    jopen 13年前   
    0推薦
    30K 瀏覽

    Ubuntu11.10下安裝Hadoop1.0.0(單機偽分布式)

    Ubuntu11.10下安裝Hadoop1.0.0(單機偽分布式)
    0推薦
    60K 瀏覽

    Hadoop入門之HDFS與MapReduce

    Hadoop的核心就是HDFS與MapReduce
    0推薦
    105K 瀏覽

    開源云計算系統 Spark

    Spark是一個開源的集群計算系統,用于快速數據分析,包括快速運行和快速寫操作。
    1 2 3 4 5 6 7 8 9 10

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色