• Nutch+Hadoop集群搭建 經驗

    Apache Nutch是一個用于網絡搜索的開源框架,它提供了我們運行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬蟲。

    fmms 2012-02-07   169808   0

    hadoop hive sql語法詳解 經驗

    hadoop hive sql語法詳解

    openkk 2012-02-14   44168   0

    Hadoopy: 使用Cython實現Python對Hadoop的封裝 經驗

    Hadoopy是Hadoop Streaming的一個Python封裝,采用Cython開發。它簡單,快速,并且易于被修改。它已經在超過700個節點的集群中測試過了。

    jopen 2013-01-11   24807   0

    hadoop HDFS 的PHP擴展:phdfs 經驗

    phdfs是一個采用C語言的實現的PHP擴展,能夠使用PHP來操作Hadoop HDFS文件系統。

    jopen 2014-08-02   43024   0

    Hadoop 安全機制認證---Kerberos 經驗

    在Hadoop1.0.0或者CDH3 版本之前, hadoop并不存在安全認證一說。默認集群內所有的節點都是可靠的,值得信賴的。用戶與HDFS或者M/R進行交互時并不需要進行驗證。導致存在惡意用 戶偽裝成真正的用戶或者服務器入侵到hadoop集群上,惡意的提交作業,修改JobTracker狀態,篡改HDFS上的數據,偽裝成NameNode 或者TaskTracker接受任務等。 盡管在版本0.16以后, HDFS增加了文件和目錄的權限,但是并沒有強認證的保障,這些權限只能對偶然的數據丟失起保護作用。惡意的用戶可以輕易的偽裝成其他用戶來篡改權限,致 使權限設置形同虛設。不能夠對Hadoop集群起到安全保障。

    jopen 2014-10-29   17181   0

    配置高可用的Hadoop平臺 經驗

    在Hadoop2.x之后的版本,提出了解決單點問題的方案--HA(High Available 高可用)。這篇博客闡述如何搭建高可用的HDFS和YARN

    jopen 2015-02-26   38061   0

    Hadoop RPC使用方法示例 經驗

    Hadoop RPC使用方法示例

    碼頭工人 2014-12-29   18619   0

    搭建hadoop/spark集群環境 經驗

    hadoop和spark集群的搭建,主要用到了hadoop2.5.2、spark1.2.0、scala2.11.4

    jopen 2014-12-25   113517   0

    述說我的Hadoop成長路線 經驗

    還在實驗室時,老師就建議看google關于大數據的三篇論文,啃了好長時間還是沒完全理解。也動手搭建了Hadoop集群,運行了wordcount,帶著“Hadoop會火“的指示離開了實驗室。

    jopen 2015-03-11   29845   0

    Hadoop 壓縮實現分析 經驗

    Hadoop 作為一個較通用的海量數據處理平臺,每次運算都會需要處理大量數據,我們會在 Hadoop 系統中對數據進行壓縮處理來優化磁盤使用率,提高數據在磁盤和網絡中的傳輸速度,從而提高系統處理數據的效率。在使用壓縮方式方面,主要考慮壓縮速度和壓縮文件的可分割性。綜合所述,使用壓縮的優點如下:節省數據占用的磁盤空間;加快數據在磁盤和網絡中的傳輸速度,從而提高系統的處理速度。

    hbnyb 2016-01-21   21499   0

    Hadoop平臺架構 經驗

    HDFS存儲規范,主要介紹存儲規劃和HDFS目錄規劃...

    dongpo 2016-01-27   21195   0

    10個Hadoop的應用場景 問答

    誰在用 Hadoop這是個問題。在大數據背景下,Apache Hadoop已經逐漸成為一種標簽性,業界對于這一開源分布式技術的了解也在不斷加深。但誰才是 Hadoop的最大用戶呢?首先想到的當然是它的“發源地”,像Google這樣的大型互聯網搜索引擎,以及Yahoo專門的廣告分析系統。也許你會認為, Hadoop平臺發揮作用的領域是互聯網行業,用來改善分析性能并提高擴展性。其實 Hadoop的應用

    jopen 2012-07-12   41501   1
    Hadoop   ci   C/C++   Go   HTML  
    P23

      Hadoop 任務調度器-董西成 文檔

    提綱基礎知識Hadoop調度流程Hadoop自帶調度器介紹編寫自己的Hadoop調度器總結基礎知識基礎知識heartbeatTaskTracker周期性(默認為3s)調用RPC向JobTracker匯報信息,形成heartbeat匯報信息包括TaskTracker狀態信息、Task運狀況等Slot資源劃分單位分為mapslot和reduceslot兩種由參數。

    gppxm 2012-10-19   6598   0
    P21

      云計算架構 Hadoop 文檔

    2009年7月 ,Hadoop Core項目更名為Hadoop Common;<br> 2009年7月 ,MapReduce 和 Hadoop Distributed File System (HDFS) 成為Hadoop項目的獨立子項目。<br> 2009年7月 ,Avro 和 Chukwa 成為Hadoop新的子項目。<br> 2010年5月 ,Avro脫離Hadoop項目,成為Apache頂級項目。<br> 2010年5月 ,HBase脫離Hadoop項目,成為Apache頂級項目。<br> 2010年5月,IBM提供了基于Hadoop 的大數據分析軟件——InfoSphere BigInsights,包括基礎版和企業版。<br> 2010年9月,Hive( Facebook) 脫離Hadoop,成為Apache頂級項目。<br> 2010年9月,Pig脫離Hadoop,成為Apache頂級項目。

    altila 2012-06-12   745   0
    P230

      Hadoop之HBase從入門到精通 文檔

    HBASE從入門到精通HBase技術介紹HBase簡介HBase– Hadoop Database,是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統,利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。HBase是GoogleBigtable的開源實現,類似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統;Google運行MapReduce來處理Bigtable中的海量數據,HBase同樣利用Hadoop MapReduce來處理HBase中的海量數據;Google Bigtable利用Chubby作為協同服務,HBase利用Zookeeper作為對應。

    ijamesbond 2015-03-17   6869   0

    Hadoop HDFS文件操作的Java代碼 經驗

    Hadoop HDFS文件操作的Java代碼

    jopen 2013-07-11   84118   0

    Hadoop批處理調度器 Azkaban 經驗

    Azkaban是個簡單的批處理調度器,用來構建和運行Hadoop作業或其他脫機過程。

    openkk 2012-06-09   16216   0

    Hadoop五分鐘入門指南 經驗

    如果你有大量的數據(TB級),而且這些數據到處分散,且有些數據是結構化的,有些數據不是。你想查詢這些數據,你或許在想,“我需要力量來組織和查詢這些數據”。是的,你需要Hadoop。

    jopen 2013-12-12   21448   0

    Hadoop集群監控工具:HTools 經驗

    HTools是一款專業的Hadoop管 理工具,不管您是非專業IT人士,還是多年經驗的技術人員,本工具都會為您提供優質的管理服務和輕松的操作過程, 釋放無謂的工作壓力,提高Hadoop的管理水平。我們以最權威的專家為您量身定做的Hadoop管理工具,本系統提供優秀的用戶體驗,讓您能夠輕松的管 理Hadoop集群環境。

    jopen 2013-12-25   39788   0

    Hadoop中MapReduce框架入門 經驗

    MapReduce是一種分布式計算模型,由Google提出,主要用于搜索領域,解決海量數據的計算問題.對于業 界的大數據存儲及分布式處理系統來說Hadoop2提出的新MapReudce就是YARN: A framework for job scheduling and cluster resource management.

    jopen 2014-11-17   47213   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色