• P7

      Hadoop實戰-初級部分 之 Hadoop IO 文檔

    ??HDFS以透明方式校驗所有寫入它的數據,并在默認設置下,會在讀取數據時驗證校驗和。針對數據的每個io.bytes.per.checksum(默認512字節)字節,都會創建一個單獨的校驗和。 數據節點負責在存儲數據及其校驗和之前驗證它們收到的數據。 從客戶端和其它數據節點復制過來的數據。客戶端寫入數據并且將它發送到一個數據節點管線中,在管線的最后一個數據節點驗證校驗和。

    singing 2014-01-07   2012   0
    P85

      智慧校園解決方案--突破傳統一卡通思路_差異化競爭 文檔

    基于“云”計算數字化校園綜合解決方案智慧虛擬服務開放匯報議題新開普簡介成立于2000年,注冊資本8920萬,34個分支機構新開普簡介CMMILevel3體系認證(行業首家)國家火炬計劃重點高新技術企業雙軟:高新技術企業、軟件企業認定計算機信息系統集成二級認證河南省創新型試點企業新開普專業資質著作權登記證售后服務網絡匯報議題“信息孤島”存在“業務孤島”和“功能冗余”缺乏統一規劃,信息標準不統一缺乏統一認證,給教學和日常管理帶來不便應用系統缺失,信息化建設出現“真空區”無法進行深度數據挖掘,不便給領導決策提供數據支撐問題分析項目建設目標智慧虛擬服務開放用戶管理服務管理訂閱管理計費監控SLA(服務等級協議).

    tjbpf 2014-01-07   2877   0
    P35

      Hadoop及Mapreduce入門 文檔

    Hive:數據倉庫,facebook貢獻PIG:并行計算的一種高級語言,yahoo貢獻Nutch:網頁搜索軟件,不只是爬蟲Avro:數據序列化系統Chukwa:用于管理大規模分布式集群的數據收集系統ZooKeeper:用于分布式應用的高性能協同服務Hbase:類似于BigTable的,key-value數據庫系統Mahout:分布式機器學習和數據挖掘的LibHama:基于BSP的超大規模科學計算框架

    lxz 2014-01-03   2919   0
    P23

      Hadoop 運維雜記 文檔

    Hadoop運維雜記張月@藍汛自我介紹張月性別男,愛好女就職于藍汛Chinacache數據平臺日志Team工作內容:開發,運維基于hadoop數據平臺及其生態系統;公司內部Hadoop技術推廣;不要相信我說的實踐是檢驗真理的唯一標準今日菜單Hadoop在藍汛說說Cloudera和它的產品們運維雜記——幾次重大事故Hadoop在藍汛系統結構

    lxz 2014-01-03   2998   0
    P30

      淘寶Hadoop與數據分析 文檔

    基本概念Hadoop的應用范圍Hadoop底層實現原理Hive與數據分析Hadoop集群管理典型的Hadoop離線分析系統架構常見問題及解決方案關于打撲克的哲學打撲克與MapReduce

    lxz 2014-01-03   3863   0
    P16

      億贊普Hadoop應用淺析 文檔

    億贊普Hadoop應用淺析IZP肖燕京密級:目錄一IZPHadoop集群現狀Hadoop應用Hadoop集群維護及出現的問題密級:一:IZPHadoop集群現狀集群規模共大、小2個集群:數據中心和實驗室集群數據中心:1臺NameNode,1臺SecondNameNode,1臺JobTracker,100來臺DataNode共100多臺高配服務器;數據中心又分為10多個機架,每個機架上10多臺服務器;

    lxz 2014-01-03   625   0
    P27

      淘寶數據應用開發平臺idata 文檔

    大綱每日新增數據20T累積數據14P2000+服務器的云計算平臺每天處理100,000+作業任務,包括100+新增作業任務每天處理1P+數據,包括0.5%新增數據總體數據規模數據分析師ETL開發工程師模型架構師運營程序員數據化運營商業決策產品設計理解業務文檔化業務和需求BI產品設計PD業務分析師/數據PD賣家買家數據產品PD店鋪經營購買決策行業分析分析、挖掘用戶需求數據產品設計數據平臺ETL作業設計,實施,維護,優化數據模型。

    lxz 2014-01-03   2361   0
    P8

      HDFS用戶指南 (HDFS Users Guide) 0.21 中文版 文檔

    此文檔是用戶使用Hadoop集群或普通單機分布式文件存儲系統(HDFS)開展工作的起點,盡管HDFS被設計成適應于許多環境,有用的HDFS知識能大大幫助我們優化配置及診斷具體集群的問題。HDFS是Hadoop應用使用的主要分布式存儲器,HDFS集群主要由管理文件系統元數據的NameNode(名稱節點)和存儲實際數據的DataNode(數據節點)組成。HDFS架構指南詳細途述了HDFS。這個用戶指南主要針對活動和管理的HDFS集群用戶。HDFS架構圖描述了NameNode、DataNode和客戶端基本的相互作用。客戶端通過NameNode取得文件的元數據和修改(狀態或記錄)然后實際執行I/O操作直接使用DataNode。

    lxz 2014-01-03   1957   0
    P51

      EasyHadoop 實戰手冊 文檔

      本文檔是Hadoop部署文檔,提供了Hadoop單機安裝和Hadoop集群安裝的方法和步驟,本文檔希望讓Hadoop安裝部署更簡單(Easy)。      本安裝文檔適用于 centos 5 /red hat 5.2 32位,64位版本,ubuntu 等操作系統 需要做部分修改。Hadoop為分布式文件系統和計算的基礎框架系統,其中包含hadoop程序,hdfs系統等。

    lxz 2014-01-03   1977   0
    P3

      ZooKeeper 能做什么 文檔

    命名服務在zookeeper的文件系統里創建一個目錄,即有唯一的path配置管理程序總是需要配置的,如果程序分散部署在多臺機器上,要逐個改變配置就變得困難。

    xuezd 2013-12-26   6371   0
    P27

      Google_Chubby_lockservice_王公仆 文檔

    Chubby設計概述設計初衷目標:同時為弱關系分布式系統提供粗粒度鎖服務與低容量可靠存儲;接口:提供類似于帶有建議性鎖的分布式文件系統的接口;側重點:設計主要側重于可用性與可靠性而非高性能;應用場景被用在通過高速網絡互連大量小型計算機組成的松耦合分布式系統中;chubby單元受限使用于一個數據中心或機房,但至少有其一個副本被放置于千里之外;提供鎖服務是為了同步客戶端的行為以及客戶端們對所處的環境信息的變化保持一致;

    ng44 2013-12-25   2480   0
    P90

      基于Cloud Foundry的大企業私有云方案 文檔

    基于CloudFoundry的大企業私有云方案目錄引子為什么CloudFoundry要這么設計?PaaS平臺要解決的三個問題?開發方面的兩個問題?我們是怎樣快速構建大企業私有云的?概念界定大企業為什么需要私有云?基于CF的大企業私有云產品化之路產品分析開發任務實施策略目錄引子為什么CloudFoundry要這么設計?PaaS平臺要解決的三個問題?開發方面的兩個問題?我們是怎樣快速構建大企業私有云的?概念界定大企業為什么需要私有云?基于CF的大企業私有云產品化之路產品分析開發任務實施策略CloudFoundry解決了什么問題?

    c6f7 2013-12-24   3421   0
    P6

      Hadoop 集群配置 文檔

    Hadoop集群在linux下配置第一部分Hadoop1.2.1下載Hadoop我們從Apache官方網站直接下載最新版本Hadoop1.2.1。

    yangzhp1_1 2013-12-17   2695   0
    P28

      開源的企業文件云存儲平臺Seafile項目經驗分享 文檔

    Seafile是什么項目理由,為什么要做Seafile工作原理,Seafile是怎么工作的經驗分享,從Seafile項目從學到的經驗Seafile是什么Seafile是一個面向企業、團隊的云盤,解決文件管理和共享的問題。在此基礎上,Seafile提供群組協作的功能,形成一個以文檔為中心的協作平臺。

    longyang 2013-12-15   2222   0
    P17

      openstack 單網卡安裝多節點 文檔

    準備系統操作系統:ubunt12.0 4server321.將你的系統升級到最新下面的這些操作最好都用root用戶來操作,sudo–i2.設置本機的ip將下面的設置復制進去這個ip是可以更改的,如果改變亦需要保持后續的ip都跟著更改然后重啟網絡,讓配置生效:2.安裝bridge重啟網絡3.設置NTP重啟服務

    jedi 2013-12-15   3358   0
    P39

      Hadoop MapReduce 模塊源代碼詳細解析 文檔

    該文檔從源代碼的級別剖析了Hadoop 0.20.2版本的MapReduce模塊的運行原理和流程,對JobTracker、TaskTracker的內部結構和交互流程做了詳細介紹。系統地分析了Map程序和Reduce程序運行的原理。讀者在閱讀之后會對Hadoop MapReduce 0.20.2版本源代碼有一個大致的認識。

    songyl525 2013-12-11   465   0
    P4

      hadoop SequenceFile 文件寫入及各式分析 文檔

    hadoop SequenceFile 是一個由二進制形式key/value的字節流組成的存儲文件,SequenceFile可壓縮可切分,非常適合hadoop文件存儲特性,SequenceFile的寫入由SequenceFile.Writer來實現, 根據壓縮類型SequenceFile.Writer又派生出兩個子類SequenceFile.BlockCompressWriter和SequenceFile.RecordCompressWriter, 壓縮方式由SequenceFile類的內部枚舉類CompressionType來表示。

    songyl525 2013-12-11   2837   0
    P29

      開源云端數據庫架構 文檔

    開源云端數據庫架構網易杭州研究院后臺技術中心郭憶新浪微博:@郭憶_寶目錄網易云數據庫系統架構高可用設計監控運維在線ScaleUp和ScaleOut未來與展望產品方使用MySQL遇到的問題?硬件采購周期長,溝通協調成本高,數據庫部署的需求難以得到快速響應。硬件資源利用率低,難以做到按需使用,彈性擴容。服務可用性差,數據可靠性難以保證。運維自動化程度低,人力成本高。監控報警不夠完善,出現問題缺少系統診斷方法。

    c36x 2013-12-10   712   0
    P

    Hadoop 1.0 權威入門指南_v1.0 文檔

    這篇文檔的目的是幫助你快速完成單機上的Hadoop安裝與使用以便你對Hadoop分布式文件系統(HDFS)和Map-Reduce框架有所體會,比如在HDFS上運行示例程序或簡單作業等。 GNU/Linux是產品開發和運行的平臺。 Hadoop已在有2000個節點的GNU/Linux主機組成的集群系統上得到驗證。 Win32平臺是作為開發平臺支持的。由于分布式操作尚未在Win32平臺上充分測試,所以還不作為一個生產平臺被支持。

    haohaoaiiqian 2013-12-02   2024   0
    P19

      MapReduce超大集群的簡單數據處理 文檔

    MapReduce是一個編程模式,它是與處理/產生海量數據集的實現相關。用戶指定一個map函數,通過這個map函數處理key/value(鍵/值)對,并且產生一系列的中間key/value對,并且使用reduce函數來合并所有的具有相同key值的中間鍵值對中的值部分。現實生活中的很多任務的實現都是基于這個模式的,正如本文稍后會講述的那樣。

    f0xf0x 2013-11-21   2001   0
    1 2 3 4 5 6 7 8 9 10

    關鍵詞

    最新上傳

    熱門文檔

  • sesese色