• 2分鐘讀懂大數據框架Hadoop和Spark的異同

    談到大數據,相信大家對 Hadoop 和 Apache Spark 這兩個名字并不陌生。但我們往往對它們的理解只是提留在字面上,并沒有對它們進行深入的思考,下面不妨跟我一塊看下它們究竟有什么異同。
    jopen 8年前    18423   

    一個Hadoop老兵的自白

    Apache Hadoop 是一個免費軟件,但實際上,除非是擁有龐大工程師團隊的大公司,否則最好不要去創建僅供內部使用的Hadoop版本,因為如果要購買技術支持,那 Hadoop 就不是免費的了...
    jopen 9年前    6478   

    Hadoop VS Spark

    Hadoop就是解決了大數據(大到一臺計算機無法進行存儲,一臺計算機無法在要求的時間內進行處理)的可靠存儲和處理。 HDFS,在由普通PC組成的集群上提供高可靠的文件存儲,通過將塊保存多...
    jopen 9年前    34595   

    雅虎如何在Hadoop集群上實現大規模分布式深度學習

    過去十年中,雅虎在 Apache Hadoop 集群構建和擴展方面投入了很大的精力。目前,雅虎有 19 個 Hadoop 集群,其中包含 4 萬多臺服務器和超過 600PB 的存儲。他們在這些集...
    vgtr 9年前    15225   

    Hadoop和大數據:60款頂級大數據開源工具

    說到處理大數據的工具,普通的開源解決方案(尤其是Apache Hadoop)堪稱中流砥柱。弗雷斯特調研公司的分析師Mike Gualtieri最近預測,在接下來幾年,“100%的大公司”會采用H...
    jopen 9年前    46305   

    谷歌推出Dataproc,讓Spark、Hadoop更便宜更快更簡單

    近日,谷歌 發布 了Google Cloud Dataproc服務Beta測試版。Cloud Dataproc是一個托管的Spark與Hadoop服務,可以幫助用戶快速創建集群、簡化集群管理及降...
    jopen 9年前    8859   

    Hunk/Hadoop: 性能最佳實踐

    無論有沒有使用Hunk,當運行Hadoop時,有很多種方式導致偶爾的性能底下。多數時候人們是增加更多的硬件來解決問題,但是有時候只需要簡單更改下文件的名稱就可以解決問題。
    jopen 9年前    5966   

    hadoop家族介紹

    Apache Hadoop是一款支持數據密集型分布式應用并以Apache 2.0許可協議發布的開源軟件框架。它支持在商品硬件構建的大型集群上運行的應用程序。Hadoop是根據Google公司發表...
    jopen 9年前    28652   

    15種最佳方式幫你順利掌握Hadoop技術

    在探討今天的主題——如何利用各類資源學習Hadoop知識——之前,讓我們首先搞清楚另一個問題:大數據Hadoop到底是什么?簡單來 講,Hadoop是一套用于實現大數據技術的框架方案。為了順利掌...
    jopen 9年前    11542   

    60款與Hadoop和大數據相關的頂級開源工具

    說到處理大數據的工具,普通的開源解決方案(尤其是Apache Hadoop)堪稱中流砥柱。弗雷斯特調研公司的分析師Mike Gualtieri最近預測,在接下來幾年,“100%的大公司”會采用H...
    jopen 9年前    60740   

    Spring for Apache Hadoop 2.3 M1 發布

    Spring for Apache Hadoop 提供了 Spring 框架用于創建和運行 Hadoop MapReduce、Hive 和 Pig 作業的功能,包括 HDFS 和 HBase。如...
    jopen 9年前    11452   

    王團結:如何用Hadoop/Spark構建七牛數據平臺

    繼“ YARN or Mesos?Spark痛點探討 ”、“ Mesos資源調度與管理的深入分享與交流 ”、及“ 主流SQL on Hadoop框架選擇 ”之后,CSDN Spark微信用戶...
    jopen 9年前    15456   

    Hadoop 的生態系統

    在一些 Teiid 的一些文章和示例上都會有關于 JBoss Data Virtualization (Teiid) 通過 Hive 使用 Hadoop 作為數據源的信息。當使用 Hadoop ...
    jopen 9年前    13930   

    飛起來的大象:Hadoop從離線到在線

    科技在進步,市場在變化,軟硬件條件突飛猛進般發展的同時,企業的需求也不斷升級。例如從離線到在線的轉變,規模效應的需求,更低的成本需求都刺激著Hadoop生態圈的進步和壯大。
    jopen 9年前    24766   

    梁堰波:主流SQL on Hadoop框架選擇

    在昨日(7月23日)的CSDN Spark微信群中,明略數據梁堰波就主流的SQL on Hadoop框架進行了深入分析,在給出了選擇建議后并與用戶進行了40分鐘的互動與交流。
    mf7x 9年前    26619   

    Spark 和 Hadoop 是朋友不是敵人

    IBM 宣布計劃大規模投資 Spark 相關技術,此項聲明會促使越來越多的工程師學習 Spark 技術,并且大量的企業也會采用 Spark 技術。
    jopen 9年前    17287   

    將Hadoop作為云托管服務的優劣勢分析

    云端Hadoop又叫Hadoop即服務(HaaS),這是平臺即服務(PaaS)的一個子類。 Apache Hadoop是一種開源軟件框架,能夠對分布式集群上的大數據集進行高吞吐量處理...
    jopen 9年前    17533   

    賈揚清:希望Caffe成為深度學習領域的Hadoop

    在深度學習(Deep Learning)的熱潮下,Caffe作為一個高效、實用的深度學習框架受到了廣泛的關注。了解Caffe研發的背景、愿景、技術特色、路線圖及其開發 者的理念,對于我們選擇合適...
    jopen 9年前    40649   

    破解迷霧:關于大數據與Hadoop的九大誤區

    這些毫無根據的印象涉及所需技能儲備、技術方案類型以及技術匹配方式等多個層面,盲目偏信只會將大家引入歧途。
    jopen 9年前    11979   

    hadoop 2.7.0版本發布

    adoop 2.7.0已經發布,在這個版本中 ,包含幾個非常重要的功能。
    jopen 9年前    7353   
    1 2 3 4 5 6 7

    熱門問答

    熱門文檔

  • sesese色