• 解析Spark大數據分析框架的核心部件

    Spark大數據分析框架的核心部件包含RDD內存數據結構、Streaming流計算框架、GraphX圖計算與網狀數據挖掘、MLlib機器學習支持框架、Spark SQL數據檢索語言、Tachyo...
    勿忘初心321 8年前    18139   

    如何運用Spark進行實時數據分析

    Apache Hadoop是一個成熟的開發框架,其連接著龐大的生態系統,并且得到了Cloudera、Hortonwork、Yahoo這些卓越機構的支持與貢獻,并且為各個組織提供了許多工具來管理不...
    勿忘初心321 8年前    32298   

    還不懂Hadoop分布式文件系統HDFS的工作原理? - 快來掃掃盲吧

    Hadoop分布式文件系統(HDFS)是一種被設計成適合運行在通用硬件上的分布式文件系統。HDFS是一個高度容錯性的系統,適合部署在廉價 的機器上。它能提供高吞吐量的數據訪問,非常適合大規模...
    jopen 9年前    19493   
    HDFS  

    EMC存儲上的大數據–HDFS存儲可靠性

    企業為了從其 Hadoop 分析投資中獲取最大價值,企業需要富有彈性的大數據存儲基礎架構。在傳統 Hadoop 集群中,用戶必須依賴于自定義的子數據塊 CRC 校驗和來提供硬件層數據保護,并且在...
    jopen 9年前    9330   
    HDFS  

    熱門問答

    熱門文檔

  • sesese色