• 0推薦
    46K 瀏覽

    Spark:比Hadoop更強大的分布式數據計算項目

    Spark是一個由加州大學伯克利分校(UC Berkeley AMP)開發的一個分布式數據快速分析項目。它的核心技術是彈性分布式數據集(Resilient distributed dataset...
    0推薦
    54K 瀏覽

    Spark在騰訊數據倉庫TDW的應用

    為了滿足挖掘分析與交互式實時查詢的計算需求,騰訊大數據使用了Spark平臺來支持挖掘分析類計算、交互式實時查詢計算以及允許誤差范圍的快速查 詢計算,目前騰訊大數據擁有超過200臺的Spark集群...
    0推薦
    17K 瀏覽

    Spark實戰:單節點本地模式搭建Spark運行環境

    Spark實戰:單節點本地模式搭建Spark運行環境
    0推薦
    37K 瀏覽

    內存計算技術那家強?SPARK vs HANA

    最近業界有很多技術和產品都認為屬于內存計算的范疇,由于我個人也從事于內存計算產品的研發,所以想借個機會,跟各位聊聊到底什么是內存計算技術,以及比較一些現在兩種比較主流的內存計算技術Apache ...
    0推薦
    109K 瀏覽

    Spark介紹

    Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,Spark基于map reduce算法實現的分布式計算,擁有Hadoop Map...
    0推薦
    101K 瀏覽

    Spark與Hadoop的結合

    Spark可以直接對HDFS進行數據的讀寫,同樣支持Spark on YARN。Spark可以與MapReduce運行于同集群中,共享存儲資源與計算,數據倉庫Shark實現上借用Hive...
    0推薦
    51K 瀏覽

    Spark實戰1:單節點本地模式搭建Spark運行環境

    Spark實戰1:單節點本地模式搭建Spark運行環境
    0推薦
    93K 瀏覽

    Spark SQL編程指南

    Spark SQL支持在Spark中執行SQL,或者HiveQL的關系查詢表達式。它的核心組件是一個新增的RDD類型JavaSchemaRDD。JavaSchemaRDD由Row對象和表述這個行...
    0推薦
    21K 瀏覽

    Spark Internals

    本文主要討論 Apache Spark 的設計與實現,重點關注其設計思想、運行原理、實現架構及性能調優,附帶討論與 Hadoop MapReduce 在設計與實現上的區別。不喜歡將該文檔稱之為“...
    0推薦
    163K 瀏覽

    Spark編程指南

    總的來說,每一個Spark應用程序,都是由一個驅動程序組成,它運行用戶的main函數,并且在一個集群上執行各種各樣的并行操作。Spark提供的主要的抽象(概念)是一個彈性分布式數據集,它是一個元...
    0推薦
    89K 瀏覽

    集群計算平臺:Spark

    Spark是發源于美國加州大學伯克利分校AMPLab的集群計算平臺。它立足于內存計算,從多迭代批量處理出發,兼收并蓄數據倉庫、流處理和圖計算等多種計算范式,是罕見的全能選手。
    jopen 10年前   
    0推薦
    51K 瀏覽

    什么是spark

    Spark是一個基于內存計算的開源的集群計算系統,目的是讓數據分析更加快速。Spark非常小巧玲瓏,由加州伯克利大學AMP實驗室的Matei為主的小團隊所開發。使用的語言是Scala,項目的co...
    0推薦
    52K 瀏覽

    hadoop-2.2.0+spark1.1.0安裝過程

    hadoop-2.2.0+spark1.1.0安裝過程
    0推薦
    34K 瀏覽

    Hadoop、Spark、HBase與Redis的適用性討論(全文)

    最近在網上又看到有關于Hadoop適用性的討論[1]。想想今年大數據技術開始由互聯網巨頭走向中小互聯網和傳統行業,估計不少人都在考慮各種“紛繁復雜”的大數據技術的適用性的問題。這兒我就結合我這幾...
    0推薦
    49K 瀏覽

    Spark1.0.0生態圈一覽

    Spark生態圈,也就是BDAS(伯克利數據分析棧),是伯克利APMLab實驗室精心打造的,力圖在算法(Algorithms)、機器 (Machines)、人(People)之間通過大規模集成,...
    0推薦
    15K 瀏覽

    Spark:一個高效的分布式計算系統

    Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,Spark基于map reduce算法實現的分布式計算,擁有Hadoop Map...
    0推薦
    43K 瀏覽

    Java 微型Web框架:sparkjava

    sparkjava是一個受Sinatra啟發的微型Web框架,用于采用Java快速快速創建Web應用。
    jopen 10年前   
    0推薦
    186K 瀏覽

    spark用程序提交任務到yarn

    因為spark文檔中只介紹了兩種用腳本提交到yarn的例子,并沒有介紹如何通過程序提交yarn,但是我們的需求需要這樣。網上很難找到例子,經過幾天摸索,終于用程序提交到yarn成功,下面總結一下。
    0推薦
    32K 瀏覽

    Spark 快速理解

    Spark的核心概念是RDD (resilientdistributed dataset),指的是一個只讀的,可分區的分布式數據集,這個數據集的全部或部分可以緩存在內存中,在多次計算間重用。
    0推薦
    103K 瀏覽

    Scala-Spark環境搭建配置

    Scala-Spark環境搭建配置
    1 2 3 4 5 6 7

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色