• Spark 1.5.1】 安裝 經驗

    9789 二、Spark1.5.1安裝 1.下載spark1.5.1 http://spark.apache.org/downloads.html 選擇spark的版本 [hado

    gotogether 2016-01-27   16758   0

    ELK 在 Spark 集群的應用 經驗

    屬于商業運營產品,而 ELK 屬于開源產品。本文著重討論 ELK 方案,并詳細闡述 ELK 如何應用到 Spark 集群。事實上,ELK 官方已稱之為 Elastic,考慮行業內對此系統已經熟識,故而繼續延用 ELK

    b4zc51o3 2016-11-08   16819   0
    P15

      Spark 初識入門 文檔

    ?What is Spark? Spark是一個快速和通用的引擎用于處理大規模的數據量。 快速:運行在內存中比HadoopMapReduce快100倍,運行在硬盤上比HadoopMapReduce快10倍。

    因為一哥 2018-01-17   536   0

    Spark的任務調度 經驗

    本文嘗試從源碼層面梳理Spark在任務調度與資源分配上的做法。 先從Executor和SchedulerBackend說起。Executor是真正執行任務的進程,本身擁有若

    jopen 2015-01-16   45286   0

    Spark核心——RDD 經驗

    Spark中最核心的概念為 RDD(Resilient Distributed DataSets) 中文為: 彈性分布式數據集 ,RDD為對分布式內存對象的 抽象它表示一個 被分區不可變 且能 并行操作

    jopen 2016-01-09   8296   0
    P19

      (1)Spark簡介 文檔

    1. Spark簡介—by 球哥 2. 大數據學習網介紹我們的網址是:bigdatastudy.cn 我們提供專業的大數據學習視頻,包括Hadoop,Spark,Storm,Mahout,機器學習等。

    ngn6 2015-08-12   775   0
    P49

      Deep dive into Spark Streaming 文檔

    1. Deep dive into Spark Streaming Tathagata Das (TD) Matei Zaharia, Haoyuan Li, Timothy Hunter, Patrick

    fkd27 2015-10-17   545   0
    P9

      Openfire+Spark 文檔

    1. Openfire+Spark 2. Openfire服務器的介紹 Openfire是用Java語言編寫的,是基于XMPP協議、開源的實時協作的服務器,具有跨平臺的能力。 它是實現XMPP協議的S

    super_lgj 2012-08-14   796   0

    Apache Spark 設計與實現 經驗

    文主要討論 Apache Spark 的設計與實現,重點關注其設計思想、運行原理、實現架構及性能調優,附帶討論與 Hadoop MapReduce 在設計與實現上的區別。不喜歡將該文檔稱之為“源碼分析

    jopen 2015-07-16   23039   0

    Spark Application的調度算法 經驗

    http://www.cnblogs.com/francisYoung/p/5205420.html 要想明白spark application調度機制,需要回答一下幾個問題: 1.誰來調度? 2.為誰調度?

    NorineXGII 2016-02-21   10869   0

    Spark——共享變量 經驗

    solinx.co/archives/570 Spark執行不少操作時都依賴于 閉包函數 的調用,此時如果閉包函數使用到了外部變量驅動程序在使用行動操作時傳遞到集群各worker節點任務時就會進行一系列操作:

    gy471150 2016-02-27   12450   0

    在YARN上運行Spark 經驗

    在YARN 上運行 SparkSpark0.6.0 版本開始支持 YARN 模式,隨后的版本在逐漸地完善。 在YARN 上啟動 Spark 確保HADOOP_CONF_DIR或YARN_C

    jopen 2016-01-08   22741   0

    Spark的Python編程示例 代碼段

    鏈接: http://spark.apache.org/docs/latest/programming-guide.html 安裝好Spark 后,自帶了一些demo, 路徑在Spark根目錄/exam

    lianzhu3 2016-03-01   39966   0
    Spark  

    Spark與Hadoop的結合 經驗

    Spark可以直接對HDFS進行數據的讀寫,同樣支持Spark on YARN。Spark可以與MapReduce運行于同集群,共享存儲資源與計算,數據倉庫Shark實現上借用Hive,幾乎與Hive完全兼容。

    jopen 2014-09-23   100810   0

    Spark 快速理解 經驗

    個人理解 首先, MapReduce-like 是說架構上和多數分布式計算框架類似, Spark 有分配任務的主節點( Driver )和執行計算的工作節點( Worker )

    jopen 2014-03-31   32227   0

    什么是spark 經驗

    Spark是一個基于內存計算的開源的集群計算系統,目的是讓數據分析更加快速。Spark非常小巧玲瓏,由加州伯克利大學AMP實驗室的Matei為主的小團隊所開發。使用的語言是Scala,項目的core部

    jopen 2014-08-14   51313   0

    Spark初探 經驗

    Spark 基于內存計算,提高了在大數據環境下數據處理的實時性,同時保證了容錯性和可伸縮性,允許用戶將Spark 部署在大量廉價硬件之上,形成集群。 認識 Spark Apache Spark

    jopen 2015-01-13   58340   0

    Spark 內核研究 經驗

    1、Spark介紹 Spark是起源于美國加州大學伯克利分校AMPLab的大數據計算平臺,在2010年開源,目前是Apache軟件基金會的頂級項目。隨著Spark在大數據計算領域的暫露頭角,越來越

    jopen 2015-01-29   28746   0

    Spark介紹 經驗

    Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的并行計算框架,Spark基于map reduce算法實現的分布式計算,擁有Hadoop MapReduce所具有的優點;

    jopen 2014-11-17   109482   0
    P9

      Spark 筆記 文檔

    ration Stage - 一個作業分為多個階段 Partition - 數據分區, 一個RDD的數據可以分成多個不同的區 DAG - Directed Acycle graph, 有向無環圖,反應RDD之間的依賴關系

    ylx1214 2015-04-18   1526   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色