• Spark性能優化指南——高級 經驗

    繼 基礎 講解了每個Spark開發人員都必須熟知的開發調優與資源調優之后,本文作為《Spark性能優化指南》的高級,將深入分析數據傾斜調優與shuffle調優,以解決更加棘手的性能問題。 數據傾斜調優

    Poppy3869 2016-05-12   39154   0

    Spark性能優化指南——基礎 經驗

    前言 在大數據計算領域,Spark已經成為了越來越流行、越來越受歡迎的計算平臺之一。Spark的功能涵蓋了大數據領域的離線批處理、SQL類處理、流式/實時計算、機器學習、圖計算等各種不同類型的計算

    TorWortman 2016-05-02   105937   0
    P3

      SQL語句簡單 文檔

    ? SQL語句簡單 1. 盡量不使用 < >,!=,IS NULL,NOT IS NULL這些符號, 原因是這些永遠不會使用索引. 2. 使用LIKE時,第一個字符不要使用’%’,’_’,否則不會使用索引

    yeshuangjin 2011-03-01   2242   0
    SQL  

    spark 編程珠璣-RDD 經驗

    RDD 有關RDD的基礎概念請閱讀spark官方文檔,或網上搜索其他內容。本文完全是實戰經驗的總結。 惰性求值 RDD的轉換操作都是惰性求值的。 惰性求值意味著我們對RDD調用轉化操做(例

    jopen 2016-01-18   9409   0

    Spark編程指南 經驗

    Spark開發指南 簡介 總的來說,每一個Spark應用程序,都是由一個驅動程序組成,它運行用戶的main函數,并且在一個集群上執行各種各樣的并行操作。Spark提供的主要的抽象(概念)是一個彈性

    jopen 2014-08-24   162840   0

    Spark SQL編程指南 經驗

    Spark SQL 編程指南 簡介 Spark SQL支持在Spark執行SQL,或者HiveQL的關系查詢表達式。它的核心組件是一個新增的RDD類型JavaSchemaRDD。JavaSche

    jopen 2014-09-01   93150   0

    Spark 配置指南 經驗

    目錄 [?] Spark屬性 動態加載Spark屬性 查看Spark屬性 可用的屬性 應用屬性 運行時環境Runtime Environment Shuffle Behavior Spark UI Compression

    jopen 2014-12-11   135978   0

    Spark性能調優 經驗

    基本概念和原則 首先,要搞清楚Spark的幾個基本概念和原則,否則系統的性能調優無從談起: 每一臺host上面可以并行N個worker,每一個worker下面可以并行M個executor,ta

    jopen 2016-01-19   77909   0

    Spark性能調優 經驗

    下面這些關于Spark性能調優項,有的是來自官方的,有的是來自別的的工程師,有的則是我自己總結的。 Data Serialization,默認使用的是Java Serialization,這個程

    jopen 2015-12-21   21259   0

    Spark SQL性能優化 經驗

    性能優化參數 針對Spark SQL 性能調優參數如下: 代碼示例 import?java.util.List; import?org.apache.spark.SparkConf; import?org

    jopen 2015-06-17   60968   0

    Spark性能調優 經驗

    通常我們對一個系統進行性能優化無怪乎兩個步驟——性能監控和參數調整,本文主要分享的也是這兩方面內容。 性能監控工具 【Spark監控工具】 Spark提供了一些基本的Web監控頁面,對于日常監控十分有用。

    jopen 2015-07-09   45272   0
    P11

      spark-streaming編程指南 文檔

    ?Spark Streaming編程指南 Overview Spark Streaming屬于Spark的核心api,它支持吞吐量、支持容錯的實時流數據處理。 它可以接受來自Kafka, Flume

    1909023453 2017-03-13   5013   0

    Spark SQL編程指南(Python) 經驗

    前言 Spark SQL允許我們在Spark環境中使用SQL或者Hive SQL執行關系型查詢。它的核心是一個特殊類型的Spark RDD:SchemaRDD。 SchemaRDD類似于傳統關系型數據庫的一張表,由兩部分組成:

    jopen 2015-11-21   63799   0

    大數據盤點之Spark 資訊

    據存儲和處理,對 Hadoop、HBase 以及 Spark 等等均有深入的了解。 Spark 最新的特性以及功能 2015 年中 Spark 版本從 1.2.1 升級到當前最新的 1.5.2,1

    jopen 2016-01-07   42951   0

    Spark的rollup 經驗

    Spark的rollup 在對數據進行小計或合計運算時,rollup和cube一樣,算是常用的操作了。Spark的DataFrame提供了rollup函數支持此功能。 假設準備了如下數據: trait

    jopen 2015-12-31   8013   0

    MongoDB性能優化指南 經驗

    一、索引 MongoDB 提供了多樣性的索引支持,索引信息被保存在system.indexes ,且默認總是為_id創建索引,它的索引使用基本和MySQL 等關系型數據庫一樣。其實可以這樣說說,索

    weilane 2016-02-27   13933   0

    MySQL性能優化指南 經驗

    通過定期分析表和檢查表、定期優化表以及一些常用SQL語句的優化手段,可以幫助你學會在MySQL開發編寫更為高效的SQL。 1、定期分析表和檢查表 分析表的語法如下: ANALYZE [LOCAL

    jopen 2015-03-04   13725   0

    Chrome開發者工具不完全指南:(三、性能 經驗

    時候,隨著代碼的增加,功能的增加,性能會逐漸成為你需要關注的部分。那么網站的性能問題具體是指什么呢?在鹵煮看來,一個網站的性能主要關乎兩項,一是加載性能、二是執行性能。第一項可以利用 Network

    jopen 2015-06-29   51327   0
    P28

      VSS 使用指南-管理 文檔

    ? VSS使用指南 修訂記錄 版本 日期 修改內容 修改人 備注 1.00 2006-3-22 初稿形成 朱濤 1.10 2006-3-29 根據王亞輪,韓雪峰,代刊志和李宏偉的檢視意見進行修改。 朱濤

    kylinbird 2012-02-28   441   0

    Spark如虎添翼的Zeppelin - 基礎 經驗

    0. 簡介 Spark 是一個非常好的計算平臺,支持多種語言,同時基于內存的計算速度也非常快。整個開源社區也很活躍。 但是Spark在易用性上面還是有一些美中不足。 對于剛接觸的人來說,上手以及環境搭建還是有一些困難。

    zulo2012 2016-08-20   57436   0
    1 2 3 4 5 6 7 8 9 10
  • sesese色