開源項目,開源代碼,開源文檔,開源新聞,開源社區

繼基礎篇講解了每個Spark開發人員都必須熟知的開發調優與資源調優之后，本文作為《Spark性能優化指南》的高級篇，將深入分析數據傾斜調優與shuffle調優，以解決更加棘手的性能問題。數據傾斜調優

Poppy3869 2016-05-12 39154 0

Spark 性能優化分布式/云計算/大數據

前言在大數據計算領域，Spark已經成為了越來越流行、越來越受歡迎的計算平臺之一。Spark的功能涵蓋了大數據領域的離線批處理、SQL類處理、流式/實時計算、機器學習、圖計算等各種不同類型的計算

TorWortman 2016-05-02 105937 0

分布式/云計算/大數據 Spark

P3

? SQL語句簡單優化 1. 盡量不使用 < >,!=,IS NULL,NOT IS NULL這些符號, 原因是這些永遠不會使用索引. 2. 使用LIKE時,第一個字符不要使用’%’,’_’,否則不會使用索引

yeshuangjin 2011-03-01 2242 0

SQL

RDD 有關RDD的基礎概念請閱讀spark官方文檔，或網上搜索其他內容。本文完全是實戰經驗的總結。惰性求值 RDD的轉換操作都是惰性求值的。惰性求值意味著我們對RDD調用轉化操做（例

jopen 2016-01-18 9409 0

分布式/云計算/大數據

Spark開發指南簡介總的來說，每一個Spark應用程序，都是由一個驅動程序組成，它運行用戶的main函數，并且在一個集群上執行各種各樣的并行操作。Spark提供的主要的抽象（概念）是一個彈性

jopen 2014-08-24 162840 0

Spark 分布式/云計算/大數據

Spark SQL 編程指南簡介 Spark SQL支持在Spark中執行SQL，或者HiveQL的關系查詢表達式。它的核心組件是一個新增的RDD類型JavaSchemaRDD。JavaSche

jopen 2014-09-01 93150 0

Spark 分布式/云計算/大數據

目錄 [?] Spark屬性動態加載Spark屬性查看Spark屬性可用的屬性應用屬性運行時環境Runtime Environment Shuffle Behavior Spark UI Compression

jopen 2014-12-11 135978 0

Spark 分布式/云計算/大數據

基本概念和原則首先，要搞清楚Spark的幾個基本概念和原則，否則系統的性能調優無從談起：每一臺host上面可以并行N個worker，每一個worker下面可以并行M個executor，ta

jopen 2016-01-19 77909 0

Spark 分布式/云計算/大數據

下面這些關于Spark的性能調優項，有的是來自官方的，有的是來自別的的工程師，有的則是我自己總結的。 Data Serialization，默認使用的是Java Serialization，這個程

jopen 2015-12-21 21259 0

Spark 分布式/云計算/大數據

性能優化參數針對Spark SQL 性能調優參數如下：代碼示例 import?java.util.List; import?org.apache.spark.SparkConf; import?org

jopen 2015-06-17 60968 0

Spark SQL 分布式/云計算/大數據

通常我們對一個系統進行性能優化無怪乎兩個步驟——性能監控和參數調整，本文主要分享的也是這兩方面內容。性能監控工具【Spark監控工具】 Spark提供了一些基本的Web監控頁面，對于日常監控十分有用。

jopen 2015-07-09 45272 0

Spark 分布式/云計算/大數據

P11

?Spark Streaming編程指南 Overview Spark Streaming屬于Spark的核心api，它支持高吞吐量、支持容錯的實時流數據處理。它可以接受來自Kafka, Flume

1909023453 2017-03-13 5013 0

分布式/云計算/大數據

前言 Spark SQL允許我們在Spark環境中使用SQL或者Hive SQL執行關系型查詢。它的核心是一個特殊類型的Spark RDD：SchemaRDD。 SchemaRDD類似于傳統關系型數據庫的一張表，由兩部分組成：

jopen 2015-11-21 63799 0

Spark SQL 分布式/云計算/大數據

據存儲和處理，對 Hadoop、HBase 以及 Spark 等等均有深入的了解。 Spark 最新的特性以及功能 2015 年中 Spark 版本從 1.2.1 升級到當前最新的 1.5.2，1

jopen 2016-01-07 42951 0

Spark 大數據

Spark中的rollup 在對數據進行小計或合計運算時，rollup和cube一樣，算是常用的操作了。Spark的DataFrame提供了rollup函數支持此功能。假設準備了如下數據： trait

jopen 2015-12-31 8013 0

分布式/云計算/大數據

一、索引 MongoDB 提供了多樣性的索引支持，索引信息被保存在system.indexes 中，且默認總是為_id創建索引，它的索引使用基本和MySQL 等關系型數據庫一樣。其實可以這樣說說，索

weilane 2016-02-27 13933 0

MongoDB NoSQL數據庫

通過定期分析表和檢查表、定期優化表以及一些常用SQL語句的優化手段，可以幫助你學會在MySQL開發中編寫更為高效的SQL。 1、定期分析表和檢查表分析表的語法如下： ANALYZE [LOCAL

jopen 2015-03-04 13725 0

MySQL 數據庫服務器

時候，隨著代碼的增加，功能的增加，性能會逐漸成為你需要關注的部分。那么網站的性能問題具體是指什么呢？在鹵煮看來，一個網站的性能主要關乎兩項，一是加載性能、二是執行性能。第一項可以利用 Network

jopen 2015-06-29 51327 0

Chrome Web開發工具

P28

? VSS使用指南修訂記錄版本日期修改內容修改人備注 1.00 2006-3-22 初稿形成朱濤 1.10 2006-3-29 根據王亞輪，韓雪峰，代刊志和李宏偉的檢視意見進行修改。朱濤

kylinbird 2012-02-28 441 0

版本控制系統

0. 簡介 Spark 是一個非常好的計算平臺，支持多種語言，同時基于內存的計算速度也非常快。整個開源社區也很活躍。但是Spark在易用性上面還是有一些美中不足。對于剛接觸的人來說，上手以及環境搭建還是有一些困難。

zulo2012 2016-08-20 57436 0

Spark Zeppelin 分布式/云計算/大數據

Spark性能優化指南——高級篇經驗

Spark性能優化指南——基礎篇經驗

SQL語句簡單優化文檔

spark 編程珠璣-RDD 篇經驗

Spark編程指南經驗

Spark SQL編程指南經驗

Spark 配置指南經驗

Spark的性能調優經驗

Spark的性能調優經驗

Spark SQL性能優化經驗

Spark性能調優經驗

spark-streaming編程指南文檔

Spark SQL編程指南（Python）經驗

大數據盤點之Spark篇資訊

Spark中的rollup 經驗

MongoDB性能優化指南經驗

MySQL性能優化指南經驗

Chrome開發者工具不完全指南：（三、性能篇）經驗

VSS 使用指南-管理篇文檔

讓Spark如虎添翼的Zeppelin - 基礎篇經驗

《Spark性能優化指南——高級篇》中的相關搜索

關鍵詞

Spark性能優化指南——高級篇 經驗

Spark性能優化指南——基礎篇 經驗

SQL語句簡單優化 文檔

spark 編程珠璣-RDD 篇 經驗

Spark編程指南 經驗

Spark SQL編程指南 經驗

Spark 配置指南 經驗

Spark的性能調優 經驗

Spark的性能調優 經驗

Spark SQL性能優化 經驗

Spark性能調優 經驗

spark-streaming編程指南 文檔

Spark SQL編程指南（Python） 經驗

大數據盤點之Spark篇 資訊

Spark中的rollup 經驗

MongoDB性能優化指南 經驗

MySQL性能優化指南 經驗

Chrome開發者工具不完全指南：（三、性能篇） 經驗

VSS 使用指南-管理篇 文檔

讓Spark如虎添翼的Zeppelin - 基礎篇 經驗

《Spark性能優化指南——高級篇》中 的相關搜索

關鍵詞

Spark性能優化指南——高級篇經驗

Spark性能優化指南——基礎篇經驗

SQL語句簡單優化文檔

spark 編程珠璣-RDD 篇經驗

Spark編程指南經驗

Spark SQL編程指南經驗

Spark 配置指南經驗

Spark的性能調優經驗

Spark的性能調優經驗

Spark SQL性能優化經驗

Spark性能調優經驗

spark-streaming編程指南文檔

Spark SQL編程指南（Python）經驗

大數據盤點之Spark篇資訊

MongoDB性能優化指南經驗

MySQL性能優化指南經驗

Chrome開發者工具不完全指南：（三、性能篇）經驗

VSS 使用指南-管理篇文檔

讓Spark如虎添翼的Zeppelin - 基礎篇經驗

《Spark性能優化指南——高級篇》中的相關搜索