開源項目,開源代碼,開源文檔,開源新聞,開源社區

Spark 是谷歌公司推出的一款基于 Chrome 瀏覽器的開發環境。提供一組可重用的 UI 組件。采用 Dart 開發。安裝方法請看： https://github.com/dart-la

jopen 2013-11-21 21316 0

Spark Web開發工具

我是貓大，大家還記得我的好友咪咪(那位想要知道自己養的貓，會不會抓老鼠的那位愛貓人士)嗎?在過去文章什么 ? SVM會賺錢 !中貓大介紹了SVM的概念，以及如何通過LIBSVM，幫助使用者解決分類問題。記憶體不足前幾天咪

jopen 2015-02-11 20695 0

分布式/云計算/大數據 Apache Spark

背景 Spark on Yarn分yarn-cluster和yarn-client兩種模式。本文通過Cluster模式的TaskScheduler實現入手，梳理一遍spark on yarn的大致實現邏輯。

c6g3 2015-02-15 40450 0

Spark 分布式/云計算/大數據

RDD是什么？ RDD是Spark中的抽象數據結構類型，任何數據在Spark中都被表示為RDD。從編程的角度來看，RDD可以簡單看成是一個數組。和普通數組的區別是，RDD中的數據是分區存儲的，這樣不

jopen 2015-03-21 37683 0

Spark 分布式/云計算/大數據

本文主要記錄最近一段時間學習和實現Spark MLlib中的協同過濾的一些總結，希望對大家熟悉Spark ALS算法有所幫助。更新：【2016.06.12】Spark1.4.0中MatrixFacto

jopen 2015-07-29 72900 0

Spark 分布式/云計算/大數據

什么是Spark Apache Spark 是一個圍繞速度、易用性和復雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發，并于2010年成為Apache的開源項目之一。

jopen 2015-11-16 61047 0

分布式/云計算/大數據 Apache Spark

使用Docker在本地搭建hadoop，spark集群簡介和環境說明本環境使用的單個宿主主機，而不是跨主機集群，本spark集群環境存在的意義可能在于便于本地開發測試使用，非常輕量級和便捷。這

jopen 2016-01-06 19262 0

Docker Hadoop Spark 分布式/云計算/大數據

com/archives/2016/01/605.htm 關鍵字：spark mllib、文本分類、樸素貝葉斯、native bayes 文本分類是指將一篇文章歸到事先定義好的某一類或者某幾類，在數據平臺的一個

PeggyScarbe 2016-01-23 137933 0

機器學習

來自： https://community.qingcloud.com/topic/341/spark-tungsten-sort-based-shuffle-分析 Tungsten-sort 算不得一個全新的shuffle

961408017 2016-01-31 14769 0

Spark 分布式/云計算/大數據

Spark是一個微型的Java Web框架，它的靈感來自于Sinatra，它的目的是讓你以最小的代價創建出一個Java Web應用。示例代碼： import static spark.Spark

fmms 2011-12-11 22938 0

Java Web框架

Spark是一個開源，跨平臺IM客戶端。它的特性支持集組聊天，電話集成和強大安全性能。如果企業內部部署IM使用Openfire+Spark是最佳的組合。 Open Source File Transfer

jopen 2011-12-19 81849 0

Java 電話/通訊/IM聊天

8/2824889 當下，Spark已經在國內得到了廣泛的認可和支持：2014年，Spark Summit China在北京召開，場面火爆；同年，Spark Meetup在北京、上海、深圳和杭

jopen 2015-06-08 49372 0

Hadoop 分布式/云計算/大數據

Spark是近年來發展較快的分布式并行數據處理框架，可以與Hadoop聯合使用，增強Hadoop的性能。同時，Spark還增加了內存緩存、流數據處理、圖數據處理等更為高級的數據處理能力。這里簡單介紹了

jopen 2015-06-25 53456 0

Spark 分布式/云計算/大數據

概述 Apache Spark的高性能一定程度上取決于它采用的異步并發模型（這里指server/driver端采用的模型），這與Hadoop 2.0（包括YARN和MapReduce）是一致的。Hadoop

jopen 2016-01-08 10239 0

Spark Hadoop 分布式/云計算/大數據

http://my.oschina.net/sulliy/blog/617259 本文介紹Spark的RDD。作為一個概念，RDD本身是與編程語言無關的，你即可以用Scala實現，也可以是Java

U4dbsfaasa 2016-02-18 8415 0

分布式/云計算/大數據

10.6，sbt。請自行提前裝好。設置SSH，本地免密碼登錄因為Spark master需要ssh到Spark worker中執行命令，所以，需要免密碼登錄。 cat ~/.ssh/id rsa

daidai141 2016-01-26 12715 0

Spark 分布式/云計算/大數據

hadoop-2.2.0+spark1.1.0安裝過程首先介紹一下整個過程中需要用到的一些軟件虛擬機vmwareworkstation 10 Linux版本 CentOS 6.4 Jdk

jopen 2014-08-14 52072 0

Hadoop Spark 分布式/云計算/大數據

P13

org/downloads/download-landing.jsp?file=smack/smack_3_2_2.zip 代碼中還用到了junit，junit jar下載地址：http://ebr.springsource.co

hazhangha 2013-05-06 20920 0

電話/通訊/IM聊天 Openfire

本文將介紹基于物品的協同過濾推薦算法案例在TDW Spark與MapReudce上的實現對比，相比于MapReduce，TDW Spark執行時間減少了66%，計算成本降低了40%。本文將介紹基于物品的協同過濾推薦算法案例在TDW

jopen 2014-11-05 17978 0

Spark

宣布計劃大規模投資 Spark 相關技術，此項聲明會促使越來越多的工程師學習 Spark 技術，并且大量的企業也會采用 Spark 技術。 Spark 投資的良性循環會使 Spark 技術發展更加成熟

jopen 2015-07-13 17287 0

Hadoop Spark

基于 Chrome App 的開發工具：Spark 經驗

最夯的大數據分析工具-Apache Spark 經驗

Spark on Yarn: Cluster模式Scheduler實現經驗

Spark RDD API詳解(一) Map和Reduce 經驗

如何使用Spark ALS實現協同過濾經驗

大數據處理框架Apache Spark入門經驗

使用Docker在本地搭建hadoop，spark集群經驗

Spark MLlib實現的中文文本分類–Native Bayes 經驗

Spark Tungsten-sort Based Shuffle 分析經驗

微型的Java Web框架 Spark 經驗

基于Java的IM客戶端 Spark IM 經驗

從Hadoop到Spark的架構實踐經驗

關于Spark的基本概念和特性簡介經驗

Hadoop和Spark的處理模型比較經驗

Spark核心概念RDD（Resilient Distributed Datasets）經驗

Spark本地開發環境搭建經驗

hadoop-2.2.0+spark1.1.0安裝過程經驗

openfire+smack+spark實現傳輸demo文檔文檔

Spark vs. MapReduce 時間節約66%，計算節約40% 資訊

Spark 和 Hadoop 是朋友不是敵人資訊

《Spark性能優化指南——高級篇》中的相關搜索

關鍵詞

基于 Chrome App 的開發工具：Spark 經驗

最夯的大數據分析工具-Apache Spark 經驗

Spark on Yarn: Cluster模式Scheduler實現 經驗

Spark RDD API詳解(一) Map和Reduce 經驗

如何使用Spark ALS實現協同過濾 經驗

大數據處理框架Apache Spark入門 經驗

使用Docker在本地搭建hadoop，spark集群 經驗

Spark MLlib實現的中文文本分類–Native Bayes 經驗

Spark Tungsten-sort Based Shuffle 分析 經驗

微型的Java Web框架 Spark 經驗

基于Java的IM客戶端 Spark IM 經驗

從Hadoop到Spark的架構實踐 經驗

關于Spark的基本概念和特性簡介 經驗

Hadoop和Spark的處理模型比較 經驗

Spark核心概念RDD（Resilient Distributed Datasets） 經驗

Spark本地開發環境搭建 經驗

hadoop-2.2.0+spark1.1.0安裝過程 經驗

openfire+smack+spark實現傳輸demo文檔 文檔

Spark vs. MapReduce 時間節約66%，計算節約40% 資訊

Spark 和 Hadoop 是朋友不是敵人 資訊

《Spark性能優化指南——高級篇》中 的相關搜索

關鍵詞

Spark on Yarn: Cluster模式Scheduler實現經驗

如何使用Spark ALS實現協同過濾經驗

大數據處理框架Apache Spark入門經驗

使用Docker在本地搭建hadoop，spark集群經驗

Spark Tungsten-sort Based Shuffle 分析經驗

從Hadoop到Spark的架構實踐經驗

關于Spark的基本概念和特性簡介經驗

Hadoop和Spark的處理模型比較經驗

Spark核心概念RDD（Resilient Distributed Datasets）經驗

Spark本地開發環境搭建經驗

hadoop-2.2.0+spark1.1.0安裝過程經驗

openfire+smack+spark實現傳輸demo文檔文檔

Spark 和 Hadoop 是朋友不是敵人資訊

《Spark性能優化指南——高級篇》中的相關搜索