• 分布式計算 Spark 入門介紹 經驗

    Spark是一個通用的分布式內存計算框架,本文主要研討Spark的核心數據結構RDD的設計思路,及其在內存上的容錯。內容基于論文 Zaharia, Matei, et al. " Resilient Distributed

    jopen 2015-01-07   65000   0

    搭建Spark完全分布式集群 經驗

    本文詳細總結Spark分布式集群的安裝步驟,幫助想要學習Spark的技術愛好者快速搭建Spark的學習研究環境。 寫在前面二: 使用軟件說明 約定,Spark相關軟件存放目錄:

    jopen 2015-01-16   23746   0

    spark用程序提交任務到yarn 經驗

    因為spark文檔只介紹了兩種用腳本提交到yarn的例子,并沒有介紹如何通過程序提交yarn,但是我們的需求需要這樣。網上很難找到例子,經過幾天摸索,終于用程序提交到yarn成功,下面總結一下。

    jopen 2014-04-11   186436   0

    spark讀取hbase數據做分布式計算 經驗

    由于spark提供的hbaseTest是scala版本,并沒有提供java版。我將scala版本改為java版本,并根據數據做了些計算操作。 程序目的:查詢出hbase滿足條件的用戶,統計各個等級個數。

    jopen 2014-01-27   69731   0

    Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3) 經驗

    hash 取值來分桶,桶類通過 userid 來排序排序 分桶便于有用數據加載到 有限的 內存性能上的優化 ---- 還有 join,group by,distinct ) row format

    jopen 2015-12-29   9440   0

    使用Spark DataFrame進行大數據處理 經驗

    簡介 DataFrame讓Spark具備了處理大規模結構數據的能力,在比原有的RDD轉化方式易用的前提下,計算性能更還快了兩倍。這一個小小的API,隱含著Spark希望大一統「大數據江湖」的野心

    jopen 2016-01-08   120116   0

    Spark Streaming 1.6 流式狀態管理分析 經驗

    com/p/1463bc1d81b5 Spark 1.6發布后,官方聲稱流式狀態管理有10倍性能提升。這篇文章會詳細介紹Spark Streaming里新的流式狀態管理。 關于狀態管理 在流式計算,數據是持續不斷來

    iOS XMPP:Openfire+spark環境搭建 經驗

    henishuo.com/xmpp-spark-openfire-setup/ 前言 iOS XMPP:Openfire+spark環境搭建。 下載Openfire+Spark 首先到官網下載openfire+spark:

    RosCrowder 2016-02-18   26195   0

    【原】Learning Spark (Python版) 學習筆記(一) 經驗

    《Learning Spark》 這本書算是Spark入門的必讀書了,中文版是 《Spark快速大數據分析》 ,不過豆瓣書評很有意思的是,英文原版評分7.4,評論都說入門而已深入不足,中文譯版評分8.

    idvv5744 2016-04-21   27501   0

    Apache Spark 1.4.1 發布,開源集群計算系統 資訊

    Apache Spark 1.4.1 發布,此版本是個維護版本,包括一些穩定性修復(DataFrame API, Spark Streaming, PySpark, Spark SQL 和 MLlib),基于

    jopen 2015-07-18   20371   0

    IBM 開源主要關注 Spark,Docker,Node 和 Go 資訊

    50個項目。在 IBM 開源門戶 DeveloperWorks 中有大量的開源項目都是為了提升 Spark 性能來優化 Docker 的網絡管理。 IBM 當前推出的 DeveloperWorks 開源門戶主要是

    jopen 2015-08-05   12936   0
    Docker  

    應用Spark解決Kaggle數據科學問題 資訊

    ysto-Spark 如何利用高性能分布式計算平臺來解決現實問題一直是人們所關心的話題。近期, comSysto公司 的Danial Bartl就 分享 了該公司研發團隊利用 Spark 平臺解決

    jopen 2015-11-19   17064   0
    Spark  

    Apache Spark不過時的六大理由 資訊

    英文原文: 6 Reasons That Apache Spark Isn't Flickering Out 在極短的時間內,Apache Spark 迅速成長為大數據分析的技術核心。這就使得保守派擔心

    jopen 2015-08-26   14607   0

    IBM承諾將推動Spark的發展 資訊

    nce-Apache-Spark 上個月早些時候在拉斯維加斯舉行的 IBM Insight 2015 大數據分析峰會上, IBM 公司宣布將主要承擔 Apache Spark 項目。正如IBM公司

    jopen 2015-11-24   13908   0
    Spark  

    Spark 是否真的比 MapReduce 技高一籌 資訊

    作為一個開源的數據處理框架,Spark 是如何做到如此迅速地處理數據的呢?秘密就在于它是運行在集群的內存上的,而且不受限于 MapReduce 的二階段范式。這大大加快了重復訪問同一數據的速度。 Spark 既可以單獨運行,也可以運行在

    jopen 2016-02-19   29104   0
    P11

      (4)Spark程序的開發和運行 文檔

    1. Spark程序的開發和運行—by 球哥 2. 大數據學習網介紹我們的網址是:bigdatastudy.cn 我們提供專業的大數據學習視頻,包括Hadoop,Spark,Storm,Mahout,機器學習等。

    ngn6 2015-08-12   2542   0

    Spark官方文檔》集群模式概覽 經驗

    http://ifeve.com/《spark官方文檔》集群模式概覽/ 集群模式概覽 本文簡要描述了Spark在集群各個組件如何運行。想了解如何在集群啟動Spark應用,請參考 application

    fyfg0690 2016-02-28   9942   0

    Collective的Spark ML經驗分享:讀者模型 資訊

    因素預測讀者轉 、點擊率等信息的。在機器學習庫的選擇上,Collective公司內部新開發的大部分項目都是基于SparkSpark MLLib的,對于一些被大家廣泛使用而Spark并不具備的工具和

    jopen 2015-11-20   9798   0

    Hadoop、Spark、HBase與Redis的適用性討論(全文) 經驗

    兒我就結合我這幾年在 Hadoop 等大數據方向的工作經驗,與大家討論一下 Hadoop 、 Spark 、 HBase 及 Redis 等幾個主流大數據技術的使用場景(首先聲明一點,本文中所指的 Hadoop

    jopen 2014-08-08   34361   0

    spark部分代碼分析,修改筆記 經驗

    resource ?圖片聲音資料路徑 1.修改字體:各個界面類改11為12 ?org.jivesoftware--Spark.java--installBaseUIProperties()--

    1 2 3 4 5 6 7 8 9 10
  • sesese色