• 華為葉琪:論Spark Streaming的數據可靠性和一致性

    眼下大數據領域最熱門的詞匯之一便是流計算了,其中最耀眼的項目無疑是來自Spark社區的Spark Streaming項目,其從一誕生就受到廣泛關注并迅速發展,目前已有追趕并超越Storm的架勢。
    jopen 9年前    15043   

    Spark的速度快是以喪失計算結果正確性為代價的

    是的,Spark很快。但是它不保證它算出的值是對的,哪怕你要做的只是簡單的整數累加。 Spark最著名的一篇論文是:《Spark: Cluster Computing with Working...
    n5em 9年前    20774   

    Spark 1.5將不再支持Java 6

     在幾年前,Oracle宣布不再維護Java 6的更新(看這里http://www.computerworld.com/article/2494112/application- security...
    bgn4 9年前    15551   

    Spark 1.4最大的看點:支持R語言(SparkR)

    R是用于統計分析、繪圖的語言和操作環境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟件,它是一個廣泛應用于統計計算和統計制圖的優 秀編程語言,但是其交互式使用通常局限于一臺機器。為了能夠使...
    jopen 9年前    23899   

    Spark成為大數據分析領域新核心的五個理由

    為了更為順暢地實現Hadoop基礎之上的高級與實時分析目標,Apache Spark憑借著自身的出色表現很快成為大數據領域的新核心。 在過去幾年當中,隨著Hadoop逐步成為大數據處理領域的主...
    jopen 10年前    16135   

    Spark發布1.3.0版本

    3月13日, Spark 1.3.0版本與我們如約而至 。這是Spark 1.X發布計劃中的第四次發布,距離1.2版本發布約三個月時間。據Spark官方網站報道,此次發布是有史以來最大的一次發布...
    jopen 10年前    28176   

    陳超:Spark這一年,從開源到火爆

    2014年的大數據領域,Apache Spark(以下簡稱Spark)無疑最受矚目。Spark,出自名門伯克利AMPLab之手,目前由商業公司Databricks保駕護航。自2014 年3月份躋...
    jopen 10年前    34447   

    Spark 1.2.1穩定版本發布(released)

     Spark 1.2.1是一個維護版本( maintenance release) ,其中修復了一些bug,是基于branch-1.2 分支。并且推薦所有的1.2.0的用戶升級到這個穩定版本。此...
    jopen 10年前    20834   

    Spark奠基者博士論文中文版出來了

    由 CSDN CODE翻譯社區 組織的長篇論文翻譯An Architecture for Fast and General Data Processing on Large Clusters 經...
    jopen 10年前    14963   

    Spark 1.2版本發布: MLlib支持工作流,SQL支持源數據篩選

    12月18日,Spark宣布發布1.2版本,和以往發布的版本相比,1.2版本算得上是最大的一次改進,代碼來自172個開發者的多達一千次提交。更新內容涵蓋核心性能改進、MLlib的新API、Str...
    jopen 10年前    7849   

    類似pip一樣的跟蹤Spark上面開發應用和擴展庫的網站

    隨著Spark生態系統的發展,越來越多的公司和組織在Spark上面開發應用和擴展庫。隨著這些庫的增長,用戶一直希望有一個類似pip一樣的跟蹤這些庫的網站。今天我們給大家帶來一個圣誕禮物: spa...
    jopen 10年前    6582   

    Spark1.2新特性概述

    1.2 居然真的在12月份發布了,我表示略感意外,我一直以為稍微跳個票要到明年一月初才能發的。這次更新有172個開發者參與,并且有1000多個 commits。這真是一個了不起的數字。本次版本給...
    jopen 10年前    8121   

    開源分布式計算系統,Spark 1.2 發布

    Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,換句話說,Spark 啟用了內存分...
    jopen 10年前    23822   

    Spark與Hadoop之間的PK

    一說大數據,人們往往想到 Hadoop。這固然不錯,但隨著大數據技術的深入應用,多種類型的數據應用不斷被要求提出,一些 Hadoop 被關注的范疇開始被人們注意,相關技術也迅速獲得專業技術范疇的...
    jopen 10年前    15510   

    張逸:并行分布式計算框架Spark的現狀與未來發展

    對于一個具有相當技術門檻與復雜度的平臺,Spark 從誕生到正式版本的成熟,經歷的時間如此之短,讓人感到驚詫。2009 年,Spark 誕生于伯克利大學 AMPLab,最開初屬于伯克利大學的研...
    jopen 10年前    36172   

    Spark vs. MapReduce 時間節約66%,計算節約40%

    本文將介紹基于物品的協同過濾推薦算法案例在TDW Spark與MapReudce上的實現對比,相比于MapReduce,TDW Spark執行時間減少了66%,計算成本降低了40%。 本文將介紹...
    jopen 10年前    17978   

    Spark 2.0.0 支持 Java 8 Lambda

    Spark是一個微型的Java Web框架,它的靈感來自于Sinatra,它的目的是讓你以最小的代價創建出一個Java Web應用。最近更新到2.0.0,支持Java 8 ,支持Lambda,D...
    jopen 10年前    12082   

    Spark 顛覆 MapReduce 保持的排序記錄

    在過去幾年,Apache Spark的采用以驚人的速度增加著,通常被作為MapReduce后繼,可以支撐數千節點規模的集群部署。在內存中數 據處理上,Apache Spark比MapReduce...
    jopen 10年前    13271   

    開源集群計算環境,Spark 1.1.0 發布

    Spark 1.1.0 發布,該版本帶來了一些操作性和性能的提升,主要是體現在核心模塊上。同時增加新的庫 MLlib 和 Spark SQL。支持 Python ,增加新的組件到 Spark 流...
    jopen 10年前    16979   

    數據科學家調查:受挫數據多樣性,吐槽 Hadoop

    經過無數權威媒體的反復轟炸,我們大致已經相信,數據科學家是21世紀最神秘最性感最多金的職業,他們是大數據時代數據炸彈的拆彈專家,企業數字化經營的發動機,他們的身價堪比NFL四分衛,而且,他們比昆...
    jopen 10年前    5848   
    1 2 3 4

    熱門問答

    熱門文檔

  • sesese色