• 0推薦
    61K 瀏覽

    大數據處理框架Apache Spark入門

    Apache Spark是一個圍繞速度、易用性和復雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,并于2010年成為Apache的開源項目之一。
    0推薦
    17K 瀏覽

    Apache Spark在大規模分布式自然語言處理的應用

    我們TripAdvisor公司擁有大量的用戶評價數據,據最近的一次公告,大約有幾億條。我是從事機器學習相關的工作,在機器學習中我們常喜歡做的一件事就是堆砌大量數據來分析。
    0推薦
    20K 瀏覽

    提供程序使用 Apache Spark 的基礎:Spark Kernel

    Spark Kernel 的最主要目標:提供基礎給交互應用程序聯系和使用 Apache Spark。
    0推薦
    23K 瀏覽

    Apache Spark 設計與實現

    文主要討論 Apache Spark 的設計與實現,重點關注其設計思想、運行原理、實現架構及性能調優,附帶討論與 Hadoop MapReduce 在設計與實現上的區別。不喜歡將該文檔稱之為“源...
    0推薦
    62K 瀏覽

    Apache Spark入門攻略

    本文聚焦Apache Spark入門,了解其在大數據領域的地位,覆蓋Apache Spark的安裝及應用程序的建立,并解釋一些常見的行為和操作。
    0推薦
    27K 瀏覽

    使用Apache Spark分析豆瓣電影數據

    上周在看豆瓣的時候,看到有豆列推薦類似豆瓣250的電影,剛好最近在學Berkeley 的Scalable Machine Learning這門課程,接觸了下Spark的基本的操作,然后就想要不然...
    0推薦
    62K 瀏覽

    用Apache Spark進行大數據處理——第一部分:入門介紹

    Apache Spark是一個圍繞速度、易用性和復雜分析構建的大數據處理框架。最初在2009年由加州大學伯克利分校的AMPLab開發,并于2010年成為Apache的開源項目之一。 與Hado...
    0推薦
    21K 瀏覽

    最夯的大數據分析工具-Apache Spark

    大家好!我是貓大,大家還記得我的好友咪咪(那位想要知道自己養的貓,會不會抓老鼠的那位愛貓人士)嗎?在過去文章什么 ? SVM會賺錢 !中貓大介紹了SVM的概念,以及如何通過LIBSVM,幫助使用...
    0推薦
    54K 瀏覽

    Apache Spark 的R語言前端:SparkR

    SparkR是一個R語言包提供了一個輕量級的前端,用于從R語言中使用Apache Spark。SparkR通過RDD類暴露Spark API,允許用戶以交互方式在集群上從 R shell 運行jobs 。

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色