• 0推薦
    46K 瀏覽

    每天近百億條用戶數據,攜程大數據高并發應用架構涅槃

    互聯網二次革命的移動互聯網時代,如何吸引用戶、留住用戶并深入挖掘用戶價值,在激烈的競爭中脫穎而出,是各大電商的重要課題。通過各類大數據對用戶進行研究,以數據驅動產品是解決這個課題的主要手段,攜程...
    0推薦
    45K 瀏覽

    每天TB級數據處理,攜程大數據高并發應用架構涅槃

    互聯網二次革命的移動互聯網時代,如何吸引用戶、留住用戶并深入挖掘用戶價值,在激烈的競爭中脫穎而出,是各大電商的重要課題。通過各類大數據對用戶進行研究,以數據驅動產品是解決這個課題的主要手段,攜程...
    0推薦
    111K 瀏覽

    直播彈幕審核系統和文本分析技術

    作為深受二次元人士歡迎的互動方式,彈幕已經從原來的動漫網站 Acfun?和 bilibili 向各類視頻和直播網站蔓延,但是彈幕存在大量低俗、色情、垃圾廣告、謾罵的內容,數量極為龐大,變形變換極...
    0推薦
    10K 瀏覽

    機器學習算法基礎概念

    FP-growth算法是一種用于發現數據集中頻繁模式的有效方法。FP-growth算法利用Apriori原則,執行更快。Apriori算法產生候選項集,然后掃描數據集來檢查他們是否頻繁。由于只對...
    0推薦
    60K 瀏覽

    劉鐵巖:博弈機器學習是什么?

    人工智能早就不是一個新詞了。早在六十年前,在達特茅斯學院舉行的一次會議就正式確立了人工智能(Artificial Intelligence)的名稱,以及研究領域和任務。在那之后,人工智能幾經沉浮...
    0推薦
    16K 瀏覽

    Meson:支持Netflix的機器學習工作流

    Netflix的目標是能預測顧客之所想觀看的電影,也即推薦預測。為了做到這一點,每天會運行大量機器學習工作流,而為了支撐創建這么多機器學習工作流和有效利用資源,Netflix的工程師開發了Meson。
    0推薦
    14K 瀏覽

    一個自動化解決數據科學問題的python工具

    在本文中,我們要經歷機器學習流程(pipline)設計中三個乏味的過程,但卻如此重要。之后,我們將演示工具來遍歷之前的過程,來體現智能自動化的機器學習流程設計,這樣我們就可以花時間在數據科學的更有趣的方面。
    0推薦
    16K 瀏覽

    教機器學習閱讀

    機器學會閱讀將是人工智能在處理和理解人類語言進程中一個里程碑式的事件,是一個真正AI必須達到的標準。最近一家叫做 Maluuba 的科技公司,號稱開發了目前最領先的機器閱讀理解系統EpiRead...
    0推薦
    23K 瀏覽

    Apache Spark 2.0前瞻:為機器學習模型注入持久性

    在所有的這些例子中,如果有了模型的持久性,那么保存和加載模型的問題將變得更容易解決。在即將到來的2.0版本中,通過基于DataFrame的API,Spark機器學習庫MLlib將實現幾乎完整的M...
    0推薦
    148K 瀏覽

    用Spark進行大數據處理之機器學習篇

    在本篇文章,作者將討論機器學習概念以及如何使用Spark MLlib來進行預測分析。后面將會使用一個例子展示Spark MLlib在機器學習領域的強悍。
    0推薦
    18K 瀏覽

    如何自己搭建釣魚網站檢測系統

    隨著電子商務、互聯網金融的快速發展,在利益的驅使下,從事“釣魚攻擊”的黑產呈逐漸上升趨勢。“釣魚攻擊”不僅對企業的品牌形象造成嚴重損害,還對用戶的賬戶安全、甚至資金安全構成了極大的威脅。
    0推薦
    61K 瀏覽

    六款強大的開源數據挖掘工具

    為您推薦六款強大的開源數據挖掘工具
    awnt2749 8年前   
    0推薦
    43K 瀏覽

    大數據與機器學習周報 第7期:谷歌CEO皮查伊稱人工智能將成為未來發展關鍵

    《IBM發布首個深度學習類腦超級計算平臺IBM TrueNorth》 :IBM 日前發布了一款用于深度學習的類腦超級計算平臺 IBM TrueNorth。新智元芯片專家群的幾位專家討論后認為:T...
    0推薦
    35K 瀏覽

    數據分析/數據挖掘/機器學習---- 必讀書目

    總結一下我讀過的機器學習/數據挖掘/數據分析方面的書,有的適合入門,有的適合進階,沒有按照層次排列,先總結一下,等總結的差不多了再根據入門--->進階分塊寫。下面列的書基本上我寫的都是讀完過的,...
    0推薦
    17K 瀏覽

    RDD、DataFrame和DataSet的區別是什么

    RDD、DataFrame和DataSet是容易產生混淆的概念,必須對其相互之間對比,才可以知道其中異同:DataFrame多了數據的結構信息,即schema。RDD是分布式的 Java對象的集...
    0推薦
    70K 瀏覽

    使用開源軟件快速搭建數據分析平臺

    使用開源軟件快速搭建數據分析平臺:最近,國內涌現出了不少數據分析平臺產品,例如魔鏡和數據觀。 這些產品的目標應該都是self service的B...
    BessMcfarla 8年前   
    0推薦
    42K 瀏覽

    機器學習算法選擇

    對于你的分類問題,你知道應該如何選擇哪一個機器學習算法么?當然,如果你真的在乎精度(accuracy),最好的方法就是通過交叉驗證(cross-validation)對各個算法一個個地進行測試,...
    了解點 8年前   
    0推薦
    42K 瀏覽

    機器學習算法選擇

    對于你的分類問題,你知道應該如何選擇哪一個機器學習算法么?當然,如果你真的在乎精度(accuracy),最好的方法就是通過交叉驗證(cross-validation)對各個算法一個個地進行測試,...
    ZackSoft 8年前   
    0推薦
    19K 瀏覽

    【R】如何確定最適合數據集的機器學習算法

    抽查(Spot checking)機器學習算法是指如何找出最適合于給定數據集的算法模型。本文中我將介紹八個常用于抽查的機器學習算法,文中還包括各個算法的 R 語言代碼,你可以將其保存并運用到下一...
    jjf_123456 8年前   
    0推薦
    39K 瀏覽

    基于日志文件的數據挖掘機理分析與研究

    摘 要: 介紹了數據挖掘的定義,分析了日志數據面臨的挑戰及對其進行挖掘的原因。討論了日志數據挖掘的需求,歸納了對日志數據挖掘的具體內容,總結了日志數據挖掘的具體
    MartinCudmo 8年前   
    1 2 3 4 5 6 7 8 9

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色