• 0推薦
    45K 瀏覽

    流行的機器學習算法概述

    機器學習算法很多,并且它們自身又有很多延伸。因此,如何確定解決一個問題的最好算法是很困難的。 下面我們先說基于學習方式對算法的分類和算法之間的相似性,讓大家有個整體意識;接著再陳述各類算法。
    maysut 8年前   
    0推薦
    40K 瀏覽

    創業公司使用R語言搭建簡單的數據分析系統

    整個系統分為三個服務 一、數據源。這個可以是各種形式的數據庫。當然,你如果有高大上的Hadoop也是可以的。 二、分析引擎。就是R了,這里我們使用Rserve搭建一個服務。 三、分析...
    ihkm4462 8年前   
    0推薦
    47K 瀏覽

    機器學習實戰:模型評估和優化

    監督學習的主要任務就是用模型實現精準的預測。我們希望自己的機器學習模型在新數據(未被標注過的)上取得盡可能高的準確率。換句話說,也就是我們希望用訓練數據訓練得到的模型能適用于待測試的新數據。正是...
    0推薦
    26K 瀏覽

    淺談大數據應用研究的3個V

    To knowledge 是目標,手段還是 mining ,俗稱數據民工。每當大家講到大數據,都會不約而同的提到大數據幾個 V 的定義: Volume , Variety , Velocity ...
    0推薦
    20K 瀏覽

    史上最大機器學習數據集,雅虎對外開放了

    【導讀】:數據是機器學習研究的命門。訪問真正的大規模數據集,是一項傳統上由機器學習研究者和大公司的數據科學家所保有的特權,然而大多數學術研究人員缺無法觸及。2016年1月14日,雅虎實驗室對外發...
    0推薦
    29K 瀏覽

    機器學習之總結

    出于文本歸類和數據處理之需求,這段時間研究了下文本處理類的機器學習方面的東西。也快過年放假了,在此做一個總結和感受吧。
    0推薦
    15K 瀏覽

    美團是如何通過搜索排序優化提升轉化效果的

    美團的愿景是連接消費者和商家,而搜索在其中起著非常重要的作用。隨著業務的發展,美團的商家和團購數正在飛速增長。這一背景下,搜索排序的重要性顯得更加突出:排序的優化能幫助用戶更便捷地找到滿足其需求...
    TreBernardi 8年前   
    0推薦
    26K 瀏覽

    數據挖掘領域十大經典算法

    國際權威的學術組織the IEEE International Conference on Data Mining (ICDM) 早前評選出了數據挖掘領域的十大經典算法:C4.5, k-Mean...
    weixinde 8年前   
    0推薦
    22K 瀏覽

    Gradient Boosting算法簡介

    最近項目中涉及基于Gradient Boosting Regression 算法擬合時間序列曲線的內容,利用python機器學習包?scikit-learn 中的GradientBoosting...
    luofan 8年前   
    0推薦
    16K 瀏覽

    已經證實提高機器學習模型準確率的八大方法

    提升一個模型的表現有時很困難。如果你們曾經糾結于相似的問題,那我相信你們中很多人會同意我的看法。你會嘗試所有曾學習過的策略和算法,但模型正確率并沒有改善。你會覺得無助和困頓,這是 90% 的數據...
    0推薦
    45K 瀏覽

    文本數據的機器學習自動分類方法(上)

    【編者按】:隨著互聯網技術的迅速發展與普及,如何對浩如煙海的數據進行分類、組織和管理,已經成為一個具有重要用途的研究課題。而在這些數據中,文本數據又是數量最大的一類。以統計理論為基礎,利用機器學...
    0推薦
    42K 瀏覽

    基于深度機器學習算法DBNs的風險識別模型

    前言:最初關注深度機器學習是聽了NUS的汪晟博士關于深度機器學習平臺SIGNA的介紹,當時就發現深度機器學習是人工智能的一個革新的進步。但是由于從事的云計算和大數據方向的工作,所以平時只是作為自...
    jopen 8年前   
    0推薦
    46K 瀏覽

    基于深度機器學習算法DBNs的風險識別模型

    前言:最初關注深度機器學習是聽了NUS的汪晟博士關于深度機器學習平臺SIGNA的介紹,當時就發現深度機器學習是人工智能的一個革新的進步。但是由于從事的云計算和大數據方向的工作,所以平時只是作為自...
    jopen 8年前   
    0推薦
    44K 瀏覽

    數據挖掘學習筆記一:引論

    例1.1 數據挖掘把大型數據集轉換成知識。Google的Flu Trends(流感趨勢)使用特殊的搜索項作為流感活動的指示器。它發現了搜索流感相關信息的人數與實際具有流感癥狀的人數之間的緊密聯系...
    jopen 8年前   
    0推薦
    53K 瀏覽

    機器學習算法一覽

    提起筆來寫這篇博客,突然有點愧疚和尷尬。愧疚的是,工作雜事多,加之懶癌嚴重,導致這個系列一直沒有更新,向關注該系列的同學們道個歉。尷尬的是,按理說,機器學習介紹與算法一覽應該放在最前面寫,詳細的...
    jopen 8年前   
    0推薦
    18K 瀏覽

    8個經過證實的方法:提高機器學習模型的準確率

    提升一個模型的表現有時很困難。如果你們曾經糾結于相似的問題,那我相信你們中很多人會同意我的看法。你會嘗試所有曾學習過的策略和算法,但模型正確率并沒有改善。你會覺得無助和困頓,這是90%的數據科學...
    jopen 8年前   
    0推薦
    60K 瀏覽

    Orange-數據挖掘和機器學習軟件

    Orange(http://orange.biolab.si/)是一個基于組件的數據挖掘和機器學習軟件套裝,支持Python進行腳本開發。Orange由斯洛文尼亞大學計算與信息學系的生物信息實驗...
    jopen 8年前   
    0推薦
    12K 瀏覽

    統計機器學習——讓計算機學會吟詩作賦

    新年到,作為格律詩研究的第一步探索,微軟亞洲研究院推出了全新的絕句生成系統,為熱愛詩詞的人們帶來了樂趣。自然語言計算組的研究員們基于統計機器翻譯的方法,利用計算機對格律詩進行輔助創作。首先,創作...
    0推薦
    23K 瀏覽

    淺談機器學習中的規則化范數

    監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”,也就是在規則化參數的同時最小化誤差。最小化誤差是為了讓我們...
    jopen 9年前   
    0推薦
    24K 瀏覽

    構建機器學習系統的20個經驗教訓

    數據科學家對優化算法和模型以進一步發掘數據價值的追求永無止境。在這個過程中他們不僅需要總結前人的經驗教訓,還需要有自己的理解與見地,雖然后者取決于人的靈動性,但是前者卻是可以用語言來傳授的。最近...
    jopen 9年前   
    1 2 3 4 5 6 7 8 9

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色