微軟推 Azure 機器學習工具:Algorithm Cheat Sheet

jopen 9年前發布 | 16K 次閱讀 機器學習

Azure Machine Learning Studio 有著大量的機器學習算法,現在你可以使用它來構建預測分析解決方案。這些算法可用于一般的機器學習:回歸分析、分類、聚類和異常檢測,且每一個都可以解決不同類型的機器學習問題。

現在的問題是,是否有什么工具之類的東西可幫助找出如何選擇一個合適的機器學習算法,并根據具體的方案?

微軟推 Azure 機器學習工具:Algorithm Cheat Sheet

點擊這里查看大圖。

點擊此處下載 Cheat Sheet:Microsoft Azure Machine Learning Algorithm Cheat Sheet

微軟 Azure 的機器學習 Algorithm Cheat Sheet 旨在幫助你篩選可用的機器學習算法,并選擇合適的一個來用于預測分析解決方案。Cheat Sheet 會詢問你這兩個問題:數據的性質、你工作想要解決的問題等,然后提出一個你可以嘗試的算法的建議。

Azure Machine Learning Studio 為你提供了靈活的體驗:嘗試一種算法,如果你對結果不滿意,那就嘗試另一種。(Azure 機器學習是免費的,也不需要什么許可,點擊這里試用。)這里有一個來自 Azure Machine Learning Gallery 的例子,該實驗是嘗試用幾種不同的算法用在相同的數據上,然后進行結果比較:Compare Multi-class Classifiers: Letter recognition

關于 Azure Machine Learning Studio

Azure Machine Learning Studio 提供了許多不同的先進機器學習算法來幫助你生成分析模型。首先,確定要執行的機器學習任務的常規類型,因為歸組在每個類別中的算法適合特定的預測任務。

選擇一種算法并配置其參數后,可以使用訓練模塊之一通過選定算法運行數據,也可以使用掃描參數循環訪問所有可能的參數并確定任務和數據的最佳配置。

學習算法的類別

Azure Machine Learning Studio 提供了以下各種類型的機器學習算法,它們按典型的機器學習方案來分組。

  • 異常檢測

異常檢測包含許多機器學習方面的重要任務,異常檢測技術適用于各種行業:

1. 標識可能具有欺詐性的事務。

  1. 學習指示發生了網絡入侵的模式
  2. 查找異常的患者群集
  3. 檢查輸入到系統的值 </code></pre>

    根據定義,異常屬于罕見事件,因此可能很難收集有代表性的數據樣本來進行建模。本節中包含的算法已經過專門設計,可以解決異常檢測的核心構建和訓練模型問題。

    此類別包括以下模塊:單類支持向量機、基于 PCA 的異常檢測。

    •  分類
      
      </li> </ul>

      分類算法用于預測單個數據實例的類或類別。例如,電子郵件篩選器使用二元分類來確定某封電子郵件是否為垃圾郵件。有兩種形式的分類任務。一種是旨在 預測兩個結果之一的二元分類,另一種是旨在預測多個結果之一的多類分類。分類算法的輸出為分類器,可用于預測新的(未標記)實例的標簽。

      類別 Modules References.Machine Learning.Initialize Model.Classification 包括以下模塊:多類決策林、多類決策森林、多類邏輯回歸、多類神經網絡、一對多多類、雙類平均感知器、雙類貝葉斯點機、雙類提升決策樹、雙類決策林、雙類 決策森林、雙類邏輯回歸、雙類神經網絡、雙類支持向量機、雙類局部深層支持向量機。

      •  聚類
        
        </li> </ul>

        聚類算法可以基于一組特征學習了解如何將一組項分組在一起。例如,聚類通常在文本分析中使用,以便將包含常見單詞的文本片段分組在一起。可以使用聚 類通過找出最接近的數據點,然后確定每種組合的質心或中心點,來分組未標記的數據。訓練算法后,可以使用它來預測數據實例所屬的聚類。

        類別 Modules References.Machine Learning.Initialize Model.Clustering 包括模塊:K 平均值聚類

        •  回歸
          
          </li> </ul>

          回歸算法是學習預測單個數據實例的實際函數字的算法。例如,房價預測器可以使用回歸算法來預測當前的房價。回歸算法確定要執行回歸函數的數據的每個特征分布。算法訓練用于預測標記數據的函數后,可用于預測新的(未標記)實例的標簽。

          類別 Modules References.Machine Learning.Initialize Model.Regression

          英文原文:Microsoft Azure Machine Learning Algorithm Cheat Sheet

          來自:http://geek.csdn.net/news/detail/32642
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!