Airbnb發布開源的機器學習軟件包Aerosolve

jopen 9年前發布 | 9K 次閱讀 Aerosolve

Airbnb 是一個旅行房屋租賃網站,用戶可以通過該網站發布、搜索度假房屋租賃信息并完成在線預定程序,它成立于 2008 年 8 月,總部設在美國加州舊金山市。Airbnb 的用戶遍布 190 個國家的近 33000 個城市,發布的房屋租賃信息達到 50 多萬條,被時代周刊稱為“住房中的 EBay”。在 6 月 4 日舉行的 OpenAir 開發者大會上,Airbnb 發布了一個為人而設計的機器學習軟件包——Aerosolve

與其他的機器學習庫相比,Aerosolve 具有以下特點:

  • 特征呈現基于 thrift, 支持 Pairwise Ranking Loss 和單上下文的多條目呈現。在 Aerosolve 中,特征會按照邏輯分組,每一個組稱為一個特征簇,我們可以一次性地對整個特征組進行轉換,或者將兩個不同的特征簇組合到一起創建新的特征簇。每一個特征 向量(FeatureVector)有三種類型:stringFeatures、floatFeatures 和 denseFeatures。
  • 支持一種特征轉換語言, 讓用戶能夠對特征進行更多的控制。Aerosolve 將特征轉換包含在一個獨立的轉換模塊中,與模型解耦,用戶既能夠將轉換操作拆散使用,又可以提前轉換相關數據。例如,在一個應用程序中用戶可以在運行時上 下文確定之前對一個文集中的條目數據進行轉換和存儲,然后在運行時做上下文的轉換,并將轉換后的上下文與提前轉換的條目逐一進行聯合獲取最終的特征向量。 常用的轉換操作包括:列表轉換交叉轉換多尺度網格轉換
  • 人類友好的調試模型。模型目錄中包含很多模型,但是其中最主要的兩個是:線性模型和樣條模型,其他的都是試驗性的模型或者是為可推理模型創建轉換的子模型。
  • 獨立的輕量級 Java 推理代碼
  • 使用 Scala 代碼進行訓練
  • 簡單的圖片內容分析代碼,適合于圖片的排序或者排名。

需要注意的是,Aerosolve 適合于稀疏的、可推理的特征,例如搜索(搜索關鍵詞、過濾詞)或價格(房屋的數量、位置和價格)中通常會出現的特征;不適合非常密集的人類無法推理的特征,例如原始的像素集或者音頻樣本。

最后,Aerosolve 所需的制品托管在 bintray 上,如果你使用 Maven、SBT 或者 Gradle,那么需要將倉庫指向 bintray。如果想了解更多信息,可以點擊這里

來自: InfoQ

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!