機器學習庫,Apache Mahout 0.11.1 發布

jopen 9年前發布 | 8K 次閱讀 Apache Mahout

Apache Mahout 是 Apache Software Foundation (ASF) 開發的一個全新的開源項目,其主要目標是創建一些可伸縮的機器學習算法,供開發人員在 Apache 在許可下免費使用。該項目已經發展到了它的最二個年頭,目前只有一個公共發行版。Mahout 包含許多實現,包括集群、分類、CP 和進化程序。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到云中。

Mahout 項目是由 Apache Lucene(開源搜索)社區中對機器學習感興趣的一些成員發起的,他們希望建立一個可靠、文檔翔實、可伸縮的項目,在其中實現一些常見的用于集群和分類 的機器學習算法。該社區最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在發展中又并入了更多廣泛的機器學習方法。

Mahout 的目標還包括:

  • 建立一個用戶和貢獻者社區,使代碼不必依賴于特定貢獻者的參與或任何特定公司和大學的資金。

    </li>

  • 專注于實際用例,這與高新技術研究及未經驗證的技巧相反。

    </li>

  • 提供高質量文章和示例。

    </li> </ul> Apache Mahout PMC 發布了 Mahout 0.11.1 版本,現已提供下載:

    http://www.apache.org/dist/mahout/0.11.1/ 

    Mahout 0.11.0 擴展了與 Spark 版本的兼容性,引入了一些新特性和 bug 修復。

    Mahout 0.11.1 相比 Mahout 0.11.0 改進如下:

    • Spark 1.4+ 支持

      </li>

    • Dot Product 4x 性能提升

      </li>

    • 基于 matrix flaors 的 %*% 優化

      </li> </ul>

      詳細改進請看發行說明


       本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
       轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
       本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!