機器學習庫,Apache Mahout 0.11.1 發布
Apache Mahout 是 Apache Software Foundation (ASF) 開發的一個全新的開源項目,其主要目標是創建一些可伸縮的機器學習算法,供開發人員在 Apache 在許可下免費使用。該項目已經發展到了它的最二個年頭,目前只有一個公共發行版。Mahout 包含許多實現,包括集群、分類、CP 和進化程序。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到云中。
Mahout 項目是由 Apache Lucene(開源搜索)社區中對機器學習感興趣的一些成員發起的,他們希望建立一個可靠、文檔翔實、可伸縮的項目,在其中實現一些常見的用于集群和分類 的機器學習算法。該社區最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在發展中又并入了更多廣泛的機器學習方法。
Mahout 的目標還包括:
-
建立一個用戶和貢獻者社區,使代碼不必依賴于特定貢獻者的參與或任何特定公司和大學的資金。
</li> -
專注于實際用例,這與高新技術研究及未經驗證的技巧相反。
</li> -
提供高質量文章和示例。
</li> </ul> Apache Mahout PMC 發布了 Mahout 0.11.1 版本,現已提供下載:http://www.apache.org/dist/mahout/0.11.1/
Mahout 0.11.0 擴展了與 Spark 版本的兼容性,引入了一些新特性和 bug 修復。
Mahout 0.11.1 相比 Mahout 0.11.0 改進如下: