機器學習庫,Mahout 0.10.0 發布

xg48 9年前發布 | 7K 次閱讀 Mahout

Apache Mahout 是 Apache Software Foundation (ASF) 開發的一個全新的開源項目,其主要目標是創建一些可伸縮的機器學習算法,供開發人員在 Apache 在許可下免費使用。該項目已經發展到了它的最二個年頭,目前只有一個公共發行版。Mahout 包含許多實現,包括集群、分類、CP 和進化程序。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到云中。

Mahout 項目是由 Apache Lucene(開源搜索)社區中對機器學習感興趣的一些成員發起的,他們希望建立一個可靠、文檔翔實、可伸縮的項目,在其中實現一些常見的用于集群和分類 的機器學習算法。該社區最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在發展中又并入了更多廣泛的機器學習方法。

Mahout 0.10.0 發布,此版本主要更新信息如下:

  • MAHOUT-1630: Incorrect SparseColumnMatrix.numSlices() causes IndexException in toString() (Oleg Nitz, smarthi)

    </li>

  • MAHOUT-1665: Update hadoop commands in example scripts (akm)

    </li>

  • MAHOUT-1676: Deprecate MLP, ConcatenateVectorsJob and ConcatenateVectorsReducer in the codebase (apalumbo) 

    </li>

  •  MAHOUT-1622: MultithreadedBatchItemSimilarities outputs incorrect number of similarities (Jesse Daniels, Anand Avati via smarthi)

    </li>

  • MAHOUT-1605: Make VisualizerTest locale independent (Frank Rosner, Anand Avati via smarthi)

    </li>

  • MAHOUT-1635: Getting an exception when I provide classification labels manually for Naive Bayes (apalumbo)

    </li>

  • MAHOUT-1662: Potential Path bug in SequenceFileVaultIterator breaks DisplaySpectralKMeans (Shannon Quinn)

    </li>

  • MAHOUT-1656: Change SNAPSHOT version from 1.0 to 0.10.0 (smarthi)

    </li>

  • MAHOUT-1593: cluster-reuters.sh does not work complaining java.lang.IllegalStateException (smarthi via akm)

    </li>

  • MAHOUT-1661: All Lanczos modules marked as @Deprecated and slated for removal in future releases (Shannon Quinn)

    </li>

  • MAHOUT-1638: H2O bindings fail at drmParallelizeWithRowLabels(...) (Anand Avati via apalumbo)

    </li>

  • MAHOUT-1667: Hadoop 1 and 2 profile in POM (sslavic)

    </li>

  • MAHOUT-1564: Naive Bayes Classifier for New Text Documents (apalumbo)

    </li> </ul>

    詳細信息請查看更新日志

    此版本已提供下載:

    https://github.com/apache/mahout/archive/mahout-0.10.0.zip


    Mahout 的目標還包括:

    • 建立一個用戶和貢獻者社區,使代碼不必依賴于特定貢獻者的參與或任何特定公司和大學的資金。

      </li>

    • 專注于實際用例,這與高新技術研究及未經驗證的技巧相反。

      </li>

    • 提供高質量文章和示例。

      </li> </ul> 來自:

       本文由用戶 xg48 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
       轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
       本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!