java版結巴分詞:jieba-analysis

jopen 11年前發布 | 123K 次閱讀 中文分詞 jieba-analysis

結巴分詞的原始版本為python編寫,目前該項目在github上的關注量為170, 打星727次(最新的數據以原倉庫為準),Fork238次,可以說已經有一定的用戶群。

結巴分詞(java版)只保留的原項目針對搜索引擎分詞的功能(cut_for_index、cut_for_search),詞性標注,關鍵詞提取沒有實現(今后如用到,可以考慮實現)。

簡介

支持分詞模式

  • Search模式,用于對用戶查詢詞分詞
  • Index模式,用于對索引文檔分詞

如何獲取

  • git clone https://github.com/huaban/jieba-analysis.git
  • cd jieba-analysis
  • mvn package install ,安裝到本地倉庫
  • 在你的 pom.xml 文件中添加以下依賴。

項目主頁:http://www.baiduhome.net/lib/view/home/1375802340609

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!