java版結巴分詞:jieba-analysis
結巴分詞的原始版本為python編寫,目前該項目在github上的關注量為170, 打星727次(最新的數據以原倉庫為準),Fork238次,可以說已經有一定的用戶群。
結巴分詞(java版)只保留的原項目針對搜索引擎分詞的功能(cut_for_index、cut_for_search),詞性標注,關鍵詞提取沒有實現(今后如用到,可以考慮實現)。
簡介
支持分詞模式
- Search模式,用于對用戶查詢詞分詞
- Index模式,用于對索引文檔分詞
如何獲取
- git clone https://github.com/huaban/jieba-analysis.git
- cd jieba-analysis
- mvn package install ,安裝到本地倉庫
- 在你的 pom.xml 文件中添加以下依賴。
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!