Jieba分詞Go語言版本:GoJieba

jopen 9年前發布 | 38K 次閱讀 Jieba 中文分詞

GoJieba 是 Jieba 分詞的 Go 語言版本分詞庫。

用法

go get github.com/yanyiwu/gojieba

示例代碼請見 example/demo.go

cd example
go run demo.go

之所以需要先 cd 到 example 目錄下,是因為 demo.go 里面有寫死的字典相對路徑。

輸出結果:

全模式: 我/來到/北京/清華/清華大學/華大/大學
精確模式: 我/來到/北京/清華大學
新詞識別: 他/來到/了/網易/杭研/大廈
搜索引擎模式: 小明/碩士/畢業/于/中國/中國科學院/科學/科學院/學院/計算所/,/后/在/日本/日本京都大學/京都/京都大學/大學/深造

性能測試

性能不錯,因為 GoJieba 本身就是封裝了 C++ 版本的 CppJieba 而成, 對比測試了一下,耗時大概是CppJieba 的 1.2 倍。 鑒于 CppJieba 性能還不錯(詳見jieba-performance-comparison), 所以 GoJieba性能還是可以的, 對于講究性能的地方還是可以試試的。

項目主頁:http://www.baiduhome.net/lib/view/home/1442321779087

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!