登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
中文分詞
(共
60
篇經驗)
0
推薦
44K
瀏覽
中文分詞的原理與實踐
中文分詞問題是絕大多數中文信息處理的基礎問題,在搜索引擎、推薦系統(尤其是相關主題推薦)、大量文本自動分類等方面,一個好的分詞系統是整個系統成功的關鍵。
jopen
10年前
中文分詞
0
推薦
36K
瀏覽
PHP 中文分詞包:phpSplit
phpSplit 是一個基于php開發的中文分詞庫。
jopen
10年前
中文分詞
phpSplit
0
推薦
38K
瀏覽
Jieba分詞Go語言版本:GoJieba
GoJieba 是 Jieba 分詞的 Go 語言版本分詞庫。
jopen
10年前
中文分詞
Jieba
0
推薦
70K
瀏覽
HanLP中文分詞solr插件
HanLP中文分詞solr插件 基于HanLP,支持Solr5.x,兼容Lucene5.x
xcxc
10年前
中文分詞
HanLP
0
推薦
35K
瀏覽
CWSharp - .Net中英文分詞組件
CWSharp 是 .Net 的中英文分詞組件。
mmntt
10年前
中文分詞
CWSharp
0
推薦
45K
瀏覽
垂直搜索引擎中的分詞系統
國內垂直領域的電商或者信息分享類應用都處于高速發展期,其對內容快速搜索的需求越來越強烈,對于能適應自己業務應用的搜索引擎解決方案也越來越 重視。同時,通用的可選開源搜索引擎框架或解決方案也越...
jopen
10年前
搜索引擎
中文分詞
0
推薦
295K
瀏覽
中科院NLPIR中文分詞java版
摘要:為解決中文搜索的問題,最開始使用PHP版開源的SCWS,但是處理人名和地名時,會出現截斷人名地名出現錯誤。開始使用NLPIR分詞,在分詞準確性上效果要比SCWS好。本文介紹如何在windo...
jopen
10年前
中文分詞
0
推薦
150K
瀏覽
Spark + ansj 對大數據量中文進行分詞
目前的分詞器大部分都是單機服務器進行分詞,或者使用hadoop mapreduce對存儲在hdfs中大量的數據文本進行分詞。由于mapreduce的速度較慢,相對spark來說代碼書寫較繁瑣。本...
x286
10年前
中文分詞
Spark
0
推薦
75K
瀏覽
9大Java開源中文分詞器的使用方法和分詞效果對比
本文的目標有兩個: 1、學會使用9大Java開源中文分詞器 2、對比分析9大Java開源中文分詞器的分詞效果
yn6e
10年前
Java
中文分詞
0
推薦
200K
瀏覽
自然語言處理:HanLP
HanLP是由一系列模型與算法組成的Java工具包,目標是促進自然語言處理在生產環境中的應用。HanLP具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點。
jopen
10年前
中文分詞
HanLP
0
推薦
48K
瀏覽
詞云可視化——中文分詞與詞云制作
近日在微博上大家都在問《個性化詞云》制作方法。 下面簡單介紹實現步驟和思路: 隨著微博研究的深入,社會網絡分析和可視化技術的需要,面臨中文處理問題,開始鉆研文本挖掘的問題,過去的...
jopen
10年前
中文分詞
0
推薦
175K
瀏覽
利用IKAnalyzer中文分詞,計算句子相似度
IKAnalyzer是一個開源的,基于java語言開發的輕量級的中文分詞工具包。以開源項目Luence為應用主體的,結合詞典分詞和文法分析算法的中文分詞組件。獨立于Lucene項目,同時...
jopen
11年前
中文分詞
IKanalyzer
0
推薦
34K
瀏覽
用MeCab打造一套實用的中文分詞系統
MeCab是一套日文分詞(形態分析)和詞性標注系統(Yet Another Part-of-Speech and Morphological Analyzer), rick曾經在這里分享過MeC...
jopen
11年前
中文分詞
0
推薦
102K
瀏覽
NLP中的中文分詞技術
隨 著需求的變化和技術的發展,互聯網企業對數據的分析越來越深入,尤其是自然語言處理處理領域,近幾年,在搜索引擎、數據挖掘、推薦系統等應用方面,都向前 邁出了堅實的步伐。自然語言處理領域涉及的技術...
jopen
11年前
中文分詞
0
推薦
18K
瀏覽
"結巴"中文分詞的iOS版本
結巴中文分詞的 iOS 版本。
jopen
11年前
移動開發
中文分詞
iOS開發
0
推薦
62K
瀏覽
"結巴"中文分詞的Node.js版本
NodeJieba只是CppJieba簡單包裝而成的node擴展,用來進行中文分詞。
jopen
11年前
中文分詞
0
推薦
80K
瀏覽
"結巴"中文分詞的C++版本:CppJieba
CppJieba是"結巴"中文分詞的C++版本
jopen
11年前
中文分詞
0
推薦
56K
瀏覽
中文分詞庫:TextRank4ZH
TextRank4ZH 用于自動從中文文本中提取關鍵詞和摘要,基于 TextRank 算法,使用 Python 編寫。
jopen
11年前
中文分詞
TextRank4ZH
0
推薦
111K
瀏覽
"結巴"中文分詞的R語言版本:jiebaR
"結巴"中文分詞的R語言版本,支持最大概率法(Maximum Probability),隱式馬爾科夫模型(Hidden Markov Model),索引模型(QuerySegment),混合模型...
jopen
11年前
中文分詞
jiebaR
0
推薦
24K
瀏覽
Go中文分詞:sego
詞典用前綴樹實現,分詞器算法為基于詞頻的最短路徑加動態規劃。
jopen
11年前
中文分詞
sego
1
2
3
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色