• 0推薦
    44K 瀏覽

    中文分詞的原理與實踐

    中文分詞問題是絕大多數中文信息處理的基礎問題,在搜索引擎、推薦系統(尤其是相關主題推薦)、大量文本自動分類等方面,一個好的分詞系統是整個系統成功的關鍵。
    jopen 10年前   
    0推薦
    36K 瀏覽

    PHP 中文分詞包:phpSplit

    phpSplit 是一個基于php開發的中文分詞庫。
    jopen 10年前   
    0推薦
    38K 瀏覽

    Jieba分詞Go語言版本:GoJieba

    GoJieba 是 Jieba 分詞的 Go 語言版本分詞庫。
    jopen 10年前   
    0推薦
    70K 瀏覽

    HanLP中文分詞solr插件

    HanLP中文分詞solr插件 基于HanLP,支持Solr5.x,兼容Lucene5.x
    xcxc 10年前   
    0推薦
    35K 瀏覽

    CWSharp - .Net中英文分詞組件

    CWSharp 是 .Net 的中英文分詞組件。
    mmntt 10年前   
    0推薦
    45K 瀏覽

    垂直搜索引擎中的分詞系統

    國內垂直領域的電商或者信息分享類應用都處于高速發展期,其對內容快速搜索的需求越來越強烈,對于能適應自己業務應用的搜索引擎解決方案也越來越 重視。同時,通用的可選開源搜索引擎框架或解決方案也越...
    jopen 10年前   
    0推薦
    295K 瀏覽

    中科院NLPIR中文分詞java版

    摘要:為解決中文搜索的問題,最開始使用PHP版開源的SCWS,但是處理人名和地名時,會出現截斷人名地名出現錯誤。開始使用NLPIR分詞,在分詞準確性上效果要比SCWS好。本文介紹如何在windo...
    jopen 10年前   
    0推薦
    150K 瀏覽

    Spark + ansj 對大數據量中文進行分詞

    目前的分詞器大部分都是單機服務器進行分詞,或者使用hadoop mapreduce對存儲在hdfs中大量的數據文本進行分詞。由于mapreduce的速度較慢,相對spark來說代碼書寫較繁瑣。本...
    x286 10年前   
    0推薦
    75K 瀏覽

    9大Java開源中文分詞器的使用方法和分詞效果對比

    本文的目標有兩個: 1、學會使用9大Java開源中文分詞器 2、對比分析9大Java開源中文分詞器的分詞效果
    yn6e 10年前   
    0推薦
    200K 瀏覽

    自然語言處理:HanLP

    HanLP是由一系列模型與算法組成的Java工具包,目標是促進自然語言處理在生產環境中的應用。HanLP具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點。
    jopen 10年前   
    0推薦
    48K 瀏覽

    詞云可視化——中文分詞與詞云制作

    近日在微博上大家都在問《個性化詞云》制作方法。 下面簡單介紹實現步驟和思路: 隨著微博研究的深入,社會網絡分析和可視化技術的需要,面臨中文處理問題,開始鉆研文本挖掘的問題,過去的...
    jopen 10年前   
    0推薦
    175K 瀏覽

    利用IKAnalyzer中文分詞,計算句子相似度

    IKAnalyzer是一個開源的,基于java語言開發的輕量級的中文分詞工具包。以開源項目Luence為應用主體的,結合詞典分詞和文法分析算法的中文分詞組件。獨立于Lucene項目,同時...
    jopen 11年前   
    0推薦
    34K 瀏覽

    用MeCab打造一套實用的中文分詞系統

    MeCab是一套日文分詞(形態分析)和詞性標注系統(Yet Another Part-of-Speech and Morphological Analyzer), rick曾經在這里分享過MeC...
    jopen 11年前   
    0推薦
    102K 瀏覽

    NLP中的中文分詞技術

    隨 著需求的變化和技術的發展,互聯網企業對數據的分析越來越深入,尤其是自然語言處理處理領域,近幾年,在搜索引擎、數據挖掘、推薦系統等應用方面,都向前 邁出了堅實的步伐。自然語言處理領域涉及的技術...
    jopen 11年前   
    0推薦
    18K 瀏覽

    "結巴"中文分詞的iOS版本

    結巴中文分詞的 iOS 版本。
    0推薦
    62K 瀏覽

    "結巴"中文分詞的Node.js版本

    NodeJieba只是CppJieba簡單包裝而成的node擴展,用來進行中文分詞。
    jopen 11年前   
    0推薦
    80K 瀏覽

    "結巴"中文分詞的C++版本:CppJieba

    CppJieba是"結巴"中文分詞的C++版本
    jopen 11年前   
    0推薦
    56K 瀏覽

    中文分詞庫:TextRank4ZH

    TextRank4ZH 用于自動從中文文本中提取關鍵詞和摘要,基于 TextRank 算法,使用 Python 編寫。
    jopen 11年前   
    0推薦
    111K 瀏覽

    "結巴"中文分詞的R語言版本:jiebaR

    "結巴"中文分詞的R語言版本,支持最大概率法(Maximum Probability),隱式馬爾科夫模型(Hidden Markov Model),索引模型(QuerySegment),混合模型...
    jopen 11年前   
    0推薦
    24K 瀏覽

    Go中文分詞:sego

    詞典用前綴樹實現,分詞器算法為基于詞頻的最短路徑加動態規劃。
    jopen 11年前   
    1 2 3

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色