• 0推薦
    62K 瀏覽

    nltk-比較中文文檔相似度

    nltk同時也能處理中文的場景,只要做如下改動: 使用中文分詞器(如我選用了結巴分詞) 對中文字符做編碼處理,使用unicode編碼方式 python的源碼編碼統一聲明為 gbk
    jopen 10年前   
    nltk  

    經驗分享,提升職場影響力

    投稿

    熱門問答

      熱門文檔

      • sesese色