solr5.3.1 添加中文分詞之mmseg4j

jopen 10年前發布 | 11K 次閱讀 Solr 搜索引擎

1，下載對應jar包，并拷貝到sorl服務器的lib目錄底下

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="d:\solr\my_dic"/>
        </analyzer>
    </fieldtype>
     
    <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
        </analyzer>
    </fieldtype>
     
    <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic" />
        </analyzer>
    </fieldtype>

其中 dicPath="d:\solr\my_dic" 是我們指定的詞庫路徑，詞庫文件都在這個文件夾底下，并且名字要以words開頭，以dic做后綴，例如 words_my.dic。作為演示，在詞庫里添加