C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序

jopen 11年前發布 | 31K 次閱讀 C# 算法

用C#寫了個漢字轉拼音的小工具,和網上大部分工具不同,這個通過分詞算法,解決了多音字的問題,并且提供聲調,可開可關。

如題,用"銀行 行不行 行家說了算"舉例,如果轉拼音卻不能識別多音字,就慘了。

而這個小工具的效果如圖:

C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序

實現了3種分詞算法:

  • 正向最大匹配
  • 反向最大匹配
  • 雙向最大匹配
    (這個雙向匹配的歧義處理辦法,還是本人創新。。。) </p>

    C#漢字轉拼音,可識別多音字,帶聲調,提供正向、逆向、雙向分詞算法的小程序


    軟件下載:
     http://pan.baidu.com/s/1mTg3T 

    -----------------分割線---------------------

    這里,不得不提一下分詞算法這個事情。

    不過都寫在這就太長了,還是放到下一篇再談。

    -----------------源代碼(含生成好的程序)--------------------

    百度網盤:
    http://pan.baidu.com/s/1ED1Ls 

    騰訊微云:
    http://url.cn/PnnMOU

    使用注意:

  • bin/release目錄下,已經包含了生成的軟件。 </p>

    * 顯示拼音時,因為詞庫的中文單字非常不全,我引用了微軟的ChnCharInfo.dll,來獲得一些單字拼音。這個庫是要下載Visual Studio International Pack安裝到系統才會有的。

    不過你可以直接從bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2個文件也不能刪掉 ChnCharInfo.xml和zh-CN目錄下的 ChnCharInfo.resources.dll
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!