java使用pinyin4j實現漢語轉拼音

cwf8 9年前發布 | 2K 次閱讀 Java

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
import cn.com.testClass.P;

/**

  • @className:PinyingUtil.java
  • @classDescription:拼音操作工具類
  • @author:xiayingjie
  • @createTime:2010-10-21 */

public class HanYuPinYinUtility {

/**
 * 將字符串轉換成拼音數組
 * 
 * @param src
 * @return
 */
public static String[] stringToPinyin(String src) {
    return stringToPinyin(src, false, null);
}
/**
 * 將字符串轉換成拼音數組
 * 
 * @param src
 * @return
 */
public static String[] stringToPinyin(String src,String separator) {
    return stringToPinyin(src, true, separator);
}

/**
 * 將字符串轉換成拼音數組
 * 
 * @param src
 * @param isPolyphone
 *            是否查出多音字的所有拼音
 * @param separator
 *            多音字拼音之間的分隔符
 * @return
 */
public static String[] stringToPinyin(String src, boolean isPolyphone,
        String separator) {
    // 判斷字符串是否為空
    if ("".equals(src) || null == src) {
        return null;
    }
    char[] srcChar = src.toCharArray();
    int srcCount = srcChar.length;
    String[] srcStr = new String[srcCount];

    for (int i = 0; i < srcCount; i++) {
        srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
    }
    return srcStr;
}

/**
 * 將單個字符轉換成拼音
 * 
 * @param src
 * @return
 */
public static String charToPinyin(char src, boolean isPolyphone,
        String separator) {
    // 創建漢語拼音處理類
    HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
    // 輸出設置,大小寫,音標方式
    defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

    StringBuffer tempPinying = new StringBuffer();

    // 如果是中文
    if (src > 128) {
        try {
            // 轉換得出結果
            String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
                    defaultFormat);

            // 是否查出多音字,默認是查出多音字的第一個字符
            if (isPolyphone && null != separator) {
                for (int i = 0; i < strs.length; i++) {
                    tempPinying.append(strs[i]);
                    if (strs.length != (i + 1)) {
                        // 多音字之間用特殊符號間隔起來
                        tempPinying.append(separator);
                    }
                }
            } else {
                tempPinying.append(strs[0]);
            }

        } catch (BadHanyuPinyinOutputFormatCombination e) {
            e.printStackTrace();
        }
    } else {
        tempPinying.append(src);
    }

    return tempPinying.toString();

}

public static String hanziToPinyin(String hanzi){
    return hanziToPinyin(hanzi," ");
}
/**
 * 將漢字轉換成拼音
 * @param hanzi
 * @param separator
 * @return
 */
public static String hanziToPinyin(String hanzi,String separator){
        // 創建漢語拼音處理類
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        // 輸出設置,大小寫,音標方式
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

        String pinyingStr="";
        try {
            pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }   
        return pinyingStr;
}
/**
 * 將字符串數組轉換成字符串
 * @param str 
 * @param separator 各個字符串之間的分隔符
 * @return
 */
public static String stringArrayToString(String[] str, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < str.length; i++) {
        sb.append(str[i]);
        if (str.length != (i + 1)) {
            sb.append(separator);
        }
    }
    return sb.toString();
}
/**
 * 簡單的將各個字符數組之間連接起來
 * @param str
 * @return
 */
public  static String stringArrayToString(String[] str){
    return stringArrayToString(str,"");
}
/**
 * 將字符數組轉換成字符串
 * @param str 
 * @param separator 各個字符串之間的分隔符
 * @return
 */
public static String charArrayToString(char[] ch, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < ch.length; i++) {
        sb.append(ch[i]);
        if (ch.length != (i + 1)) {
            sb.append(separator);
        }
    }
    return sb.toString();
}

/**
 * 將字符數組轉換成字符串
 * @param str 
 * @return
 */
public static String charArrayToString(char[] ch) {
    return charArrayToString(ch," ");
}

/**
 * 取漢字的首字母
 * @param src
 * @param isCapital 是否是大寫
 * @return
 */
public static char[]  getHeadByChar(char src,boolean isCapital){
    //如果不是漢字直接返回
    if (src <= 128) {
        return new char[]{src};
    }
    //獲取所有的拼音
    String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
    //創建返回對象
    int polyphoneSize=pinyingStr.length;
    char [] headChars=new char[polyphoneSize];
    int i=0;
    //截取首字符
    for(String s:pinyingStr){
        char headChar=s.charAt(0);
        //首字母是否大寫,默認是小寫
        if(isCapital){
            headChars[i]=Character.toUpperCase(headChar);
         }else{
            headChars[i]=headChar;
         }
        i++;
    }

    return headChars;
}
/**
 * 取漢字的首字母(默認是大寫)
 * @param src
 * @return
 */
public static char[]  getHeadByChar(char src){
    return getHeadByChar(src,true);
}
/**
 * 查找字符串首字母
 * @param src 
 * @return
 */
public  static String[] getHeadByString(String src){
    return getHeadByString( src, true);
}
/**
 * 查找字符串首字母
 * @param src 
 * @param isCapital 是否大寫
 * @return
 */
public  static String[] getHeadByString(String src,boolean isCapital){
    return getHeadByString( src, isCapital,null);
}
/**
 * 查找字符串首字母
 * @param src 
 * @param isCapital 是否大寫
 * @param separator 分隔符
 * @return
 */
public  static String[] getHeadByString(String src,boolean isCapital,String separator){
    char[]chars=src.toCharArray();
    String[] headString=new String[chars.length];
    int i=0;
    for(char ch:chars){

        char[]chs=getHeadByChar(ch,isCapital);
        StringBuffer sb=new StringBuffer();
        if(null!=separator){
            int j=1;

            for(char ch1:chs){
                sb.append(ch1);
                if(j!=chs.length){
                    sb.append(separator);
                }
                j++;
            }
        }else{
            sb.append(chs[0]);
        }
        headString[i]=sb.toString();
        i++;
    }
    return headString;
}

public static void main(String[] args) {
    //將字符串轉換成拼音數組
    String test1[]=stringToPinyin("曹順寫爪哇");
    String test1st="";
    for(int i=0;i<test1.length;i++){
        test1st+=test1[i];
    }
    P.S(test1st);

    //將字符串轉換成拼音數組,以逗號分隔
    String test2[]=stringToPinyin("曹順寫爪哇",",");
    String test2st="";
    for(int i=0;i<test2.length;i++){
        test2st+="||||"+test2[i];
    }
    P.S(test2st);

    //將漢字轉換成拼音
    P.S("將漢字轉換成拼音  曹順寫爪哇 ---->>>: "+hanziToPinyin("曹順寫爪哇!"," "));
}

}</pre>

 本文由用戶 cwf8 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!