Java正則表達式識別中文
從由漢字,大小寫英文,數字組成的語句中分離漢字:
public static void regxChinese() { String source = "桑德斯ABdD3ddd5222字符串轉換健康康可能34f豐富4f成小寫dx5kljfdsljDSknf943立即地方立即的ddd頂頂頂3"; String reg_charset = "([a-z]*)([A-Z]*)([0-9]*)([\u4E00-\u9FA5]*)"; Pattern p = Pattern.compile(reg_charset); Matcher m = p.matcher(source); String tag = "demo"; while (m.find()) { Log.d(tag,"0~~~~~~~~~~~~~~~ " + m.group(0)); Log.d(tag,"1~~~ " + m.group(1)); Log.d(tag,"2~~~ " + m.group(2)); Log.d(tag,"3~~~ " + m.group(3)); Log.d(tag,"4~~~ " + m.group(4)); } }
以上方法也實現了將大寫英文,小寫英文,數字,中文的互相分離。
-------
參考:
</blockquote> 轉自:http://blog.csdn.net/yuleslie/article/details/7311147
本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!