Java正則表達式識別中文
從由漢字,大小寫英文,數字組成的語句中分離漢字:
public static void regxChinese()
{
String source = "桑德斯ABdD3ddd5222字符串轉換健康康可能34f豐富4f成小寫dx5kljfdsljDSknf943立即地方立即的ddd頂頂頂3";
String reg_charset = "([a-z]*)([A-Z]*)([0-9]*)([\u4E00-\u9FA5]*)";
Pattern p = Pattern.compile(reg_charset);
Matcher m = p.matcher(source);
String tag = "demo";
while (m.find())
{
Log.d(tag,"0~~~~~~~~~~~~~~~ " + m.group(0));
Log.d(tag,"1~~~ " + m.group(1));
Log.d(tag,"2~~~ " + m.group(2));
Log.d(tag,"3~~~ " + m.group(3));
Log.d(tag,"4~~~ " + m.group(4));
}
}以上方法也實現了將大寫英文,小寫英文,數字,中文的互相分離。
-------
參考:
</blockquote> 轉自:http://blog.csdn.net/yuleslie/article/details/7311147
本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!