Java匹配中文的正則表達式
[\u4E00-\u9FA5]漢字﹐[\uFE30-\uFFA0]全角字符 [\u4E00-\u9FA5]漢字﹐[\uFE30-\uFFA0]全角字符所以說 ,Java的正則表達式是可以匹配中文字符的,同時,用中文字符來寫表達式也是可以的.
正則表達式
public static void regxChinese(){ // 要匹配的字符串 String source = "<span title='5 星級酒店' class='dx dx5'>"; // 將上面要匹配的字符串轉換成小寫 // source = source.toLowerCase(); // 匹配的字符串的正則表達式 String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'"; Pattern p = Pattern.compile(reg_charset); Matcher m = p.matcher(source); while (m.find()) { System.out.println(m.group(1)); } } public static void regxChinese(){ // 要匹配的字符串 String source = "<span title='5 星級酒店' class='dx dx5'>"; // 將上面要匹配的字符串轉換成小寫 // source = source.toLowerCase(); // 匹配的字符串的正則表達式 String reg_charset = "<span[^>]*?title=\'([0-9]*[\\s|\\S]*[\u4E00-\u9FA5]*)\'[\\s|\\S]*class=\'[a-z]*[\\s|\\S]*[a-z]*[0-9]*\'"; Pattern p = Pattern.compile(reg_charset); Matcher m = p.matcher(source); while (m.find()) { System.out.println(m.group(1)); } }
本文由用戶 cp66 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!