歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux編程 >> Linux編程

Java正則表達式識別中文

從由漢字,大小寫英文,數字組成的語句中分離漢字:
  1. public static void regxChinese()  
  2.    {  
  3.        String source = "桑德斯ABdD3ddd5222字符串轉換健康康可能34f豐富4f成小寫dx5kljfdsljDSknf943立即地方立即的ddd頂頂頂3";  
  4.        String reg_charset = "([a-z]*)([A-Z]*)([0-9]*)([\u4E00-\u9FA5]*)";  
  5.        Pattern p = Pattern.compile(reg_charset);  
  6.        Matcher m = p.matcher(source);  
  7.        String tag = "demo";  
  8.        while (m.find())  
  9.        {  
  10.            Log.d(tag,"0~~~~~~~~~~~~~~~ " +  m.group(0));  
  11.            Log.d(tag,"1~~~ " +  m.group(1));  
  12.            Log.d(tag,"2~~~ " +  m.group(2));  
  13.            Log.d(tag,"3~~~ " +  m.group(3));  
  14.            Log.d(tag,"4~~~ " +  m.group(4));  
  15.        }  
  16.    }  

以上方法也實現了將大寫英文,小寫英文,數字,中文的互相分離。

Copyright © Linux教程網 All Rights Reserved