日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > java >内容正文

java

java 汉字处理_Java汉字处理

發布時間:2023/12/31 java 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java 汉字处理_Java汉字处理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、字符串長度

String s1 = "我是中國人";

String s2 = "imchinese";

String s3 = "im中國人";

System.out.println(s1+":"+new String(s1).length());

System.out.println(s2+":"+new String(s2).length());

System.out.println(s3+":"+new String(s3).length());

輸出結果:

我是中國人:5

imchinese:9

im中國人:5

結論:字符串里如果有雙字節的字符java就把每個字符都按雙字節編碼,如果都是單字節的字符就按單字節編碼。

2、提取字符串中的漢字

String str = "af我是kz中h國m人ig";

char ch[] = str.toCharArray();

for (int i = 0; i < ch.length; i++) {

if (ch[i] > 255) {

System.out.print(ch[i]);

}

}

輸出結果:

我是中國人

3、打印漢字編碼

(1)打印漢字的unicode編碼

char ch = "中";

System.out.println(Integer.toHexString(ch));

輸出結果:

4e2d

(2)打印漢字的GBK編碼

String str = "中";

byte[] bt = str.getBytes("GBK");

System.out.println(Integer.toHexString(bt[0]).substring(6)

+Integer.toHexString(bt[1]).substring(6));

輸出結果:

d6d0

說明:java內部使用的是unicode編碼,漢字的Unicode編碼范圍為/u4E00-/u9FA5 或/uF900-/uFA2D,如果不在這個范圍內就不是漢字。我們用char定義一個變量,如char ch="中"; 這時,ch是Unicode編碼的。GBK編碼與unicode編碼是不同的兩種編碼方式,因此它們打印出的值是不一樣的。GBK的整體編碼范圍是為0x8140-0xFEFE,不包括低字節是0x7F的組合。高字節范圍是0x81-0xFE,低字節范圍是0x40-7E和0x80-0xFE。

4、用兩個byte組成一個漢字

byte bb[] = new byte[2];

bb[0] = -42;

bb[1] = -48;

String str = new String(bb);

System.out.println(str);

輸出結果:

總結

以上是生活随笔為你收集整理的java 汉字处理_Java汉字处理的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。