日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Unicode与GBK互转

發布時間:2023/12/14 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Unicode与GBK互转 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

 <<Unicode與GBK互轉>>
            Tags: encoding,c

1. gb2312

規定: 一個小于127的字符的意義與原來相同, 但兩個大于127的字符連在一起時, 就表示
一個漢字, 前面的一個字節(他稱之為高字節)從0xA1用到 0xF7, 后面一個字節(低字節)
從0xA1到0xFE, 這樣我們就可以組合出大約7000多個簡體漢字了. 在這些編碼里, 我們還
把數學符號,羅馬希臘的 字母,日文的假名們都編進去了, 連在 ASCII 里本來就有的數字
,標點,字母都統統重新編了兩個字節長的編碼, 這就是常說的"全角"字符, 而原來在127
號以下的那些就叫"半角"字符了.

中國人民看到這樣很不錯, 于是就把這種漢字方案叫做 "GB2312". GB2312 是對 ASCII
的中文擴展.


2. GBK

但是中國的漢字太多了, 我們很快就就發現有許多人的人名沒有辦法在這里打出來, 特別
是某些很會麻煩別人的國家領導人. 于是我們不得不繼續把 GB2312 沒有用到的碼位找出
來老實不客氣地用上.

后來還是不夠用, 于是干脆不再要求低字節一定是127號之后的內碼, 只要第一個字節是
大于127就固定表示這是一個漢字的開始, 不管后面跟的是不是擴展字 符集里的內容. 結
果擴展之后的編碼方案被稱為 "GBK" 標準, GBK 包括了 GB2312 的所有內容, 同時又增
加了近20000個新的漢字(包括繁體字)和符號.

Note: Unicode相關的基礎知識請參數上一篇博文.

3. Unicode與GBK互轉

3.1 GBK --> Unicode

Unicode 與 GBK 是兩個完全不樣的字符編碼方案, 其兩者沒有直接關系, 要對其進行相
互轉換, 最直接最高效的方法是查表.

GBK與Uni

總結

以上是生活随笔為你收集整理的Unicode与GBK互转的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。