GBK编码
2019獨角獸企業(yè)重金招聘Python工程師標(biāo)準(zhǔn)>>>
在軟件開發(fā)過程中,尤其是涉及到數(shù)據(jù)庫的項目,通常都會遇到字符編碼的問題。
其中,中文字符集編碼常用的有GB2312和GBK,以及萬國碼UTF8,另外還有GB18030。
ASCII碼每個字符占一個字節(jié);GB2312是GBK的子集,兩個字符集都是每個字符占兩個字節(jié);GB18030是GBK的取代版本,每個字符占一個、兩個或四個字節(jié);UFT8是萬國碼,每個字符占一個、兩個或三個字節(jié)。
?
下圖是GBK字符編碼表。
圖是265*256的矩陣,表示兩個字節(jié)可以表示的所有字符。水平方向表示高字節(jié),從左至右為0000~FF00;垂直方向表示低字節(jié),從上到下為0000~00FF。
?
左側(cè)0區(qū):0000~007F,ASCII碼區(qū)。
右下色塊區(qū):8140~FEFE(需剔除a區(qū)817F~FE7F),GBK編碼區(qū)。
?
GBK編碼分三部分。
一、漢字區(qū)
2區(qū):B0A1~F7FE,GBK/2,GB2312漢字區(qū),GB2312漢字6763個。
GB13000.1擴充漢字區(qū)
3區(qū):8140~A0FE,GBK/3,GB13000.1中的CJK漢字6080個。
4區(qū):AA40~FEA0,GBK/4,CJK漢字和增補的漢字8160個。
二、圖形符號區(qū)
1區(qū):A1A1~A9FE,GBK/1,GB2312非漢字符號區(qū)。除GB2312的符號外,還有10個小寫羅馬數(shù)字和GB12345增補的符號。計符號717個。
5區(qū):A840~A9A0,GBK/5,GB13000.1擴充非漢字區(qū)。包含BIG-5 非漢字符號、結(jié)構(gòu)符和漢字“〇”。計符號166個。
三、用戶自定義區(qū)
A區(qū):AAA1~AFFE,碼位564個。
B區(qū):F8A1~FEFE,碼位658個。
C區(qū):A140~A7A0,碼位672個。
轉(zhuǎn)載于:https://my.oschina.net/u/209067/blog/1581977
總結(jié)
- 上一篇: unity基础(1)——unity编辑器
- 下一篇: 为什么程序员发现不了自己的BUG