中文格式_常见中文编码格式
中文編碼主要有以下四種:
GB2312簡體中文編碼,一個漢字占用2個字節,在大陸是主要的編碼方式。當文章/網頁中包含繁體中文、日文、韓文等時,這些內容可能無法被正確編碼。
BIG5繁體中文編碼,主要在臺灣地區使用。
GBK支持簡體及繁體中文,但對他國非拉丁字母語言還是有問題。
UTF-8:Unicode編碼的一種,Unicode用一些基本的保留字符制定了三套編碼方式,它們分別為UTF-8,UTF-16,UTF-32.在UTF-8中,字符是以8位序列來編碼的,用一個或幾個字節來表示一個字符。這種方式的最大好處是UTF-8保留了ASCII字符的編碼作為它的一部分。UTF-8俗稱“萬國碼”,可以同屏顯示多語種,一個漢字占用3字節。為了做到國際化,網頁盡可能采用UTF-8編碼。
GB2312字符集
作用:國家簡體中文字符集,兼容ASCII
位數:使用2個字節表示,能表示7445個符號,包括6763個漢字,幾乎覆蓋所有高頻率漢字。
范圍:高字節從A1-A7,低字節從A1到FE。將高字節和低字節分別加上0xA0即可得到編碼。
GBK字符集
作用:它是GB2312的擴展,加入對繁體字的支持,兼容GB2312.
位數:使用2個字節表示,可表示21886個字符。
范圍:高字節從81到FE,低字節從40到FE.
GB18030字符集
作用:它解決了中文、日文、朝鮮語等的編碼,兼容GBK。
位數:它采用變字節表示(1ASCII, 2,4字節)。可表示27484個文字。
范圍:1字節從00到7F;2字節高字節從81到FE,低字節從40到7E和80到FE;4字節第一三字節從81到FE,第二四字節從30到39.
常見中文編碼格式?www.aliyun01.com總結
以上是生活随笔為你收集整理的中文格式_常见中文编码格式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: log4j日志收集
- 下一篇: 坚果云升级后桌面出现一个文件夹