日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

字符集编码ANSI和UNICODE

發布時間:2025/7/25 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 字符集编码ANSI和UNICODE 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?本文為原創,參考了一些網上的資料.

編碼指不同國家的語言在計算機中的一種存儲和解釋規范
ANSI與ASCII

n最初,Internet上只有一種字符集——ANSI的ASCII字符集(American Standard Code for Information Interchange, “美國信息交換標準碼),它使用7 bits來表示一個字符,總共表示128個字符,后來IBM公司在此基礎上進行了擴展,用8bit來表示一個字符,總共可以表示256個字符,充分利用了一個字節所能表達的最大信息
nANSI字符集:ASCII字符集,以及由此派生并兼容的字符集,如:GB2312,正式的名稱為MBCS(Multi-Byte Chactacter System,多字節字符系統),通常也稱為ANSI字符集。

UNICODE與UTF8,UTF16

n由于每種語言都制定了自己的字符集,導致最后存在的各種字符集實在太多,在國際交流中要經常轉換字符集非常不便。因此,產生了Unicode字符集,它固定使用16 bits(兩個字節)來表示一個字符,共可以表示65536個字符
n標準的Unicode稱為UTF-16(UTF:UCS Transformation Format )。后來為了雙字節的Unicode能夠在現存的處理單字節的系統上正確傳輸,出現了UTF-8,使用類似MBCS的方式對Unicode進行編碼。(Unicode字符集有多種編碼形式)
?例如“連通”兩個字的Unicode標準編碼UTF-16 (big endian)為:DE 8F 1A 90
???????????????? 而其UTF-8編碼為:E8 BF 9E E9 80 9A


n當一個軟件打開一個文本時,它要做的第一件事是決定這個文本究竟是使用哪種字符集的哪種編碼保存的。軟件一般采用三種方式來決定文本的字符集和編碼:
檢測文件頭標識,提示用戶選擇,根據一定的規則猜測
最標準的途徑是檢測文本最開頭的幾個字節,開頭字節 Charset/encoding,如下表:
EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, little endian
FF FE     UTF-16/UCS-2, big endian
FF FE 00 00   UTF-32/UCS-4, little endian.
00 00 FE FF   UTF-32/UCS-4, big-endian.

轉載于:https://www.cnblogs.com/zyk/archive/2004/11/17/64747.html

總結

以上是生活随笔為你收集整理的字符集编码ANSI和UNICODE的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。