日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ascii码及其汉字编码

發布時間:2024/1/1 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ascii码及其汉字编码 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

名稱

  美國信息交換標準代碼

?

  ( American Standard Code for Information Interchange, ASCII )

?

編輯本段

?

?

產生

  在計算機中,所有的數據在存儲和運算時都要使用二進制數表示(因為計算機用高電平和低電平分別表示1和0),例如,像a、b、c、d這樣的52個字母(包括大寫)、以及0、1等數字還有一些常用的符號(例如*、#、@等)在計算機中存儲時也要使用二進制數來表示,而具體用哪些二進制數字表示哪個符號,當然每個人都可以約定自己的一套(這就叫編碼),而大家如果要想互相通信而不造成混亂,那么大家就必須使用相同的編碼規則,于是美國有關的標準化組織就出臺了所謂的ASCII編碼,統一規定了上述常用符號用哪些二進制數來表示。

?

  美國標準信息交換代碼是由美國國家標準學會(American National Standard Institute , ANSI )制定的,標準的單字節字符編碼方案,用于基于文本的數據。起始于50年代后期,在1967年定案。它最初是美國國家標準,供不同計算機在相互通信時用作共同遵守的西文字符編碼標準,它已被國際標準化組織(International Organization for Standardization, ISO)定為國際標準,稱為ISO 646標準。適用于所有拉丁文字字母。

?

編輯本段

?

?

簡介

  ASCII 碼使用指定的7 位或8 位二進制數組合來表示128 或256 種可能的字符。標準ASCII 碼也叫基礎ASCII碼,使用7 位二進制數來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控制字符。其中:

?

  0~31及127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(響鈴)等;通信專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值為8、9、10 和13 分別轉換為退格、制表、換行和回車字符。它們并沒有特定的圖形顯示,但會依不同的應用程序,而對文本顯示有不同的影響。

?

  32~126(共95個)是字符(32sp是空格),其中48~57為0到9十個阿拉伯數字

?

  65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其余為一些標點符號、運算符號等。

?

  同時還要注意,在標準ASCII中,其最高位(b7)用作奇偶校驗位。所謂奇偶校驗,是指在代碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的代碼一個字節中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個字節中1的個數必須是偶數,若非偶數,則在最高位b7添1。

?

  后128個稱為擴展ASCII碼,目前許多基于x86的系統都支持使用擴展(或“高”)ASCII。擴展ASCII 碼允許將每個字符的第8 位用于確定附加的128 個特殊符號字符、外來語字母和圖形符號。

?

編輯本段

?

?

標準ASCII表

  

Bin Dec Hex 縮寫/字符 解釋
0000 0000 0 00 NUL(null) 空字符
0000 0001 1 01 SOH(start of headline) 標題開始
0000 0010 2 02 STX (start of text) 正文開始
0000 0011 3 03 ETX (end of text) 正文結束
0000 0100 4 04 EOT (end of transmission) 傳輸結束


漢字編碼

0-127 是 7位ASCII 碼的范圍,是國際標準。 至于漢字,不同的字符集用的ascii 碼的范圍也不一樣,常用的漢字字符集有GB2312-80,GBK, Big5,unicode 等。下面我重點說一說最常用的GB_2312 的字符集。 GB_2312 字符集是目前最常用的漢字編碼標準,windows 95/98/2000 中使用的 GBK字符集 就包含了GB2312,或者說和GB2312 兼容,GB_2312 字符集包含了 6763個的 簡體漢字,和682 個標準中文符號。在這個標準中,每個漢字用2個字節來表示,每個字節的ascii碼為 161-254 (16 進制A1 - FE),第一個字節 對應于 區碼的1-94 區,第二個字節 對應于位碼的1-94 位。 161-254 其實很好記憶,大家知道英文字符中,可打印的字符范圍為33-126。將 這對 數加上 128(或者說最高位置1),就得到漢字使用的字符的范圍。 //GB18030的規范是漢字第一個字節在0x81-0xFE之間,第二個字節位于區間0x40-0x7E以及0x80-0xFE。每個字節轉化為整數大于128。 if ((char_temp>=0x81)&&(char_temp<=0xFE)) { if(*len<nlen) { *len+=1; *p_temp++=char_temp; _putch(char_temp); x++; }

  }



結束語:vc使用的默認編碼是ascii碼,漢字可能是GB18030,在linux 需要轉化編碼,用linux下所有的編碼,Qt下的utf-8可以用編碼轉換小工具convert進行轉換。

?

總結

以上是生活随笔為你收集整理的ascii码及其汉字编码的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。