字符与字节
一、定義
2個字節一個漢字,比如“的”;?全角標點2個字節,半角標點一個字節,?一個字母一個字節??
字符指一個字母或一個字或一個標點或一個符號,不一定幾個字節,看情況定 字呢,太泛了一點吧?
二、單位換算飛
一個漢字=兩個位(2Byte)
一個英文字母=一個位(1Byte)
8bit(位)=1Byte(字節)
1024Byte(字節)=1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
?三、各種編碼中字符與字節的轉換
字節是計算機得度量單位,八個二進制數字組成一個字節,英文名為BYTE
字符是計算機可以處理得符號得統稱,比如1234..9及!@#$及abcd...z這種ASCII字符,以及"我是中國人"這種gb2312字符或者UNICODE字符
字符的大小可以用字節來衡量,比如ASCII字符的長度就是一個字節;gb2312字符得長度是兩個字節;UNICODE字符得長度是3個字節。
ASCII ?? 一個英文字母,數字-----占7/8字節,就是7個2進制位,第八個有其他用,比如奇偶校驗,因此可以算占一個字節。(8個Bit位)
? 一個中文字-------占二個字節
整數要根據類型,一般是極其的字長。比如16位機整數就是16位Bit,兩個字節。32位機就是4字節。還有int64 類型的整數。 至于實數在C中,有32位(float)和64位(double)之分。其他語言中有類型80位的,叫擴展精度實數.主要是在cpu內部的擴展精度實數寄存器,是80位的。保證在double實數運算是不損失精度。
?
附:文件編碼-ANSI與UTF-8
?
ANSI的ASCII字符集,使用7 bits來表示一個字符,總共表示128個字符.?
UTF8 Unicode字符集,它固定使用16 bits(兩個字節)來表示一個字符,共可以表示65536個字符 ?為了雙字節的Unicode能夠在現存的處理單字節的系統上正確傳輸,出現了UTF-8.
?
一個正常的網頁有兩種編碼,一種是讓瀏覽器識別文字的編碼,另一種就是頁面的自身編碼.
參考網址:http://hi.baidu.com/donick/item/427a92f934e1336b3d14851b
?
轉載于:https://www.cnblogs.com/wllzbky/p/3176658.html
總結
- 上一篇: 在Eclipse中给JRE-Librar
- 下一篇: 控件属性、事件持久化(转)