日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

对UTF8编码的初步认识!

發布時間:2025/3/15 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 对UTF8编码的初步认识! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在網絡中有很多地方都有采用UTF8編碼,由于要編寫與郵件服務端有關的程序,而郵件服務端有些地方用到了UTF8編碼,所以對它有了初步的認識!
它其實和Unicode是同類,就是在編碼方式上不同!
首先UTF8編碼后的大小是不一定,不像Unicode編碼后的大小是一樣的!
我們先來看Unicode的編碼:一個英文字母 “a” 和 一個漢字 “好”,編碼后都是占用的空間大小是一樣的,都是兩個字節!
而UTF8編碼:一個英文字母“a” 和 一個漢字 “好”,編碼后占用的空間大小就不樣了,前者是一個字節,后者是三個字節!
現在就讓我們來看看UTF8編碼的原理吧:
  因為一個字母還有一些鍵盤上的符號加起來只用二進制七位就可以表示出來,而一個字節就是八位,所以UTF8就用一個字節來表式字母和一些鍵盤上的符號。然而當我們拿到被編碼后的一個字節后怎么知道它的組成?它有可能是英文字母的一個字節,也有可能是漢字的三個字節中的一個字節!所以,UTF8是有標志位的!
  當要表示的內容是 7位 的時候就用一個字節:0*******  第一個0為標志位,剩下的空間正好可以表示ASCII 0-127 的內容。
  當要表示的內容在 8 到 11 位的時候就用兩個字節:110***** 10******  第一個字節的110和第二個字節的10為標志位。
  當要表示的內容在 12 到 16 位的時候就用三個字節:1110***** 10****** 10******    和上面一樣,第一個字節的1110和第二、三個字節的10都是標志位,剩下的空間正好可以表示漢字。
  以此類推:
四個字節:11110**** 10****** 10****** 10******
  五個字節:111110*** 10****** 10****** 10****** 10******
  六個字節:1111110** 10****** 10****** 10****** 10****** 10******
  .............................................
..............................................
明白了沒有?
編碼的方法是從低位到高位
現在就讓我們來看看實例吧!
黃色為標志位
其它著色為了顯示其,編碼后的位置

總結

以上是生活随笔為你收集整理的对UTF8编码的初步认识!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。