當前位置：首頁 > 编程语言 > python >内容正文

python

python2和3的编码区别_Python2和3字符编码的区别

發布時間：2025/3/20 python 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 python2和3的编码区别_Python2和3字符编码的区别小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 字符編碼應用程序的三個階段Python的Python程序執行Python(我再次強調,執行的第一步必須先從硬盤讀取文件內容到內存中)文件內容保存在gbk格式,內容為:第一階段:啟動Python解釋器階段2:Python解釋器是一個文本編輯器,打開文件,負責,內容從硬盤讀取到內存中。這時,Python解釋器將讀取第一行內容,#編碼:utf - 8或# - *編碼:utf - 8 - *,確定編碼格式用于讀取到內存的代碼,這條線是設置Python解釋器使用的編碼格式的軟件。導入系統()\u201Cutf - 8\u201DAscii Python2默認情況下使用,并在Python3默認使用utf - 8。

這是正確的編碼:gbk你好。第三階段:閱讀的代碼(Unicode編碼格式)加載到內存中,然后執行它。執行期間,一個新的內存空間可能會打開,如name = \例如,一個name = \,只是普通的字符,以Unicode格式存儲在內存中。然而,在程序的執行期間,內存(存在于程序代碼的內存是兩個空格)用于存儲Python數據類型的值,和Python的字符串類型涉及角色的概念。例如,名稱= \至于編碼和存儲的字符串類型的值,這是一樣的Python解釋器,相關和字符串類型的Python2 Python3是不同的。第二,Python2 Python2和Python3字符串類型的區別有兩個str和Python2 Unicode字符串類型。

編碼:gbkx =\u2018上\u2019y =\u201D下\u201C打印((x, y)) # [' \\ xc9 \\ xcf ', ' \\ xcf \\ xc2 '] # 5。\\ x表示十六進制,這里一共有4個十六進制數字c9cf,十六進制數有四個4位,和4個十六進制數字是16位的,也就是說,2字節,這證明2字節是中國根據gbk編碼中使用。理解字符編碼的關鍵!!!內存中的數據通常是用十六進制表示。2位的十六進制表示一個字節的數據,比如\\ xc9,代表兩個十六進制。一個字節gbk需要2字節存儲中文和1來存儲。字節,它是如何做到的?嗎?嗎?!!!GBK將使用每個字節,即第一位8位的位標志位。

如果標志位為0,這意味著它是一個英文字符。x = '你很好'轉換成二進制位gbk格式:8一點一點+ 8 + 8一點一點+ 8 + 8位=(1 + 7位)+(1 + 7位)+(0 + 7位)+(1 + 7位)+(1 + 7位)這樣,計算機讀取的順序從左到右:連續讀到第一個旗幟在第一兩個括號都是1,構成一個中午的角色:你讀到第一個旗幟在第三個括號是0,然后8位代表一個英文字符:連續讀兩個括號1中第一個標志,構成一個中午的角色:哦,也就是說,每個字節被預留給我們存儲的實際價值有效的只有7位的比特數,只有有效的7位存儲在Unicode表。至于第一個標志位有關特定編碼,即代表gbk Unicode的方法是:(7位)+(7位)+(7位)+(7位)+(7位)根據上述的翻譯結果圖,我們可以去Unicode檢查對應的漢字:鏈接:#六,Python2中碼#七,編碼:gbkx =\u2018上\u2019.

decode (gbk)打印((x, y)) # [u ' \\ u4e0a ', ' \\ u4e0b '] Unicode類型當Python解釋器執行的代碼生成字符串時(例如,s = u造勢\u201D),它將申請一個新的內存地址,然后存儲造勢的在新的內存空間以Unicode格式,所以只能編碼,解碼。#八,Python2中碼#九、編碼:gbkx = u一樣\u2018上\u2019# x =\u2018上\u2019.decode (gbk) y = u一樣\u2018下\u2019# y =\u2018下\u2019.decode (gbk)打印((x, y)) # [u ' \\ u4e0a ', ' \\ u4e0b ']對打印需要特殊的解釋是:當程序執行,例如x =\u2018上\u2019# gbk下,作為\\ xc9 \\ xcf字符串存儲。

順理成章地,它打印存儲,但是打印\\ xc9 \\ xcf,對于一些不熟悉Python代碼的程序員,他們立即困惑,所以叔叔烏龜做了自己的說法。當印刷(x),使用終端的編碼格式\\ xc9 \\ xcf的記憶轉換成字符顯示。這個時候,終端代碼必須gbk,否則原創內容無法正常顯示:。在Unicode格式數據,無論如何印刷,它不會引起誤解的。Unicode是如此的好,而不是混亂的。為什么Python2如此尷尬str ?Python出生時,Unicode并不像今天一樣受歡迎。很明顯,你可以看到好東西。叔叔龜已經看過了。叔叔烏龜直接節省str Python3 Unicode。我們定義了一個str沒有你添加前綴,Unicode,嗎?

#編碼:gbkx =\u2018上\u2019#在執行程序時,不需要添加u,\u201C上\u201D也將保存在Unicode的新內存空間形式,# x可以直接編碼到任何編碼格式打印(f\u201D(\u201Cgbk\u201D): {(gbk)}\u201D) # b \\ xc9 \\ xcf的(\u201Cgbk\u201D): b \\ xc9 \\ xcf\u201D是非常重要的結果(\u201Cgbk\u201D) Python3 \\ xc9 \\ xcf Python2 str類型的值,而在Python3字節類型,和在Python2 str類型。總之,代碼細節Python2實現情況Python3實現情況#編碼:gbkprint(中)終端:use utf8亂碼不亂碼編碼:utf8print(中)終端:use utf8不亂碼不亂碼編碼:gbkprint (u\u201C中\u201D)終端:use utf8沒有斷章取義的#編碼:utf8print (u '中')終端:utf8 Python2中沒有混亂的產生,如果指定字符編碼,那么內存訪問將進入內存根據指定的字符編碼。

否則,你可以添加你的前面定義的變量,所以變量將unicode編碼存儲在內存中。如:#編碼:gbkname =\u201C爸爸\u201D,但Python3不會有這樣的問題,因為不管你指定字符編碼,將使用Unicode編碼進入內存內存訪問期間。Unicode編碼可以是任意字符編碼是彼此之間轉換,根據所需的編碼區和閱讀在閱讀時,解決問題的字符編碼

總結

以上是生活随笔為你收集整理的python2和3的编码区别_Python2和3字符编码的区别的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： springmvc怎么解析post_秋招
下一篇： websocket python爬虫_p