日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python学习日记day4 字符编码

發布時間:2024/1/17 python 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python学习日记day4 字符编码 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.內存和硬盤都是用來存儲的。

CPU:速度快

硬盤:永久保存

2.文本編輯器存取文件的原理(nodepad++,pycharm)

   打開編輯器就可以啟動一個進程,是在內存中的,所以在編輯器編寫的內容也都是存放在內存中的,斷電后數據就丟失了。因而需要保存在硬盤上,點擊保存按鈕或快捷鍵,就把內存中的數據保存到了硬盤上。在這一點上,我們編寫的py文件(沒有執行時),跟編寫的其他文件沒有什么區別,都只是編寫一堆字符而已。

3.python解釋器執行py文件的原理,例如python ?test.py

  第一階段:python解釋器啟動,此時就相當于啟動了一個文本編輯器

  第二階段:python解釋器相當于文本編輯器,去打開test.py,從硬盤上將test.py的文件內容讀入到內存中

  第三階段:python解釋器執行剛剛加載到內存中的test.py的代碼(在該階段,即執行時,才會識別python的語法,執行到字符串時,會開辟內存空間存放字符串)

總結:python解釋器與文本編輯器的異同

相同點:python解釋器是解釋執行文件內容的,因而python解釋器具備讀py文件的功能,這一點與文本編輯器一樣

不同點:文本編輯器將文件內容讀入內存后,是為了顯示/編輯,而python解釋器將文件內容讀入內存后,是為了執行(識別python的語法)

4.什么是編碼

  編碼是信息從一種形式或格式轉換為另一種形式的過程也稱為計算機編程語言的代碼簡稱編碼。用預先規定的方法將文字、數字或其它對象編成數碼,或將信息、數據轉換成規定的電脈沖信號。編碼在電子計算機、電視、遙控和通訊等方面廣泛使用。編碼是信息從一種形式或格式轉換為另一種形式的過程。解碼,是編碼的逆過程。

5.以下兩個場景涉及到字符編碼的問題:

  1.一個python文件中的內容是由一堆字符組成的(python文件未執行時)

  2.python中的數據類型字符串是由一串字符組成的(python文件執行時)

6.字符編碼的發展史

  

階段一:現代計算機起源于美國,最早誕生也是基于英文考慮的ASCII

   ? ?ASCII:一個Bytes代表一個字符(英文字符/鍵盤上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1種變化,即可以表示256個字符

    ASCII最初只用了后七位,127個數字,已經完全能夠代表鍵盤上所有的字符了(英文字符/鍵盤的所有其他字符)

    后來為了將拉丁文也編碼進了ASCII表,將最高位也占用了

階段二:為了滿足中文,中國人定制了GBK

  GBK:2Bytes代表一個字符,為了滿足其他國家,各個國家紛紛定制了自己的編碼,日本把日文編到Shift_JIS里,韓國把韓文編到Euc-kr里

階段三:各國有各國的標準,就會不可避免地出現沖突,結果就是,在多語言混合的文本中,顯示出來會有亂碼。

于是產生了unicode, 統一用2Bytes代表一個字符, 2**16-1=65535,可代表6萬多個字符,因而兼容萬國語言

但對于通篇都是英文的文本來說,這種編碼方式無疑是多了一倍的存儲空間(二進制最終都是以電或者磁的方式存儲到存儲介質中的)

于是產生了UTF-8,對英文字符只用1Bytes表示,對中文字符用3Bytes

需要強調的是:

  unicode:簡單粗暴,多有的字符都是2Bytes,優點是字符--數字的轉換速度快;缺點是占用空間大。

  utf-8:精準,可變長,優點是節省空間;缺點是轉換速度慢,因為每次轉換都需要計算出需要多長Bytes才能夠準確表示。

1.內存中使用的編碼是unicode,用空間換時間(程序都需要加載到內存才能運行,因而內存應該是越快越好)

2.硬盤中或網絡傳輸用utf-8,保證數據傳輸的穩定性。

七、字符編碼轉換 

在python2中有兩種字符串類型str和unicode

  在python2中,str就是編碼后的結果bytes,所以在Python2中,unicode字符編碼的結果就是str/bytes

?

對于unicode格式的數據來說,無論怎么打印,都不會亂碼

python3中的字符串與python2中的u'字符串',都是unicode,所以無論如何打印都不會亂碼

在python3中也有兩種字符串類型str和bytes\

  str是unicode

encoude()#編碼

decode()#解碼

轉載于:https://www.cnblogs.com/goaway/p/8484205.html

總結

以上是生活随笔為你收集整理的Python学习日记day4 字符编码的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。