python字符编码与转码
生活随笔
收集整理的這篇文章主要介紹了
python字符编码与转码
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
詳細(xì)文章:
http://www.cnblogs.com/yuanchenqi/articles/5956943.html
http://www.diveintopython3.net/strings.html
需知:
1.在python2默認(rèn)編碼是ASCII, python3里默認(rèn)是unicode
2.unicode 分為 utf-32(占4個(gè)字節(jié)),utf-16(占兩個(gè)字節(jié)),utf-8(占1-4個(gè)字節(jié)), so utf-16就是現(xiàn)在最常用的unicode版本, 不過(guò)在文件里存的還是utf-8,因?yàn)閡tf8省空間
3.在py3中encode,在轉(zhuǎn)碼的同時(shí)還會(huì)把string 變成bytes類型,decode在解碼的同時(shí)還會(huì)把bytes變回string
?
?上圖僅適用于py2
#-*-coding:utf-8-*- __author__ = 'Alex Li'import sys print(sys.getdefaultencoding())msg = "我愛(ài)北京天安門" msg_gb2312 = msg.decode("utf-8").encode("gb2312") gb2312_to_gbk = msg_gb2312.decode("gbk").encode("gbk")print(msg) print(msg_gb2312) print(gb2312_to_gbk)in python2#-*-coding:utf-8-*- __author__ = 'Alex Li'import sys print(sys.getdefaultencoding())msg = "我愛(ài)北京天安門" msg_gb2312 = msg.decode("utf-8").encode("gb2312") gb2312_to_gbk = msg_gb2312.decode("gbk").encode("gbk")print(msg) print(msg_gb2312) print(gb2312_to_gbk)in python2
轉(zhuǎn)載于:https://www.cnblogs.com/wjcoding/p/10991091.html
總結(jié)
以上是生活随笔為你收集整理的python字符编码与转码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: OpenGL小试牛刀第一季
- 下一篇: 如何设置python的编码格式为utf-