Python学习-字符编码的理解
Unicode編碼和ASCII碼兩者都是機(jī)器能夠理解的編碼,你就是說(shuō)出現(xiàn)一個(gè)碼,計(jì)算機(jī)知道它對(duì)應(yīng)哪種符號(hào)。因?yàn)檫@種編碼形式將不同的字符全都和電平的高低電位聯(lián)系在一起。
Unicode,這種編碼是全球通用的編碼,就是說(shuō)所有計(jì)算機(jī)都包含的編碼。包含?utf-32(占4個(gè)字節(jié)),utf-16(占兩個(gè)字節(jié)),utf-8(占1-4個(gè)字節(jié)),這三種形式。
也就是說(shuō)utf-8,就是一種Unicode的編碼。?
?utf-16就是現(xiàn)在最常用的unicode版本, 不過(guò)在文件里存的還是utf-8,因?yàn)閡tf8省空間。
?
GBK編碼就是另一種編碼的形式。這是包含中文漢字的一種早期編碼形式,但是,沒(méi)有包含所有的漢字。并且和Unicode的不同。所以如果以g?b k編碼的形式存儲(chǔ),我們就要專門指定用g b k的形式進(jìn)行解碼。
?
1.在python2默認(rèn)編碼是ASCII, python3里默認(rèn)是unicode;另外每個(gè)軟件通常也會(huì)有自己默認(rèn)的編碼形式。
2.在py3中encode,在轉(zhuǎn)碼的同時(shí)還會(huì)把string 變成bytes類型,decode在解碼的同時(shí)還會(huì)把bytes變回string
3.另外,這里非常值得注意的事情是,我們所關(guān)心的字符編碼,他的對(duì)象是字符而不是數(shù)字。數(shù)字基本上可以看成是直接存儲(chǔ)的。
http://www.cnblogs.com/yuanchenqi/articles/5956943.html
轉(zhuǎn)載于:https://www.cnblogs.com/Ian-learning/p/7906775.html
總結(jié)
以上是生活随笔為你收集整理的Python学习-字符编码的理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: vue-cli安装笔记
- 下一篇: 编译Python2.7.10