常用的编码
ASCII碼是標(biāo)準(zhǔn)化字符集,使用7個二進(jìn)制位編碼,可以表示128個字符,通常ASCII表示的是英文字母的二進(jìn)制編碼,
例如大寫字母'A'的二進(jìn)制編碼為65,python代碼如下:
>>> ord('A') 65 >>> chr(65) 'A' Unicode是另外一種編碼方式,是為了解決傳統(tǒng)編碼方式的局限而產(chǎn)生的,它為每種語言中的每個字符設(shè)置了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺進(jìn)行文本轉(zhuǎn)化的要求。對每種語言的每個字符用兩個字節(jié)長的ID號進(jìn)行編碼,從而規(guī)定出一個多達(dá)65536個字符的編碼空間。UTF-8編碼是一種可變長度的Unicode的實(shí)現(xiàn)方法,是一個多字節(jié)的編碼體系,英文對應(yīng)Unicode的單字節(jié),中文、日韓文對應(yīng)Unicode的三字節(jié)。我們可以看出UTF-8與Unicode編碼方式的區(qū)別是,編碼長度的不同。Unicode采用固定長度的兩個字節(jié)來表示,而UTF-8可以采用一到四個字節(jié),不同的長度來表示。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
- 上一篇: 协方差理解,PCA以及奇异值分解(SVD
- 下一篇: “横平竖直”进行连线+将相邻框进行合并