中文字符
python 判斷是否為中文
</h1><div class="clear"></div><div class="postBody">
python在執(zhí)行代碼過程是不知道這個(gè)字符是什么意思的、是否是中文,而
是把所有代碼翻譯成二進(jìn)制也就是000111這種形式,機(jī)器可以看懂的語言。
也就是在計(jì)算機(jī)中所有的字符都是有數(shù)字來表示的。漢字也是有數(shù)字表示的,
Unicdoe4E00~9FFF表示中文,所以如果一個(gè)字符的utf-8編碼在這個(gè)區(qū)間內(nèi),就
說明它是中文。
?
?
?
代碼:
def is_Chinese(word):for ch in word:if '\u4e00' <= ch <= '\u9fff':return Truereturn False
?
?
?
?
?
?中文編碼對(duì)應(yīng)表
?
GBK?? UTF16?? UTF8??? 漢字
D2BB? 4E00? E4 B8 80? 一
B6A1? 4E01? E4 B8 81? 丁
總結(jié)
- 上一篇: Python中re的match、sear
- 下一篇: 编辑距离理解