日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

Python 2 中文乱码解决方案:

發(fā)布時(shí)間:2025/4/9 python 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python 2 中文乱码解决方案: 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.文件編碼是UTF-8,同時(shí)在文件頭添加 # -*- coding: utf-8 -*-

2.文件中所有的字符串前都加u,如 u"中文"

3.在輸入(抓取某些utf-8/gbk的網(wǎng)頁)、輸出(輸出到網(wǎng)頁、終端)的時(shí)候,要記住python內(nèi)部是用Unicode存儲的

4.所有輸入要先decode,變成unicode,輸出時(shí)要encode變成想要的編碼(MacOS X/Linux下輸出為utf-8,Windows下輸出為gbk,但如果是在pycharm自己的控制臺下的話,windows下輸出為utf-8也可以正常顯示)

5.還有其他很多種古老的解決方案,比如統(tǒng)一用gbk,比如中轉(zhuǎn)編碼不用unicode,而用utf-8,如此種種。。


更新一下,來源于 http://www.newsmth.net/nForum/article...


1.源碼文件用coding: utf-8指定編碼并把文件保存為utf-8格式

2.為了作為__main__模塊執(zhí)行時(shí)不出不必要的錯(cuò)誤,統(tǒng)一使用\n換行

3.如果需要在源碼內(nèi)嵌入漢字等非ascii字符,建議使用u前綴作為unicode字符串,這樣在print時(shí)可以可以不做編碼轉(zhuǎn)換,

4.否則如果控制臺編碼與源文件編碼不一致就必須顯式轉(zhuǎn)換,通過locale.getdefaultlocale()可以獲取系統(tǒng)語言和編碼

5.涉及文件路徑的最好轉(zhuǎn)換為sys.getfilesystemencoding()編碼

6.unicode字符串在寫入文件時(shí)必須轉(zhuǎn)換為某種字節(jié)編碼

7.json默認(rèn)支持utf-8編碼

8.盡量用utf-8和unicode,除了前面說的文件路徑和寫入文件等少數(shù)情況

---------------------------------------------------------------------------------------------

其實(shí)如果想考慮今后遷移到 python 3 或者只是想使用 python 3 風(fēng)格的默認(rèn) unicode, 可以使用


from __future__ import unicode_literals


之后不需要再在所有中文字符串前加 u 了, 相反, 所有原來的"字符串"現(xiàn)在默認(rèn)均為unicode串了. 如果需要使用utf-8串可以選擇在前面加 b :)


轉(zhuǎn)載于:https://www.cnblogs.com/findeasy/p/4053098.html

總結(jié)

以上是生活随笔為你收集整理的Python 2 中文乱码解决方案:的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。