编码格式问题汇总
20210729
\u 開頭就是 unicode編碼
pip install chardet
執行
import chardet
f =?open('a.doc',r)
data = f.read()
print chardet.detect(data)
結果
{'confidence':?0.64465744,?'encoding':?'utf-8'}
前面是相似度 ?后面是編碼格式
或者 return chardet.detect(data).get("encoding") 直接獲取文件編碼格式
總結
- 上一篇: PyTorch学习之六个学习率调整策略
- 下一篇: python 过滤出某后缀名文件