日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现)

發布時間:2023/11/30 python 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Unicode 是全球文字統一編碼。它把世界上的各種文字的每一個字符指定唯一編碼,實現跨語種、跨平臺的應用。

中文用戶最常接觸的是漢字 Unicode 編碼。中文字符數量巨大,日常使用的漢字數量有數千個,再加上生僻字,數量達到數萬個。下面這個表格將中文字符集的 Unicode 編碼范圍列出:

字符集

字數

Unicode編碼范圍基本漢字

20902

4E00-9FA5

基本漢字補充

74

9FA6-9FEF

擴展A

6582

3400-4DB5

擴展B

42711

20000-2A6D6

擴展C

4149

2A700-2B734

擴展D

222

2B740-2B81D

擴展E

5762

2B820-2CEA1

擴展F

7473

2CEB0-2EBE0

擴展G

4939

30000-3134A

康熙部首

214

2F00-2FD5

部首擴展

115

2E80-2EF3

兼容漢字

477

F900-FAD9

兼容擴展

542

2F800-2FA1D

PUA(GBK)部件

81

E815-E86F

部件擴展

452

E400-E5E8

PUA增補

207

E600-E6CF

漢字筆畫

36

31C0-31E3

漢字結構

12

2FF0-2FFB

漢語注音

43

3105-312F

注音擴展

22

31A0-31BA

1

3007

根據上述字符范圍,可以編寫以下函數,識別給定字符串是否含義中文字符。

# coding=utf-8

import?re

def?containChinese(content):

"""?判斷內容是否含有中文字符

Arguments:

content?{string}?--?要檢測的內容

Returns:

[bool]?--?是否包含中文

"""

zh_pattern?=?re.compile(

u'([\u4E00-\u9FA5]|[\u9FA6-\u9FEF]|[\u3400-\u4DB5]|[\U00020000-\U0002A6D6]|[\U0002A700-\U0002B734]|[\U0002B740-\U0002B81D]|[\U0002B820-\U0002CEA1]|[\U0002CEB0-\U0002EBE0]|[\U00030000-\U0003134A]|[\u2F00-\u2FD5]|[\u2E80-\u2EF3]|[\uF900-\uFAD9]|[\U0002F800-\U0002FA1D]|[\uE815-\uE86F]|[\uE400-\uE5E8]|[\uE600-\uE6CF]|[\u31C0-\u31E3]|[\u2FF0-\u2FFB]|[\u3105-\u312F]|[\u31A0-\u31BA]|[\u3007])+'

)

match?=?zh_pattern.search(content)

return?match?is?not?None

a = '中文abcs短語'

print(containChinese(a)) # True

b = 'abcd'

print(containChinese(b)) # False

總結

以上是生活随笔為你收集整理的python判断字符串包含中文_查询字符串中是否包含中文字符(Python实现)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。