日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

jieba模块基本介绍

發布時間:2024/8/24 综合教程 35 生活家
生活随笔 收集整理的這篇文章主要介紹了 jieba模块基本介绍 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一.jieba模塊基本介紹

1.1 jieba模塊的作用

jieba是優秀的第三方中文詞庫

中文分詞(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程

1.2 jieba模塊的安裝
pip install jieba  #cmd命令行

二.jieba庫的使用說明

2.1 jieba分詞的三種模式

精確模式:將句子最精確的分開,適合文本分析(無冗余)

全模式:句子中所有可以成詞的詞語都掃描出來,速度快,不能解決歧義(有冗余)

搜索引擎模式:在精確的基礎上,對長詞再次切分,提高召回率(有冗余)

三.jieba分詞的使用方法

3.1 三種模式的使用方法
#調用jieba詞庫 import jieba
#精確模式
jieba.cut(文件/文本等內容) #獲取可迭代對象
jieba.lcut()
#全模式
jieba.cut(cut_all=True) #獲取可迭代對象
jieba.lcut(cut_all=True)
#搜索引擎模式
jieba.cut_for_search() # 獲取可迭代對象
jieba.lcut_for_search()
3.2 jieba.cut與jieba.lcut的區別

jieba.cut生成的是一個生成器,generator,也就是可以通過for循環來取里面的每一個詞。

import jieba
txt = '狗比胡晨陽'
print(jieba.cut(txt))
#打印的內容
<generator object Tokenizer.cut at 0x000002004F5B8348>

jieba.lcut 直接生成的就是一個list

import jieba
txt = '狗比胡晨陽'
print(jieba.lcut(txt))
#打印的內容
runfile('E:/python項目/test.py', wdir='E:/python項目')
Building prefix dict from the default dictionary ...
Loading model from cache C:UsersADMINI~1AppDataLocalTempjieba.cache
Loading model cost 1.374 seconds.
Prefix dict has been built succesfully.
['狗', '比', '胡晨陽']

總結

以上是生活随笔為你收集整理的jieba模块基本介绍的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。