nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法
nltk是NLP領(lǐng)域中一個(gè)比較通用的國(guó)際分詞工具,但是使用時(shí)往往依賴(lài)語(yǔ)料庫(kù)數(shù)據(jù)包,需要安裝到本地,以下介紹在線安裝和離線安裝兩種方式:
(ps:對(duì)NLP感興趣的朋友可以相互學(xué)習(xí),我的微信號(hào):Joney-Joney,請(qǐng)備注:NLP博客)
?
1.在線安裝punkt等數(shù)據(jù)包:
1.1 在線安裝時(shí)往往會(huì)報(bào)SSL等安全連接驗(yàn)證錯(cuò)誤,可通過(guò)python的ssl模塊中啟用無(wú)驗(yàn)證的網(wǎng)絡(luò)連接方式,代碼如下:
import nltk import ssl try:_create_unverified_https_context = ssl._create_unverified_context except AttributeError:pass else:ssl._create_default_https_context = _create_unverified_https_context nltk.download()1.2 運(yùn)行后就會(huì)彈出python解釋器后自動(dòng)打開(kāi)nltk下載器的界面如下,按圖示操作即可:
1.3 單個(gè)包都比較小,下載完后打開(kāi)上圖中自行指定的nltk_data目錄可看到punkt目錄結(jié)構(gòu)如下:
1.4 恭喜您,現(xiàn)在可以正確運(yùn)行你的代碼啦(報(bào)錯(cuò)日志中依賴(lài)什么包就安裝對(duì)應(yīng)的包)
?
2 離線安裝方式:
2.1 先到官網(wǎng)NLTK Corpora(如下圖)下載zip包:
2.2 新建一個(gè)nltk_data文件夾(僅第一次安裝時(shí))放到任意路徑下(如:我放在Python.framework/Versions/3.7/share/中);
2.3 把下載好的語(yǔ)料包punkt.zip解壓到nltk_data/tokenizers/中(因?yàn)閜unkt屬于tokenizers所以需要新建tokenizers文件夾);
2.4 最后把nltk_data目錄以代碼的形式添加到nltk的數(shù)據(jù)文件路徑中(只需要在第一次安裝時(shí)添加,添加的代碼如下)。
import nltk nltk.data.path.append('xxxx/nltk_data') # 參數(shù)為你放置的nltk_data文件夾的絕對(duì)路徑?
3.安裝nltk其它的語(yǔ)料庫(kù)同理,個(gè)人推薦在線安裝的方式,比較方便~~
?
?
總結(jié)
以上是生活随笔為你收集整理的nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 今年第一批储蓄国债就要来了,数量不多,要
- 下一篇: 【uva-673】 Parenthese