當前位置：首頁 > 编程语言 > python >内容正文

python

python中pos()_python中不带NLTK的POS标记器

發布時間：2025/3/21 python 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 python中pos()_python中不带NLTK的POS标记器小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我想給索拉尼庫爾德語的限定詞和介詞做一個詞性標記。我使用下面的代碼將每個標記放在庫爾德語文本中的每個命題或限定詞之后。在import os

SOR = open("SOR-1.txt", "r+", encoding = 'utf-8')

old_text = SOR.read()

punkt = [".", "!", ",", ":", ";"]

text = ""

for i in old_text:

if i in punkt:

text+=" "+i

else:

text += i

d = {"DET":["????" , "????" , "???" , "???" , "?????" , "?????", "????" ], "PREP":["??","??","?????","??","????","?????","??????","?????","??????","??????","?????","?????","??","??","???","????","?????","???","??","??","???????","??????","???????","???????","????","???????","?????","?????","????","??????","??????","?????","???????","?????","?????","???","????????","?????","?????","???","?????","???","???","???","???","" ], "punkt":[".", ",", "!"]}

text = text.split()

for w in text:

for pos in d:

if w in d[pos]:

SOR.write(w+"/"+pos+" ")

SOR.close()

我想做的是在定義的字典中的每個單詞之后在文本中添加POS標記，但是結果是在文件末尾有一個單詞和POS標記的單獨列表。在

總結

以上是生活随笔為你收集整理的python中pos()_python中不带NLTK的POS标记器的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： nvidia docker容器不支持中文
下一篇： mysql空洞_optimize tab