日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

NLTK基础教程学习笔记(一)

發布時間:2025/5/22 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NLTK基础教程学习笔记(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

先來介紹一下相關的python基礎:
list:list是python中最基礎的數據結構相對于其他語言中的數組:
例子:

>>>list=[1,2,3,4] >>>print (list)

結果:

python是一種解釋性語言,會在對其計算的同時檢查其中的變量類型,我們在聲明這些變量時無需對其進行初始化和類型聲明,但在這里list中的包含一些整數對象,不能直接關聯到print上,后者只能接受String類型的對象,所以要將列表元素轉換為String類型。
例子:

>>>print('First element:'+str(list[0])) >>>print('Last element:'+str(list[-1])) >>>print('First three element:'+str(list[0:2])) >>>print(‘Last three element:’+str(list[-3:0]))

結果:

First element:1 Last element:4 First element:1,2,3 Last element:2,3,4

常見的對字符串操作的函數:
split():一個能基于默寫分隔符來對于字符串進行切割的方法。如果你沒有為其提供具體參數則默認空格為其分隔符。

>>>mystring="Monty Python! And the holy Grail !\n" >>>print (mystring.split())

結果:

['Monty', 'Python!', 'And', 'the', 'holy', 'Grail', '!']

strip():一個可以從字符串中刪除其尾隨空白符(如‘n’,'nr')的方法
例子:

>>> print(mystring.strip()) Monty Python! And the holy Grail !

通過rstrip()和lstrip()可以選擇剝離字符串左邊還是右邊尾部的空白符
upper()/lower():可以用來改變字符串中字母的大小寫
例子

>>> print(mystring.upper()) MONTY PYTHON! AND THE HOLY GRAIL !

replace()可以替換目標字符串中的某個子串
例子:

>>> print(mystring.replace('!',',')) Monty Python, And the holy Grail ,

在NLP中正則表達式是另一個非常重要的技能。正則表達式(regular expression)能對字符串進行有效地匹配的模式,能從大量凌亂的文本數據中提取出有意義的信息。
正則表達式一般有:
(句號):用于匹配除換行字符外的任意單字符。
w:用于匹配某一字符或者數字,相當于[a-z A-Z 0-9]
W:用于匹配任意非單詞性字符
s:用于匹配任意單個空白字符,包括換行,返回制表等,相當于[nrt]
S:用于匹配單個任意非空白字符。’
t:用于匹配制表符。
n:用于匹配換行符。
r:用于匹配返回符。
d:用于匹配十進制數字。
^:用于匹配相關字符的開始位置。
$:用于匹配先關字符串結尾位置。
:用于低效特殊字符的特殊性。如要匹配$符號,則在前面加上.
下面是一個使用字符串的子串搜索模塊re來查找字符對象的例子。

import re mystring="Monty Python! And the holy Grail !\n" if re.search('Python' ,mystring):print("we found Python") else:print("No")

結果:

We found Python

findall()是一個用于對字符串進行全部模式查找的函數。他會按照給定模式對字符串進行查找,并列出其中所有匹配的對象:

import re mystring="Monty Python! And the holy Grail !\n" print(re.findall("!",mystring))

結果:

['!', '!']

findall()返回兩個對象的列表。

總結

以上是生活随笔為你收集整理的NLTK基础教程学习笔记(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。