中文分词工具jieba中的词性类型(转载)
生活随笔
收集整理的這篇文章主要介紹了
中文分词工具jieba中的词性类型(转载)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
jieba為自然語(yǔ)言語(yǔ)言中常用工具包,jieba具有對(duì)分詞的詞性進(jìn)行標(biāo)注的功能,詞性類別如下:
| Ag | 形語(yǔ)素 | 形容詞性語(yǔ)素。形容詞代碼為 a,語(yǔ)素代碼g前面置以A。 |
| a | 形容詞 | 取英語(yǔ)形容詞 adjective的第1個(gè)字母。 |
| ad | 副形詞 | 直接作狀語(yǔ)的形容詞。形容詞代碼?a和副詞代碼d并在一起。 |
| an | 名形詞 | 具有名詞功能的形容詞。形容詞代碼 a和名詞代碼n并在一起。 |
| b | 區(qū)別詞 | 取漢字“別”的聲母。 |
| c | 連詞 | 取英語(yǔ)連詞 conjunction的第1個(gè)字母。 |
| dg | 副語(yǔ)素 | 副詞性語(yǔ)素。副詞代碼為 d,語(yǔ)素代碼g前面置以D。 |
| d | 副詞 | 取 adverb的第2個(gè)字母,因其第1個(gè)字母已用于形容詞。 |
| e | 嘆詞 | 取英語(yǔ)嘆詞 exclamation的第1個(gè)字母。 |
| f | 方位詞 | 取漢字“方” |
| g | 語(yǔ)素 | 絕大多數(shù)語(yǔ)素都能作為合成詞的“詞根”,取漢字“根”的聲母。 |
| h | 前接成分 | 取英語(yǔ) head的第1個(gè)字母。 |
| i | 成語(yǔ) | 取英語(yǔ)成語(yǔ) idiom的第1個(gè)字母。 |
| j | 簡(jiǎn)稱略語(yǔ) | 取漢字“簡(jiǎn)”的聲母。 |
| k | 后接成分 | ? |
| l | 習(xí)用語(yǔ) | 習(xí)用語(yǔ)尚未成為成語(yǔ),有點(diǎn)“臨時(shí)性”,取“臨”的聲母。 |
| m | 數(shù)詞 | 取英語(yǔ) numeral的第3個(gè)字母,n,u已有他用。 |
| Ng | 名語(yǔ)素 | 名詞性語(yǔ)素。名詞代碼為 n,語(yǔ)素代碼g前面置以N。 |
| n | 名詞 | 取英語(yǔ)名詞 noun的第1個(gè)字母。 |
| nr | 人名 | 名詞代碼 n和“人(ren)”的聲母并在一起。 |
| ns | 地名 | 名詞代碼 n和處所詞代碼s并在一起。 |
| nt | 機(jī)構(gòu)團(tuán)體 | “團(tuán)”的聲母為 t,名詞代碼n和t并在一起。 |
| nz | 其他專名 | “專”的聲母的第 1個(gè)字母為z,名詞代碼n和z并在一起。 |
| o | 擬聲詞 | 取英語(yǔ)擬聲詞 onomatopoeia的第1個(gè)字母。 |
| p | 介詞 | 取英語(yǔ)介詞 prepositional的第1個(gè)字母。 |
| q | 量詞 | 取英語(yǔ) quantity的第1個(gè)字母。 |
| r | 代詞 | 取英語(yǔ)代詞 pronoun的第2個(gè)字母,因p已用于介詞。 |
| s | 處所詞 | 取英語(yǔ) space的第1個(gè)字母。 |
| tg | 時(shí)語(yǔ)素 | 時(shí)間詞性語(yǔ)素。時(shí)間詞代碼為 t,在語(yǔ)素的代碼g前面置以T。 |
| t | 時(shí)間詞 | 取英語(yǔ) time的第1個(gè)字母。 |
| u | 助詞 | 取英語(yǔ)助詞 auxiliary |
| vg | 動(dòng)語(yǔ)素 | 動(dòng)詞性語(yǔ)素。動(dòng)詞代碼為 v。在語(yǔ)素的代碼g前面置以V。 |
| v | 動(dòng)詞 | 取英語(yǔ)動(dòng)詞 verb的第一個(gè)字母。 |
| vd | 副動(dòng)詞 | 直接作狀語(yǔ)的動(dòng)詞。動(dòng)詞和副詞的代碼并在一起。 |
| vn | 名動(dòng)詞 | 指具有名詞功能的動(dòng)詞。動(dòng)詞和名詞的代碼并在一起。 |
| w | 標(biāo)點(diǎn)符號(hào) | ? |
| x | 非語(yǔ)素字 | 非語(yǔ)素字只是一個(gè)符號(hào),字母 x通常用于代表未知數(shù)、符號(hào)。 |
| y | 語(yǔ)氣詞 | 取漢字“語(yǔ)”的聲母。 |
| z | 狀態(tài)詞 | 取漢字“狀”的聲母的前一個(gè)字母。 |
| un | 未知詞 | 不可識(shí)別詞及用戶自定義詞組。取英文Unkonwn首兩個(gè)字母。(非北大標(biāo)準(zhǔn),CSW分詞中定義) |
?
名詞短語(yǔ):Ng,n,nr,ns,nt,nz
動(dòng)詞短語(yǔ):v,vd,vn
總結(jié)
以上是生活随笔為你收集整理的中文分词工具jieba中的词性类型(转载)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 三国全面战争增加部队人数上限是多少
- 下一篇: No execution.target