日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

几种NER模型

發(fā)布時間:2025/3/21 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 几种NER模型 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1. BiLSTM-CRF

1.1 模型

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

?

對于一個中文句子,這個句子中的每個字符都有一個屬于集合{O,B-PER,I-PER,B-LOC,I-LOC,B-ORG,I-ORG}的標記。

第一層,look-up layer,旨在將每個字符表示從一個one-hot向量轉(zhuǎn)換為character embedding字符嵌入。在這段代碼中,隨機初始化嵌入矩陣,我知道它看起來太簡單了。我們以后可以增加一些語言知識。例如,進行標記化tokenization?并使用pre-trained word-level embedding 字級嵌入,然后可以使用此標記的字嵌入初始化一個標記中的每個字符。此外,我們還可以通過結合低層特征來實現(xiàn)字符的嵌入(詳見論文[2]第4.1節(jié)和論文[3]第3.3節(jié))。

第二層,BiLSTM層,可以有效地利用過去和將來的輸入信息,自動提取特征

第三層,CRF層,在一個句子中為每個字符標記標簽。如果我們使用Softmax層進行標記,我們可能會得到非隨機標記序列,因為Softmax層獨立地標記每個位置。我們知道“I-LOC”不能跟在“B-PER”后面,但Softmax不知道。與Softmax相比,CRF層可以利用句子級的標簽信息,對兩個不同標簽的轉(zhuǎn)換行為進行建模

1.2 語料

MSRA corpus

?將自己語料轉(zhuǎn)換為以上格式,并生成一個詞匯表文件。

2. BERT-BiLSTM-CRF

條件隨機場-CRF

??條件隨機場分為三個部分,一個是“條件”,一個是“隨機場”,還有一個是“馬爾科夫”。
??“隨機場”:就是若干個位置的整體,當每個位置按某一種分布去取值時,當每個位置的值都確定下來,整體就是一個隨機場。標注序列 ”O(jiān)OBSOBMSOOO” 就是一個隨機場
??“條件”:就是在已知X的條件下,Y是在已知X的條件下的輸出,可類比于條件概率。
??“馬爾科夫”:就是隨機場中的任一一個位置的結果僅與此位置相鄰的結果和的位置有關,而與其他不相鄰位置的結果無關。
??條件隨機場:綜合上述的定義,我們給出條件隨機場的定義:設X與Y是隨機變量,P(Y|X)是給定X時Y的條件概率分布,若隨機變量Y構成的是一個馬爾科夫隨機場,則稱條件概率分布P(Y|X)是條件隨機場。

模型特點:CRF是一個判別式模型,就是根據(jù)輸入序列X來給出輸出序列Y的概率分布。

3.?IDCNN/BiLSTM-CRF

?

《新程序員》:云原生和全面數(shù)字化實踐50位技術專家共同創(chuàng)作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的几种NER模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。