学习周报20200105 | CS224N
【學(xué)習(xí)周報(bào)】
總結(jié)自己的學(xué)習(xí)和遇到的好材料。
往期回顧:
學(xué)習(xí)周報(bào)20191201 | 語義相似度,TF
學(xué)習(xí)周報(bào)20191208 | BILSTM-CRF,BERT
?學(xué)習(xí)周報(bào)20191215 | NER綜述
學(xué)習(xí)周報(bào)20191221 | charNER,bert-NER
學(xué)習(xí)周報(bào)20191228 | CS224N
CS224N
這周學(xué)到第五章,感覺還是有些收獲的,會(huì)感覺后續(xù)可以出一篇文章談?wù)劺锩娴募?xì)節(jié)問題。
NER
Ner(命名實(shí)體識(shí)別)這塊,自己最近已經(jīng)逐步結(jié)項(xiàng)了,總結(jié)了一些經(jīng)驗(yàn),后續(xù)也會(huì)有文章輸出,這里給大家一些初步的經(jīng)驗(yàn)吧。
規(guī)則是最快最好的,絕對(duì)的高準(zhǔn)確。(這里的規(guī)則多半是詞典標(biāo)注,最大逆向匹配那種,對(duì)詞典要求高)
模型的話,標(biāo)注質(zhì)量很大程度上決定了預(yù)測(cè)質(zhì)量。(質(zhì)量好的話,規(guī)則其實(shí)就能上線了,參考第一條)
模型的話,CRF需要的數(shù)據(jù)量大概在300w左右比較好(短句)。
名詞類比較多的,難度真的不小,真的推薦大家先走詞典。(福建是省,廈門是城市,這種模型來處理難度真的不低)
先聊這么多,這個(gè)看看有沒有成文的條件吧。
總結(jié)
以上是生活随笔為你收集整理的学习周报20200105 | CS224N的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 西部数据移动硬盘设置密码教程
- 下一篇: 连获国际大奖创下史上第一,这家耳机品牌凭