五个非常实用的自然语言处理资源
摘要:?正在學(xué)習(xí)NLP,手中沒有資源?快來看看這些免費(fèi)的NLP學(xué)習(xí)資源吧!
如果你對自然語言處理方面的資源感興趣,請仔細(xì)閱讀本篇文章。
運(yùn)行數(shù)據(jù)科學(xué)POC的7個(gè)步驟
網(wǎng)上有很多依靠深度學(xué)習(xí)方法的NLP資源,有一些資源理論深厚,十分經(jīng)典,特別是斯坦福大學(xué)和牛津大學(xué)的NLP,其深度學(xué)習(xí)課程為:
l自然語言處理與深度學(xué)習(xí)(斯坦福大學(xué))
l自然語言處理的深度學(xué)習(xí)(牛津大學(xué))
但是如果你已經(jīng)完成了這些,或已經(jīng)在NLP中獲得了基礎(chǔ)并想要轉(zhuǎn)向一些實(shí)用資源,或者只是對其他方法感興趣,希望這篇文章能對你有所幫助。
1.?用Python進(jìn)行自然語言處理—用自然語言工具包分析文本
這是一本至少從實(shí)用性和Python生態(tài)系統(tǒng)的雙重視角介紹自然語言處理的書,它可以用于個(gè)人學(xué)習(xí)或作為自然語言處理或計(jì)算語言學(xué)課程的教科書,或作為人工智能、文本挖掘或語料庫語言學(xué)課程的補(bǔ)充。本書通過使用自然語言工具包(NLTK)來接近NLP。
NLTK包含豐富的軟件、數(shù)據(jù)和文檔,可從http://nltk.org/免費(fèi)下載。發(fā)行版本是由Windows,Macintosh和Unix平臺提供的。我們強(qiáng)烈建議您下載Python和NLTP,并嘗試一下示例和練習(xí)。
2.??深度學(xué)習(xí)自然語言處理:Jupyter筆記本課程
這是一個(gè)Jupyter筆記本并附隨Jon Krohn的關(guān)于NLP深度學(xué)習(xí)的一系列精彩視頻的回購協(xié)議。如果你有興趣觀看他的視頻(它是通過O’Reilly的Safari平臺提供的)請注冊一個(gè)免費(fèi)的10天試用版,。
Jon在這些筆記本和隨附視頻中的主要內(nèi)容包括:
1.預(yù)處理用于機(jī)器學(xué)習(xí)應(yīng)用的自然語言數(shù)據(jù);
2.將自然語言轉(zhuǎn)換為數(shù)字表示(使用word2vec);
3.通過訓(xùn)練自然語言的深層學(xué)習(xí)模型進(jìn)行預(yù)測;
4.在高級TensorFlow API Keras中應(yīng)用先進(jìn)的NLP方法;
5.通過調(diào)整超參數(shù)來提高深度學(xué)習(xí)模型的性能。
3.如何解決90%的NLP問題:一步一步的指導(dǎo)
這是以筆記本的形式出現(xiàn)的另一套非常棒的教程,它遵循類似于上述Krohn的軌跡。Insight AI的Emmanuel Ameisen分解了完成哪些任務(wù)需要執(zhí)行哪些步驟,閱讀完本文后,您將知道如何:
1.收集、準(zhǔn)備和檢查數(shù)據(jù)。
2.從建立簡單的模型開始,并在必要時(shí)過渡到深度學(xué)習(xí)。
3.解釋并理解你的模型,確保您實(shí)際上獲取的是信息而不是噪音。
4.Keras LSTM教程-如何輕松構(gòu)建強(qiáng)大的深度學(xué)習(xí)語言模型
本教程比之前的資源重點(diǎn)更多,因?yàn)樗w了在Keras中實(shí)施用于語言建模的LSTM。它通過附有解釋、代碼和視覺效果對此進(jìn)行了詳細(xì)的介紹說明。在本教程中,我將專注于在Keras中創(chuàng)建LSTM網(wǎng)絡(luò),簡要回顧或概述LSTM的工作原理。在Keras LSTM教程中,我們將利用稱為PTB語料庫的大型文本數(shù)據(jù)集來實(shí)現(xiàn)序列到序列的文本預(yù)測模型。
5.使用組合LSTM-CNN模型的Twitter情感分析
這是一篇較短的教程(它是一個(gè)文章的概述),其中有使用LSTM/CNN的組合方法的代碼來分析情感。該項(xiàng)目顛覆了體系結(jié)構(gòu),并報(bào)告了不同的結(jié)果。
我們的CNN-LSTM模型的準(zhǔn)確度比CNN模型高3%,但比LSTM模型差3.2%。同時(shí),我們的LSTM-CNN模型比CNN模型的性能好8.5%,比LSTM模型好2.7%。
關(guān)于該項(xiàng)目的結(jié)果的可靠性,我暫時(shí)無法保證。但是,其創(chuàng)新的情感分析方式與混合在不同的神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)中搭配使用,使我將其納入該列表中,希望能對讀者有所啟發(fā)。
相關(guān):
l免費(fèi)資源,用于深入學(xué)習(xí)自然語言處理入門。
l自然語言處理鍵術(shù)語,解釋。
l處理文本數(shù)據(jù)科學(xué)任務(wù)的框架。
本文由阿里云云棲社區(qū)組織翻譯。
文章原標(biāo)題《5 Fantastic Practical Natural Language Processing Resources》
作者:Matthew Mayo
譯者:烏拉烏拉,審校:袁虎。
原文鏈接
干貨好文,請關(guān)注掃描以下二維碼:
總結(jié)
以上是生活随笔為你收集整理的五个非常实用的自然语言处理资源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【 CDN 最佳实践】CDN 命中率优化
- 下一篇: MaxCompute理解数据、运算和用户