日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【论文笔记】CNN for NLP

發布時間:2025/5/22 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【论文笔记】CNN for NLP 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是Convolutional Neural Network(卷積神經網絡)?

  最早應該是LeCun(1998)年論文提出,其結果如下:運用于手寫數字識別。詳細就不介紹,可參考zouxy09的專欄,主要關注convolution、pooling,個人理解是這樣的,convolution是做特征檢測,得到多個feature maps,而pooling是對特征進行篩選,提取關鍵信息,過濾掉一些噪音,另一方面是減少訓練參數。

Single Layer CNN

  與圖像處理不同,對于自然語言處理任務來說,輸入一般是用矩陣表示的句子或文檔。對于句子矩陣,每一行表示一個單詞,每個詞可以用向量表示(word2vec or GloVe, but they could also be one-hot vectors)。下面介紹一種簡單的cnn結構,一層convolution+一層pooling。來自Yoon Kim(2014)的論文。

  該CNN很簡單,共分四層,

  第一層是詞向量層,doc中的每個詞,都將其映射到詞向量空間,假設詞向量為k維,則n個詞映射后,相當于生成一張n*k維的圖像;

  第二層是卷積層,多個濾波器作用于詞向量層,不同濾波器生成不同的feature map;

  第三層是pooling層,取每個feature map的最大值,這樣操作可以處理變長文檔,因為第三層輸出只依賴于濾波器的個數;

  第四層是一個全連接的softmax層,輸出是每個類目的概率。除此之外,輸入層可以有兩個channel,其中一個channel采用預先利用word2vec訓練好的詞向量,另一個channel的詞向量可以通過backpropagation在訓練過程中調整。

  這樣做的結果是:在目前通用的7個分類評測任務中,有4個取得了state-of-the-art的結果,另外3個表現接近最好水平。

?

  首先做一些符號說明:輸入是詞向量Xi(長度是k),句子向量Xi:n是詞向量的級聯(拼接成長向量),filter是w,可看成一個滑動窗口,這里的w是向量,長度是hk(滑動窗口包含h個詞)。

  Convolution:卷積操作,f是激活函數,ci表示卷積得到的特征。通過滑動filter w,與句子所有詞進行卷積,可得到feature map?

?  

  Pooling:使用max-pooling獲得feature map中最大的值,然后使用多個filter獲得不同n-grams的特征。

  Multi-Channel:這里很有意思,輸入句子時,使用兩個通道(channel,可以認為是輸入copy一份),都用word2vec初始化,其中一個詞的向量保持不變(static),另一個是non-static,在BP過程不斷修改,最后再pooling前對兩個通道得到的卷積特征進行累加。

  Classification:通過pooling,得到句子最后的特征向量,然后直接用softmax進行分類。

?

轉載于:https://www.cnblogs.com/zeze/p/8253124.html

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的【论文笔记】CNN for NLP的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。