當前位置：首頁 >

论文笔记：Inception v1

發布時間：2025/3/21 22 豆豆

生活随笔收集整理的這篇文章主要介紹了论文笔记：Inception v1 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文：Going Deeper with Convolutions

Inception v1

要解決什么問題？

提高模型的性能，在ILSVRC14比賽中取得領先的效果。
最直接的提高網絡性能方法有兩種：增加網絡的深度（網絡的層數）和增加網絡的寬度（每層的神經元數）。這樣的做法有如下兩個缺點待改進：
- 構建更大的網絡也意味著會有更多的參數，這也會讓網絡更容易過擬合。
- 同時也會需要更多的計算資源。

用了什么方法解決？

效果如何？

還存在什么問題？

對Inception模塊的說明：
采用幾個不同的卷積核意味著具有不同大小的感受野，最后拼接在一起就意味著不同尺度特征的融合。
采用 $\times 1$ 、 $\times 3$ 和 $\times 5$ 的卷積核的目的是為了方便后面對齊。
- 假設卷積的步長 $s t r i d e = 1$ ，那么分別設定 $p a d d i n g = 0 / 1 / 2$ ，那么卷積后可以直接得到相同維度的特征圖，可以直接拼接在一起。
作者提到，pooling對于如今許多卷積神經網絡的成功都有不可或缺的作用，所以他也在Inception內嵌入了 $\times 3$ 的max pooling。
網絡越到后面，特征也越抽象。因為要將這些抽象特征進一步組合起來提取更高維的特征，網絡不能只關注小范圍內的特征信息了，所以需要讓感受野大一些，看到更多的抽象信息。因此， $\times 3$ 和 $\times 5$ 卷積的比例要增加。
Inception模塊還存在一個巨大的問題：那就是使用 $\times 5$ 卷積會帶來大量的計算量。
所以作者又借鑒了Network in Network論文中的方法，使用 $\times 1$ 卷積來降維，減少計算量。改進結構如下圖：

GoogleNet結構說明：
采用Inception模塊堆疊而成。
基于Network in Netw論文中的思想，在最后使用了average pooling來代替展開為全連接層的形式。實驗也證明這樣可以提高top-1準確率大概0.6%。
最后加的那個全連接層主要是為了便于大家將網絡用于其他的數據集finetune。
網絡中使用了dropout防止過擬合。
網絡中還額外增加了兩個輔助的softmax層。主要作用是，避免梯度消失，幫助梯度的傳導。實際測試模型的時候，會將這兩個softmax去除。

Going Deeper with Convolutions

GoogLeNet系列解讀

以上是生活随笔為你收集整理的论文笔记：Inception v1的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。