VGG-16网络结构解析
VGG,也叫做VGG-16網絡。這個網絡結構很有意思,相必實現這個網絡的作者是有點強迫癥,不然整個網絡為什么能夠如此的協調一致。基本上每一次的內容都大同小異,2層或3層卷積層,激活一下,池化一下,就接下一層了。
值得注意的一點是,VGG-16網絡沒有那么多超參數,這是一種只需要專注于構建卷積層的簡單網絡。首先用3×3,步幅為1的過濾器構建卷積層,padding參數為same。然后用一個2*2,步幅為2的過濾器構建最大池化層。因此VGG網絡的一大優點是它確實簡化了神經網絡結構。
假設要識別一張圖像224×224×3,在最開始的兩層用64個3×3,步幅為1,padding參數為same的過濾器對輸入圖像進行卷積,輸出結果是224×224×64,網絡結構如下:
?注記:
1。VGG-16的這個數字16,就是指在這個網絡中包含16個卷積層和全連接層。確實是個很大的網絡,總共包含1.38億個參數,即便以現在的標準來看都是非常大的網絡。但VGG-16結構并不復雜,這點非常吸引人,而且這種網絡結構很規整,都是幾個卷積層后面跟著可以壓縮圖像大小的池化層,池化層縮小圖像的高度和寬度。同時,卷積層的過濾器數量變化存在一定的規律,由
作者可能認為512已經足夠大了,所以后面的層就不再翻倍了。無論如何,每一步都進行翻倍,或者說在每一組卷積層進行過濾器翻倍操作,正是設計此種網絡結構的另一個簡單原則。這種相對一致的網絡結構對研究者很有吸引力,而它的主要缺點是需要訓練的特征數量非常巨大。文中揭示了,隨著網絡的加深,圖像的高度和寬度都在以一定的規律不斷縮小,每次池化后剛好縮小一半,而通道數量在不斷增加,而且剛好也是在每組卷積操作后增加一倍。也就是說,圖像縮小的比例和通道數增加的比例是有規律的。從這個角度來看,這篇論文很吸引人。
總結
以上是生活随笔為你收集整理的VGG-16网络结构解析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 视频工时测量软件哪个好,为什么越来越多的
- 下一篇: 图像处理: 超像素(superpixel