yolo算法的优缺点分析_yolo算法介绍
yolo算法介紹
(2020-06-06 16:49:28)
把Yolo模型搞清楚后不得不再次為人類的智慧感慨,一個巧妙的模型。
要想理解Yolo我們先要搞清楚Yolo到底要解決一個什么問題,解決這個問題必須做哪些事情。
Yolo屬于多目標檢測,因此需要解決兩個問題:
1)從一張圖片中可以識別出多個不同種類的物體
2)并且用一個框將每個物體分割出來,既要得到物體的尺寸。
直觀來看這兩個問題,那一個是分類問題,另一個是回歸問題。分類問題就是說能夠從圖片中識別出不同物體種類,回歸問題是可以通過非線性擬合計算出物體的尺寸坐標。
把握住解決問題的實質就可以明確樣本訓練如何設計了,分類問題就是常規的圖像識別,而回歸問題就需要我們提前畫好一個框將被識別物體恰到好處的框起來,這個框的尺寸就是就可以當做目標值。這樣就建立了輸入和輸出的關系:輸入是圖像,輸出是種類和尺寸。
要對圖片中一個物體進行分類,首先要解決如何從圖片中發現這個物體,最直觀的方法就是用不同尺寸的方框進行掃描,這個方框可以被稱為window,和要得到的物體尺寸是兩回事。這就是RNN的方法,但這種方法計算量大,因此出現了Yolo,其核心思想就體現在如何從一張圖像準確獲取目標的方法上。基本思路就是先對圖像進行劃分,劃分成圍棋格子那樣,之后以每個網格為核心進行目標檢測。注意這里的格子仍然是window的概念不是物體尺寸,具體過程是這樣的,訓練對每個網格進行的,這個網格是否能代表某一個物體及物體尺寸在訓練集都是可以得到的。預測同樣也是以每個網格進行的。
這樣就帶來一個問題,如果多個網格都說自己識別到了某一個物體該如何處理,這里使用了基于IOU的非極大值抑制算法,就是找到一個最合理的框,以得分最高的為基準,想同類并且IOU大于0.5的就說明是同一個物體,想同類IOU小于0.5說明雖然是統一物體但可能出現在了照片不同位置。
后來又發現一個問題,同一個格子檢測出兩個物體怎么辦,這是就提出了Anchor
box的概念,既一個格子之前的輸出就是一個物體種類的信息,那現在不是了,可能是2個或3個。這時就帶來了新問題,這么多事先畫好的預選框,各種目標都可能重合,怎么合理分配呢。這是就引入了聚類和金字塔的技術結合的方法:
1)聚類就是把不同預選框按照尺寸進行自動歸類
2)Yolo從模型上建立金字塔模式,將不同預選框按照尺寸分配給不同的特征層。
這樣就實現了大尺寸在深層識別,小尺寸在淺層識別,還實現了語義上下文分析功能,最終得到了完美的多目標檢測算法。
分享:
喜歡
0
贈金筆
加載中,請稍候......
評論加載中,請稍候...
發評論
登錄名: 密碼: 找回密碼 注冊記住登錄狀態
昵???稱:
評論并轉載此博文
發評論
以上網友發言只代表其個人觀點,不代表新浪網的觀點或立場。
總結
以上是生活随笔為你收集整理的yolo算法的优缺点分析_yolo算法介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 对话阿里巴巴副总裁贾扬清:追求大模型,并
- 下一篇: typora公式zuo对齐_Markdo