深度学习在图像领域的几大任务
深度學習對于圖像的檢測共分為4大任務:
從任務需求本身的角度來考慮,由于四個任務的處理結果的信息量依次增加,需要的工具的復雜度會依次增加,因此完成相應任務的難度也會越依次增加。
(1)圖像分類a--->(2)目標檢測b--->(3)語義分割c--->(4)實例分割d(是按照難度遞增的方式)
這張圖完美地解釋了四個的區別。
(1)圖像分類:(Image Classification?)
The task of object classification?requires binary labels indicating whether objects are?present in an image。
圖像分類該任務需要我們對出現在某幅圖像中的物體做標注。(例如輸入一個測試圖片,輸出該圖片中的物體類別)
(2)目標檢測:(或者Object detection?)
Detecting an object entails both?stating that an object belonging to a specified class is?present, and localizing it in the image. The location of?an object is typically represented by a bounding box.?
物體檢測,實現了兩個任務:一是判斷屬于某個特定類的物體是否出現在圖中;二是對該物體定位,定位常用表征就是物體的邊界框。可實現:輸入測試圖片,輸出檢測到的物體類別和位置。
(3)語義分割:(或者Semantic scene labeling?)
The task of labeling semantic objects in a scene requires that each pixel of an?image be labeled as belonging to a category, such as?sky, chair, floor, street, etc. In contrast to the detection?task, individual instances of objects do not need to be?segmented。
語義標注/分割:該任務需要將圖中每一點像素標注為某個物體類別。同一物體的不同實例不需要單獨分割出來。對下圖,標注為人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5。
(4)實例分割(Instance segment??)
實例分割是物體檢測+語義分割的綜合體。相對物體檢測的邊界框,實例分割可精確到物體的邊緣;相對語義分割,實例分割可以標注出圖上同一物體的不同個體(羊1,羊2,羊3...)
?
PS:計算機視覺的三大任務
計算機視覺領域中:分類、定位、檢測這三者的區別。先讓我們需要好好區分一下這三個任務的區別:
A、圖片分類:給定一張圖片,為每張圖片打一個標簽,說出圖片是什么物體,然而因為一張圖片中往往有多個物體,因此我們允許你取出概率最大的5個,只要前五個概率最大的包含了我們人工標定標簽(人工標定每張圖片只有一個標簽,只要你用5個最大概率,猜中其中就可以了),就說你是對的。
B、定位任務:你除了需要預測出圖片的類別,你還要定位出這個物體的位置,同時規定你定位的這個物體框與正確位置差不能超過規定的閾值。
C、檢測任務:給定一張圖片,你把圖片中的所有物體全部給我找出來(包括位置、類別)。
-----------end-------
?
?
總結
以上是生活随笔為你收集整理的深度学习在图像领域的几大任务的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++:随笔2--I/O实践
- 下一篇: C++:随笔3--复杂的数据结构