图像识别中卷积神经网络“卷积”的作用
1、單一的像素點(diǎn)包含的信息是無(wú)意義的
2、人在看一個(gè)畫(huà)面時(shí),不會(huì)是一眼就能獲取所有信息的,而是通過(guò)聚焦中心,確定感受野,通過(guò)不斷調(diào)整聚焦中心位置,放大、縮小感受野,從而獲得源源不斷的圖片信息(聚焦中心點(diǎn)和感受野的確定,是要有算法優(yōu)化的,否則會(huì)增加耗時(shí))
3、2中優(yōu)化的方式是通過(guò)對(duì)某一聚焦中心點(diǎn)、感受野“卷積”來(lái)確定的,是否需要優(yōu)化,以何種方式優(yōu)化,在判斷之前就需要確定一個(gè)卷積的方式——即卷積核(像素長(zhǎng)寬、核數(shù)字)
4、人在看東西的時(shí)候,是有記憶的,我們瞬間的視野比例大約為16:9,但是如果有東西超出了這個(gè)比例時(shí),我們會(huì)進(jìn)行“追蹤”,比如通過(guò)連續(xù)的輪廓、色彩等,追蹤后,在我們的記憶中產(chǎn)生了一個(gè)完整的物體,我們?cè)賹?duì)這個(gè)物體使用特定的卷積核去進(jìn)行判斷屬于什么物體
4、一個(gè)畫(huà)面一旦進(jìn)入人類(lèi)視野時(shí),人類(lèi)馬上就會(huì)調(diào)用一種卷積核去判斷,我把它稱為“初判卷積核”,它的作用就是初步確定,這個(gè)物體可能是什么,然后接下來(lái)去調(diào)用可能的物體的卷積核去進(jìn)一步判斷,通過(guò)局部掃描的方式,去逐步確認(rèn),其間,也是可以根據(jù)實(shí)時(shí)掃描得到的結(jié)果更換卷積核的
5、像素點(diǎn)只有組合起來(lái),它才是有信息量的
6、不論是整體特征還是局部特征,都是需要用卷積核去提取的(整體還是局部,只是一個(gè)泛的概念,正確的描述應(yīng)為卷積核的大小)
7、cnn的缺陷?
8、人眼是基于三維成像的,像素的縱深在某一程度上也輔助了識(shí)別,是否能將帶有深度功能的攝像頭采集的深度圖(包含每個(gè)像素點(diǎn)距離觀察點(diǎn)的縱深),與RGB圖共同加入訓(xùn)練?
總結(jié)
以上是生活随笔為你收集整理的图像识别中卷积神经网络“卷积”的作用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 手机相机自动对焦的原理
- 下一篇: 聚焦和增强卷积神经网络