AI入门:不用任何公式把逐步提升讲清楚
全文共?2573?字,13?幅圖,
預計閱讀時間?14?分鐘。
本文所有思路都來自林軒田教授的「機器學習技法」的第八節課件 Adaptive Boosting,純純的致敬!我只是加了點場景使得內容更通俗點。
1
斯蒂文是一名幼兒園教師,有一天,他要教小朋友如何從一堆水果中辨識一堆蘋果。斯蒂文有 10 張蘋果圖片和 10 張非蘋果圖片,如下圖所示。
首先,斯蒂文告訴悠悠、樂樂、丫丫和多多
上面 10 張圖片中顯示的是蘋果
下面 10 張圖片中顯示的不是蘋果
之后他希望用這 20 個例子來教會他們識別蘋果,即讓他們學會提取蘋果的特征,在看到新的水果時一下子就能辨別它是否是蘋果。
2
斯蒂文:看對于這 20?張水果圖片,你怎么來描述蘋果?
悠悠:蘋果是圓的。
悠悠認為「圓」是辨別蘋果的一個特征,根據這個特征,悠悠可以從香蕉圖片里識別出蘋果,因為香蕉不是圓的,但是這個特征永遠適用嗎?不!悠悠用「圓」這個特征來識別蘋果可能會犯兩種錯誤:
沒識別出不圓的蘋果(灰色叉子)
誤識別了圓的非蘋果(粉色叉子)
斯蒂文記下了悠悠犯了錯的圖并將其放大,同時也縮小了悠悠沒犯錯的圖,見下圖。
3
現在識別蘋果的第一個特征是「蘋果是圓的」。
斯蒂文準備叫樂樂來識別蘋果的其他特征。
4
注意,樂樂看到的圖片和悠悠看到的圖片不大一樣,因為斯蒂文根據悠悠的作答,放大她犯錯誤的圖片而縮小沒有犯錯的圖,因此樂樂(任何人)會把注意力放在大圖上。
在那些大圖里,好像「紅」是一個可以很好的區分蘋果和其他水果的特征。
5
斯蒂文:除悠悠說的之外,你還能怎么描述蘋果?
樂樂:蘋果是紅的。
但是「紅」這個特征是否適用那些小圖(即悠悠沒犯錯的圖)?不!樂樂用「紅」這個特征來識別蘋果可能會犯兩種錯誤:
沒識別出不紅(綠)的蘋果(灰色叉子)
誤識別了紅的非蘋果(粉色叉子)
斯蒂文又記下了樂樂犯了錯的圖并將其放大,同時也縮小了樂樂沒犯錯的圖,見下圖。
6
現在識別蘋果的特征是「蘋果有的是圓的,有的是紅的」。
斯蒂文準備叫丫丫來識別蘋果的其他特征。
7
和樂樂把注意力放在悠悠犯的錯的圖片一樣,丫丫的注意力也在樂樂和悠悠同時犯的錯的圖片。
在那些大圖里,好像「綠」是一個可以很好的區分蘋果和其他水果的特征。
8
斯蒂文:除悠悠和樂樂說的之外,你還能怎么描述蘋果?
丫丫:蘋果是綠的。
但是「綠」這個特征是否適用那些小圖(即悠悠和樂樂沒犯錯的圖)?不!丫丫用“綠”這個特征來識別蘋果可能會犯兩種錯誤:
沒認出不綠(紅)的蘋果(很多灰色叉子)
誤認了綠的非蘋果(粉色叉子)
斯蒂文又記下了丫丫犯了錯的圖并將其放大,同時也縮小了丫丫沒犯錯的圖,見下圖。
9
現在識別蘋果的特征是「蘋果有的是圓的,有的是紅的,有的是綠的」。
最后,斯蒂文準備叫多多來識別蘋果的其他特征。
10
像正常人一樣,多多把注意力放在前面三位犯錯最多的兩個圖上。
在那些大圖里,好像「帶把兒」是一個可以很好的區分蘋果和其他水果的特征。
11
斯蒂文:除悠悠、樂樂和丫丫說的之外,你還能怎么描述蘋果?
多多:蘋果是帶把兒的。
最后識別蘋果的特征是“蘋果是有的圓、有的紅、有的綠,帶把兒”。斯蒂文當然還可以繼續問其他小朋友,隨著這個過程,小朋友學到的如何識別蘋果的特征會越來越全。
即便每個小朋友只能從一個方面識別蘋果,但是結合起來的結論就很厲害了,有可能比一個專家來識別蘋果還要準確,這個過程就是個增強或提升(boosting)過程。這個故事的寓意是,如果有一群「弱雞」假設,也可能提升成「戰斗機」假設。
全過程最妙的點就是斯蒂文
放大認錯的圖片
縮小認對的圖片
這跟逐步提升法(adaboost)里面把「分類錯誤的數據權重增大,把分類正確的數據權重減小」的道理是一樣一樣一樣的。
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習在線手冊深度學習在線手冊AI基礎下載(pdf更新到25集)備注:加入本站微信群或者qq群,請回復“加群”獲取一折本站知識星球優惠券,請回復“知識星球”
喜歡文章,點個在看
總結
以上是生活随笔為你收集整理的AI入门:不用任何公式把逐步提升讲清楚的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI入门:不用任何公式把推荐系统讲清楚
- 下一篇: AI入门:无门槛可以玩的神经网络