2020年计算机视觉学习指南
點擊上方“算法猿的成長“,關注公眾號,選擇加“星標“或“置頂”
總第 134 篇文章,本文大約 3000?字,閱讀大約需要 10?分鐘
原文:https://towardsdatascience.com/guide-to-learn-computer-vision-in-2020-36f19d92c934
作者:Insaf Ashrapov
譯者:kbsc13(公眾號:算法猿的成長)
前言
本文推薦的教程資源都是基于我個人的經驗,它們對增加你的計算機視覺理論知識非常有幫助。另外,在學習計算機視覺的理論前,先了解和學習機器學習和 python 方面的知識是更好的做法。框架
不需要在開始學習計算機視覺的時候,就選擇使用框架,但應用新獲得的知識是必要的。
對于框架的推薦,沒有其他的推薦:
pytorch:https://pytorch.org/tutorials/
keras(TensorFlow):https://www.tensorflow.org/guide/keras
Pytorch 可能需要寫更多的代碼,但是它更加靈活,所以最好選擇使用它,并且越來越多的深度學習研究者都開始采用這個框架。
Albumentation(圖像增強)和 catalyst(一個封裝 pytorch 的高級 API 的框架)也同樣是非常有幫助的,所以也可以使用它們,特別是第一個圖像增強的框架--Albumentation。
硬件
Nvidia GPU 10XX+ 型號已經足夠使用了(大約 300$)
Kaggle 的 kernels:https://www.kaggle.com/kernels,每周免費使用 30 個小時;
谷歌的 Colab:https://colab.research.google.com/,每個會話有 12 個小時的限制,每周免費時長限制未知。
理論&實踐
網上課程
CS231n:http://cs231n.stanford.edu/,是首選的網上課程,它介紹了計算機視覺的所有必須掌握的基礎知識。在 Youtube 上有課程視頻,它們還有課后練習,但不建議去完成它們(盡管是免費的);
Fast.ai:https://course.fast.ai/,第二門應該看的課程。fast.ai 也是一個封裝了 pytorch 的高級框架,但它們很頻繁更改它們的 API 接口,并且缺乏文檔,這都是它不被推薦采用的原因。但觀看它們的課程視頻是可以了解到理論和有趣的技巧,這是值得花費時間的。
當學習這些課程的時候,推薦將這些理論通過推薦的框架來進行實現。
論文和代碼
https://arxiv.org/:免費獲取最新論文的網站
https://paperswithcode.com/sota:展示了深度學習最新的性能最佳的論文,不僅僅是計算機視覺方面的;
https://github.com/topics/computer-vision?l=python:可以在這找到代碼實現的算法
書籍
并沒有太多書需要閱讀的,除了下面兩本我覺得是非常有用的書,可以任選 pytorch 或者 keras 來實現代碼
Deep Learning with Python:https://www.amazon.com/Deep-Learning-Python-Francois-Chollet/dp/1617294438,作者是 Keras 的開發者、谷歌 AI 研究者--Fran?ois Chollet。這不是一本免費的書,但這本書易于理解,并且可以學到很多之前不知道的知識點;
Deep learning with Pytorch:https://pytorch.org/deep-learning-with-pytorch-thank-you,免費的書籍,來自 pytorch 團隊的 Eli Stevens & Luca Antiga
Kaggle
網址:https://www.kaggle.com/competitions
Kaggle 是一個著名的機器學習比賽在線平臺,它包含了各種類型的比賽,其中很多都是計算機視覺方面的比賽。在沒有學完課程的時候,就可以開始參加比賽了,因為從比賽開始,可以免費運行很多公開的 kernels(公開的端到端的代碼)。
比較困難的學習路線
另外一條學習路徑可能是非常困難,但是你不僅可以學到只是做訓練模型并預測結果的知識,還可以實現自己的研究,參考自Sergei Belousov aka bes。
需要做的就是閱讀并實現下面的所有論文,當然僅僅讀完也是非常棒的。
網絡結構
AlexNet: https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks
ZFNet: https://arxiv.org/abs/1311.2901
VGG16: https://arxiv.org/abs/1505.06798
ResNet: https://arxiv.org/abs/1704.06904
GoogLeNet: https://arxiv.org/abs/1409.4842
Inception: https://arxiv.org/abs/1512.00567
Xception: https://arxiv.org/abs/1610.02357
MobileNet: https://arxiv.org/abs/1704.04861
語義分割
FCN: https://arxiv.org/abs/1411.4038
SegNet: https://arxiv.org/abs/1511.00561
UNet: https://arxiv.org/abs/1505.04597
PSPNet: https://arxiv.org/abs/1612.01105
DeepLab: https://arxiv.org/abs/1606.00915
ICNet: https://arxiv.org/abs/1704.08545
ENet: https://arxiv.org/abs/1606.02147
生成對抗網絡(GAN)
GAN: https://arxiv.org/abs/1406.2661
DCGAN: https://arxiv.org/abs/1511.06434
WGAN: https://arxiv.org/abs/1701.07875
Pix2Pix: https://arxiv.org/abs/1611.07004
CycleGAN: https://arxiv.org/abs/1703.10593
目標檢測
RCNN: https://arxiv.org/abs/1311.2524
Fast-RCNN: https://arxiv.org/abs/1504.08083
Faster-RCNN: https://arxiv.org/abs/1506.01497
SSD: https://arxiv.org/abs/1512.02325
YOLO: https://arxiv.org/abs/1506.02640
YOLO9000: https://arxiv.org/abs/1612.08242
實例分割
Mask-RCNN: https://arxiv.org/abs/1703.06870
YOLACT: https://arxiv.org/abs/1904.02689
姿勢預估
PoseNet: https://arxiv.org/abs/1505.07427
DensePose: https://arxiv.org/abs/1802.00434
小結
這篇文章是原文作者推薦的入門計算機視覺的一些資源,包括推薦采用的深度學習框架、課程、電子書、查閱論文和代碼的網站,以及一個比賽網站,kaggle;
另外還有一條會更加困難的學習路線,也就是閱讀經典的論文,從網絡結構到常見的計算機視覺方向,檢測、分割、GAN以及姿勢預估,但完成后收獲就會更多,不僅僅是只會運用框架來訓練模型,解決問題,還有機會往研究方向發展。
最后,也可以通過下方搜索框搜索公眾號更新過的計算機視覺、深度學習和pytorch相關的文章,了解更多相關的知識。
精選AI文章
1.?10個實用的機器學習建議
2.?深度學習算法簡要綜述(上)
3.?深度學習算法簡要綜述(上)
4.?編寫高效的PyTorch代碼技巧(上)
5.?編寫高效的PyTorch代碼技巧(下)
精選python文章
1.??python數據模型
2.?python版代碼整潔之道
3.?快速入門 Jupyter notebook
4.?Jupyter 進階教程
5.?10個高效的pandas技巧
精選教程資源文章
1.?[資源分享] TensorFlow 官方中文版教程來了
2.?[資源]推薦一些Python書籍和教程,入門和進階的都有!
3.?[Github項目推薦] 推薦三個助你更好利用Github的工具
4.?Github上的各大高校資料以及國外公開課視頻
5.?GitHub上有哪些比較好的計算機視覺/機器視覺的項目?
歡迎關注我的微信公眾號--算法猿的成長,或者掃描下方的二維碼,大家一起交流,學習和進步!
?如果覺得不錯,在看、轉發就是對小編的一個支持!
總結
以上是生活随笔為你收集整理的2020年计算机视觉学习指南的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开发中常用的19 条 MySQL 优化技
- 下一篇: 怎样用计算机制作思维导图,手把手教你如何