赠书福利 | 首本理论和实战结合的深度学习书籍
市面上關于深度學習的書籍很多,本書最大的特點是理論結合實戰和內容的廣度。現在大家能夠看到的深度學習書籍大概可以分為兩類,一類只關注理論而另一類只關注應用。前者多為一些會議論文集,當然也包括 Ian Goodfellow 和 Yoshua Bengio 等人的 Deep Learning。這類書籍的讀者是專業的研究者和相關專業的學生,它更多的是關注基礎理論和最新的前沿進展。這類書籍通常比較難懂,而且讀完之后仍然不知道怎么動手解決問題。
而另外一類書籍更關注應用,多為框架工具的介紹,偶爾提及一些理論也是點到而止,在讀者看來各種算法只是一個黑盒子,雖然能跑起來,但是知其然不知其所以然,不知道怎么調優,碰到問題時更加不知道怎么解決。
本書的目標是使用通俗易懂的語言來介紹基礎理論和最新的進展,同時也介紹代碼的實現。通過理論與實踐的結合使讀者更加深入的理解理論知識,同時也把理論知識用于指導實踐。因此本書的一大特點就是每介紹完一個模型都會介紹它的實現,讀者閱讀完一個模型的介紹之后就可以運行、閱讀和修改一下這些代碼,從而可以更加深刻的理解理論知識。
本書第二個比較大的特點就是內容的廣度,本書覆蓋聽覺、視覺、語言和強化學習四大領域。從章節的命名讀者也可以看到作者的”野心”,本書覆蓋了深度學習的大部分常見應用方向。市面上的書大部分只介紹視覺和語言的內容,而且一般也只限于 CNN 用于簡單的圖像分類或者 RNN、seq2seq 模型在 NLP 中的應用。
本書的視覺部分除了介紹 CNN 以及最新的 ResNet 和 Inception 模型之外,還介紹了用于目標檢測的 R-CNN、Fast R-CNN、Faster R-CNN 模型;用于實例分割的 Mask R-CNN 模型;用于人臉識別的 FaceNet;還包括 Neural Style Transfer 和 GAN(包括 DCGAN 和 Cycle GAN)。
語言部分除了很多書都有的 RNN/LSTM/GRU 等基礎模型,用于機器翻譯、chatbot 的 seq2seq 模型和 Attention 機制之外還包括最新的 ELMo、OpenAI GPT 和 BERT 等模型,此外本書還介紹了 NLP 的很多經典任務,包括語言模型、詞性標注、成分句法分析、依存句法分析和機器翻譯。除了介紹深度學習的解決方案之外也會介紹傳統的基于統計機器學習的方法,讓讀者能夠了解這個領域的發展過程。
而聽覺和強化學習是目前市面上大部分書都很少提及的內容。大家都知道?2012?年?AlexNet?在視覺領域的突破,但是深度學習最早的突破其實發生在語音識別方向。本書會詳細介紹經典的基于?HMM-GMM?的語音識別系統,包括基于?WFST?的解碼器和?Kaldi?的用法。接著會介紹?HMM-DNN?系統,然后到最新的?End-to-End?的語音識別系統,主要會介紹?CTC?模型,包括?CTC?用于驗證碼識別的示例和?DeepSpeech?系統。最后會介紹使用?CNN?實現簡單的語音關鍵詞識別,這個簡單的例子在智能設備上會非常有用。
國內關于強化學習的書籍不多,因此本書首先用一章的篇幅介紹強化學習的基本概念,包括?MDP、動態規劃、蒙特卡羅方法、TD?學習和?Policy Gradient。接著會介紹?DQN、基于深度學習的?Policy Gradient?算法,最后是介紹?AlphaGo、AlphaGo Zero?和?Alpha Zero?算法。
由于涉及的內容很廣,再加上作者比較啰嗦的寫作方式,所以幾年下來寫的內容竟然上千頁。出版社的編輯說書太厚這沒法出版。因此把這本書拆分成了兩本:《深度學習理論與實戰:基礎篇》和《深度學習理論與實戰:提高篇》。提高篇免費開放,供大家參考,希望對大家的工作有所幫助。如果讀者在閱讀提高篇有一些困難,那么建議讀者可以上網(https://item.jd.com/12543405.html)購買基礎篇,先學習需要的基礎知識。
《深度學習理論與實戰:基礎篇》共包含 8 章,每章的主要內容如下:
第 1 章介紹人工智能的發展歷程和機器學習的基本概念,使用通俗的語言介紹機器學習任務的分類、常見模型、損失函數和衡量指標,最后通過一個簡單的線性回歸示例來加深對這些概念的理解。
第 2 章介紹全連接神經網絡的基本概念和反向傳播算法的詳細推導過程,不使用框架完全自己實現一個多層的神經網絡來識別 MNIST 的手寫數字。接下來介紹基本的優化技巧,包括激活函數的選擇、參數的初始化、Dropout、BatchNormalization 和 Adam等學習率自適應算法。
第 3 章介紹卷積神經網絡,使用卷積神經網絡來解決 MNIST 和 CIFAR-10數據集的識別問題,通過 CIFAR-10 的例子介紹怎么在 TensorFlow 里使用多 GPU 訓練,最后介紹殘差神經網絡。
第 4 章介紹循環神經網絡,使用它來實現姓名分類及生成莎士比亞風格的句子,接著會介紹 Seq2Seq 模型和注意力機制,使用它們來實現英語—法語、漢語—英語的機器翻譯功能。
第 5 章介紹生成對抗網絡,介紹對抗訓練的基本原理和 DCGAN 模型,最后使用? DCGAN 來實現人臉照片的生成。
第 6 章介紹 TensorFlow,首先介紹基本概念、優化器和數據輸入輸出等,然后介紹全連接神經網絡和卷積神經網絡等常見網絡結構。因為 RNN 的復雜性,我們單獨使用一節來詳細介紹怎么在 TensorFlow 使用 RNN、LSTM 和 GRU。接著介紹高層的 Estimator API 和 TensorBoard,以及怎么調試 TensorFlow 代碼。最后介紹模型的保存和 TensorFlowServing。
第 7 章介紹 PyTorch,通過使用不同的方法來實現三層的神經網絡來重點介紹 Autograd,包括數據的加載和處理,最后是一個遷移學習的示例。
第 8 章介紹 Keras,包括卷積神經網絡、殘差神經網絡和循環神經網絡在 Keras 里的用法,最后通過簡短的代碼示例來演示怎么實現文本圖片的分類、圖片問答和視頻問答。
《深度學習理論與實戰:基礎篇》配套的源代碼網站為:
https://github.com/fancyerii/deep_learning_theory_and_practice
里面包含全部可以運行的代碼,如果大家發現代碼有問題也歡迎在這里提交 issue。
?
看到那么多干貨內容
是不是迫不及待想要一睹為快?
小編這就為你奉上獨家贈書福利!
轉發本文到朋友圈
將截圖發送至公眾號后臺
并在文末留言區說出
你對這本新書有哪些期待
我們將隨機抽取 5 位讀者
送出這本干貨滿滿的新書
留言截止時間:7?月 24?日 12:00
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?|?一鍵購書
總結
以上是生活随笔為你收集整理的赠书福利 | 首本理论和实战结合的深度学习书籍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ACL 2019 开源论文 | 基于知识
- 下一篇: ICCV Neural Architec