日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Lesson 7(12)神经网络的诞生与发展机器学习基本概念

發布時間:2025/4/5 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Lesson 7(12)神经网络的诞生与发展机器学习基本概念 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

歡迎來到《2021?PyTorch深度學習實戰》課程的第二周!在今天的課程之前我們已經介紹了GPU件、進行了深度學習框架PyTorch的部署與安裝,并且學習了深度學習基本數據結構Tensor(張量)與關鍵庫autograd的用法本周我們將正式進入神經網絡以及其他深度學習關鍵概念的學習??

作為0基礎課程我們假設你對機器學習深度學習人工智能等概念并沒有深入的了解即便你已經學習過一些相關概念,我依然建議你學習本課程的第一部作知識參考與補充用在本周學習開始之前請確保你已經安裝可以正常運行的PyTorch,并對Tensor概念有了一定的認識全部課程將會在Jupyter上運行,請盡量與老師使用的工具保持一致

目錄

一、深度學習、機器學習、人工智能與神經網絡

二、深度學習前沿研究成果及酷炫應用展示?

三、機器學習中的基本概念?

1?樣本、特征、標簽

2?分類與回歸?

3?有監督算法與無監督算法

4?如何判斷我的模型是一個好模型

一、深度學習、機器學習、人工智能與神經網絡

這是一個人人都熟悉人工智能一詞的時代學習這門課程的你應該早就聽說過深度學習機器學人工智能這些專業名詞許多人是在研究過這些概念并且深思熟慮之后才確定了方向開始進行學習但也有許多人可能是因學業或事業要求需要完成一些深度學習相關的任務在明確了解深度學習等概念之前就開始了學習如果你是前者那你非常具有前瞻性如果你是后者那你非常幸運你將學習的技能可能是本世紀最重要最有商業價值的技能之一無論你是出于什么目的進行學習你都需要對相關的專業名詞有深入的理解在這一節我就帶你了解一下神經網絡是怎么誕生以及機器學習、深度學習、人工智能這些概念,究竟彼此之間有什么關系

你可以在許多地方找到這些概念的定義但是這些定義恐怕很難讓你產生對這些概念的進一步認技術的領域里這些概念之間是有著復雜的歷史關系的所有的一切都是圍繞著人類最初的預測未來?的渴望展開

人們總是希望能夠提前得知未來會發生的事如果我能知道明天會下雨我就會帶傘如果我們知道哪支股票明天會漲,我就會在今天買入——提前預測短時間內的未來會給我們的生活帶來巨大的便利??如果這種短時間預測能夠規模化就會產生巨大的商業價值——1930年代的數學家喬治蓋洛普就曾經做到過他在沒有計算機沒有數據庫的情況下靠人力手算正確預測了《亂世佳人》電影的票房準確率達到94%,直接就讓好萊塢制片人都跪下來叫爸爸求著他做電影數據運營

實際上這種短時預測很多時候都可以被實現比如常常在海上航行的船員看到云的流動感受風的方向就知道會不會下雨有經驗的股票經紀人銀行經紀人在深入研究某個公司的狀況之后能夠判斷這個公司的股票會不會漲……你可能已經發現了這種預測和判斷需要的是在某個領域深入的?知識和經驗。但是,經驗和知識是無法在一夜之間獲得的,在商業價值極高的領域(例如電影融)就更是如此即便學習相同的知識每個人能夠達到的水平也是不一致的如果從培養精尖人才?開始考慮預測的規模化問題那成本就高得離譜了

所以預測的規模化非常難以實現為了解決這個問題許多學科的尖端人才都在預測未來這個領域努力過。以喬治蓋洛普為代表的數學家統計學家們一馬當先先提出了用數學模型代替人類進行學的概念。依靠概率計算、模式擬合(pattern fit)等方法、數學家們創造了許多數學模型(最典型的就是線性回歸、貝葉斯模型等),這些模型能夠根據歷史數據學習出某種規律,并依賴這些規律實現預比如最典型的線性回歸就是假設輸入與輸出數據之間是直線關系通過歷史數據擬合出直線后再給出新的輸入數據線性回歸模型就可以根據已經得出的直線推斷出輸出這些模型的學習方式與人類并不相似但是他們確實擁有從過去學習并用學到的東西去進行預測的能力后來數學家們將能夠根據歷史數據實現預測或得出某種結果的計算步驟或計算方法稱之為算

當算法出現之后計算機科學家們也發現了機會算法是數學方法即便實現了學習和預測的過程是需要人為進行計算沒有規模化的可能而計算機天生擁有規模化的能力只要編好特定的程算機可以在很短的時間內給出大量的預測結果時效性很強因此計算機與數學的結合可謂是歷史必然用計算機實現數學家們提出的算法可以瞬間提升學習預測的效率從這一瞬間開始預測的規模化真正成為了可能現在唯一的問題就是數學家們提出的算法如何才能進行更準確的預

當計算機科學家與數學家都一門心思在搞數學各種研究算法時從全新角度提出全新思想并且從此讓人工智能走上歷史舞臺的人們是——哲學家與心理學家們

哲學家相信人類的思考是一種自然現象與地球自轉春秋更替一樣大腦的思考也是具有規律和機制的只要有機制就可以模仿只要有規律就可以復現模仿其結構復現其規就很有可能模擬出它的功能實現像人類一樣的學習和預測具腦神經科學家研究人腦中具有300億個神經元些神經元通過叫做軸突的結構鏈接在一起在人類進行學習或思考時電信號會在神經元上傳入出,并逐漸被大腦所理解

1943在哲學數學心理學以及腦神經科學的相互碰撞下模擬人腦結構復現人腦思考規律制造和人相似的智慧為目的的算法——人工神經網絡(ANN誕生了它用一個簡單的圖形模擬了人腦的學習方式——我們使用圓來表示神經元使用線來模擬軸突數據就是電信號我們從神經元左側輸入數據讓神經元處理數據并從右側輸出預測結果看起來就和人類學習的方式非常相似

一時之間模擬人類智力的研究領域人聲鼎沸相關研究遍地開花好不熱鬧?

二戰結束后計算機科學與算法發展迅速研究者們普遍接受了使用計算機來規模化算法學習和預測的過程1950圖靈測試被定義如果一臺計算機能夠與人類展開對話而沒有被辨別出其機器身份?那么這臺機器就具有智能1956人工智能概念也被提出指代模擬人類智慧的各項相關研究同年機器學習概念被定義用以表示使用計算機實現算法使得計算機能夠學習數據獲得經驗實現預測的過程,同時,許多經典的預測模型、包括神經網絡也都被統稱為"機器學習算法"也因此,神經網絡算法的許多思想,都與傳統機器學習算法是共通的

就在各個學科都迅猛發展、熱鬧非凡的時候,神經網——它撲街了

發生了什么呢?人們發現,神經網絡的設計理念——模擬人類大腦——確實非常先進但是神經網絡算法本身有幾個致命的弱點

  • 預測效果差

人工神經網絡算法本身存在著許多缺陷和局限,這讓它的效果在許多實際數據上都很糟糕(最初的神經網絡不能實現非線性預測、還存在嚴重的過擬合問題

  • 數據需求大

神經網絡需要大量的數據去喂養在缺乏數據的情況下它的效果常常不如其他機器學習算法

  • 算時間長

大量的數據需要大量的時間進行計算而神經網絡的計算機制本身也很復雜計算時間過長不僅占用資源不利于調優還大大削弱了預測的時效性

而最致命的弱點是

  • 根本無法達到人類智力水

無論如何訓練神經網絡都不能達到人類的智力水平短時間內也看不到其他商業應用場景投資者們的幻想破滅政府和金融機構都撤出投資

沒有資本一切都停止了轉動很快無論是學術界還是工業界都發現神經網絡是一條走不通的道同時期邏輯回歸KNN決策樹等算法被逐漸發明出來機器學習中的其他算法開始繁榮發展,?神經網絡卻無人問津在此之后使用神經網絡算法的學術論文有很大可能無法被發表,相關的學術項目也無法拉到經費這又進一步壓榨了神經網絡研究者們的生存空間十年之后其他機器學習算法的性能也逐漸遇到了瓶頸雖然不像神經網絡一樣處處都是致命的缺陷,但經典機器學習算法的預測效果也沒有達到能夠實現商業價值的程度,整體來說預測效果依然不佳整個人工智能及機器學習研究都進入到寒冬期,三十年間人工智能成了冷門的研究領域

寒冬一直持續到2000年。與1970年代不同,新世紀到來時,神經網絡算法被大規模應用的各項條件已經成熟

  • 神經網絡算法有了長足的進

在寒冬期堅信神經網絡潛力的科學家們做出了許多的努力來改良神經網絡他們一面提升神經網絡的預測效果、一面減少神經網絡的訓練時間,發明了反向傳播等至今都十分關鍵的技術在算法層面讓神經網絡上了一個臺階這些改良的技術,我們都會在后續的課程《優化神經網絡》的部分學到

  • 全球數據量激增

互聯網的誕生計算機的推廣讓全球數據量激增并且讓巨量數據的儲存和使用成為了可能訓練神經網絡所需的數據量不再成為問題

  • 芯片云技術迅猛發展人類獲得了前所未有的巨大算力

比起1970年代,??2000年之后的計算資源價格大幅下跌,同樣價格可以購買到的計算資源越來越強大。當計算資源變得越來越容易獲取神經網絡的計算速度得到提升能夠使用的數據量也變得更

算法數據與算力的進步完全釋放了神經網絡的潛力當數據量夠大神經網絡夠復雜神經網絡的性能會遠遠超出其他機器學習算法甚至超越人類這為預測算法的商業化應用打下了基礎

而最為關鍵的是,大家發現,我們之前弄錯技能點了??在大部分的商業應用場景我們根本不需要人類級別的智力!我們只需要一個能夠將大規模任務完成得很好的機器??比如如火車站飛機場的人臉識我們根本不需要使用神經網絡創造出一個檢票員我們只需要一塊屏幕以及能夠識別此人與其身份證照片數據的工具就可以了。

2006年時,神經網絡的資深研究者Hinton提議為神經網絡的相關研究取一個單獨的名字這個名字聽起來得比機器學習厲害比機器學習更有希望它必須代表了神經網絡越大越深效果就會越好的特性這個名字將會成為人工智能實現的基礎并且在21世紀剩下的幾十年中成為非常關鍵的技這個名字就是今天我們都很熟悉的深度學習

說到這里相信你已經對神經網絡的相關事實有了深刻的印象并且對深度學習相關概念有了清楚的認從歷史發展的脈絡來看人工智能是模擬人類智慧的各項相關研究它包括了模擬人類學習和預測能力的機器學習算法機器學習算法賦予計算機學習的能力而神經網絡是機器學習中最強大果最優的算法深度學習是專門研究神經網絡的學科因此它是機器學習的子集。現我們說到的人工智能技術一般泛指深度學習與機器學習技術人工智能也是深度學習與機器學習實際應用的表現?

還有一些說法認為機器學習與人工智能是交叉學科即部分機器學習算法是為人工智能技術服人工智能技術中也只有一部分是機器學習現在這種說法也被越來越多的人所接受但無論如何器學習和深度學習對于人工智能的實現是有巨大影響的

如今的商業環境中規模化應用的算法基本都是深度學習或機器學習與深度學習的結合我們如果想在算法領域深入下去就必須學習深度學習從今天的情況來看深度學習算法還有極大的潛隨著算法數據與算力三個方向的不斷發展神經網絡具備完全替代部分技巧性工作的可能性即便神經網絡的發展在今天就停止,它也已經極大地改變了我們的生活方式——現在許多自媒體平臺都有使用以深度學習為基礎的推薦系統如抖音快手同時美團對外賣騎手的統籌淘寶京東的猜你喜歡也都是深度學習應用的實際場景

二、深度學習前沿研究成果及酷炫應用展示?

在這里,我給大家總結了一些2021年酷炫的AI其中許多視頻來自油管需要科學上網注意學上網后不能上B站,如果你需要看B站的視頻可以先關閉科學上網工具如果你對英文不熟悉油管播放器的右下角可以自動調出字幕你可以選擇中文字幕順便一說作為深度學習技術集大成的Google的是視頻平臺,油管的字幕是語音捕捉后自動翻譯的無論是捕捉還是翻譯過程都由深度學習算法完成,你可以盡情地體驗油管帶來的感受。

三、機器學習中的基本概念?

我們現在已經了解了神經網絡是如何誕生的了解了它與人工智能機器學習深度學習都有什么關接下來我們需要了解機器學習中的許多通用概念并將其推廣到神經網絡之中來幫助我們理解神經網絡算法的方方面面注意雖然許多概念在深度學習和機器學習中有同樣的含義但因應用場不同這些概念的相關知識也會有所區別在這里我們只會講解與深度學習相關的部分

1?樣本特征標簽

在使用機器學習或深度學習算法之前,我們往往被賦予了需要完成的任務在傳統機器學習中,我們的入門級任務一般是這樣的我希望算法為我判斷一朵花是什么類型的花于是我們收集了以下的數

機器學習中我們使用的數據一般都是mn列的二維數據表這些表格通常是規則儲存的數字或者文通常表示為NumPy中的array或者Pandas中的DataFrame(熟悉Python的你應該能夠看出來圖是一個DataFrame)。

在這個數據表中橫向的每一行就是樣本samples),是我們收集到的一條條數據比如說現在展現的這個數據集每條樣本就是一朵花。

每一行前的數字是樣本的索引(Index),也就是每一朵花的編號這個編號對于每一個樣本而言是獨一無二的

數據表中的列則表示每個樣本的一些屬性在機器學習中我們稱其為特征features),也叫做字段維度注意這里的維度與二維表的維度可不是相同的含義前者指的是n的大小后者指的.shape后返回的數字的個數

展示的最后的一列是標簽label),也叫做目標變量(target或者target?variable)。標簽也是樣本的一種屬性不過通常來說它是我們希望算法進行預測判斷的問題的正確答案比如現在的問題是一朵花是什么類型的花??而這個數據表中的標簽就是是哪一種花

在經典機器學習中因為數據表總是由一個個的特征組成所以我們一般把數據表(不包括標簽的稱之為特征矩陣往往使用大寫且加粗X來表示同樣的我們使用字母x表示每個特征.

在深度學習的世界中我們接到的任務往往是這樣的辨別下面的圖片中是貓還是狗

在這種預測要求下數據就不再是二維表了而是語音圖像視頻這些非結構化數據對于深度學習而言,我們使用的基本數據結構是張量Tensor單一的圖像數據就需要三維Tensor來進行表示語音和視頻數據維度則更高所以我們的入門數據集的結構往往看起來是這樣的?

?或者是這樣的

在第一個例子中我們的Tensor結構為[32,1,28,28]這里的32就是索引表圖像上的32張圖其中每張圖都需要一個三維張量來表示而在第二個例子中因為只有一張圖所以沒有索引其結構也只有三維。1是顏色通道,28、28是像素點。

在高維張量的操作中我們一般不會再區分行列而是認為每個索引對應的對象就是一個樣本比如結構[32,1,28,28]實際上就是32個三維Tensor所組成的四維Tensor32個三維Tensor就是32張圖也就是32個樣本而這些三維Tensor所包含的內容也就是32個樣本分別對應的特征由于我們所使用的張量往往是高于兩個維度的因此我們不能稱其為矩陣因此對于深度學習我們一般稱特征所在的張量叫做特征張量同樣的我們還是用大寫且加粗的X表示特征張量

由于數據是非結構化的所以標簽也不會位于數據的最后一列之列的在深度學習中標簽幾乎100%是和數據集分開的不過這些標簽看起來都很普通和機器學習中的標簽差不多

2?分類與回歸?

標簽是機器學習中非常重要的一個概念不同的標簽指向了不同的問題。機器學習可以解決現實中廣泛存在的各種問題,但是應用最廣泛的問題主要是兩類分類與回歸

當機器學習在判斷有無是否A還是B還是C它預測出的答案會是某種類別這就是分類問比如剛才我們假設的判斷一朵花是哪一種花當機器學習在預測是多少增長多少這些問題它給出的答案就是某個具體的數字這就是回歸問題最典型的預測某支股票會不會漲是分類問題預測某支股票會漲/跌多大幅度是回歸問題你可能注意到類與回歸的區別就在于預測目標的不同在具體數據中也就表現為標簽的不同

在分類問題中標簽是類別,表現為離散型變量(Categorical),往往是整數,如0??1??2等。

而在回歸問題中,標簽是具體數字,表現為連續型變量(Continuous),往往是連續的浮點數?

在機器學習中,標簽是會隨算法的任務的變化而變化的——比如判斷是哪一種花標簽就是是哪種這一列假設我們想預測的是花瓣的長度那標簽就是花瓣長這一列了所以在許多經典機器學習的應用案例中第一步是根據業務問題定義標簽幸運的是在深度學習中這種情況非常非常少但在實際應用時我們也可能會遇見需要抉擇標簽的時候知道標簽是可以變化的是人為規定的這一點非常重要

當然除了分類與回歸之外算法還有許多應用場景但在最初學習深度學習的時候我們會接觸到的幾乎都是分類或回歸任務我們會在未來的課程中慢慢給大家講解更多的應用

3?有監督算法與無監督算法

既然標簽是人為規定的那是否可以選擇沒有標簽的算法呢?當然可以對于有標簽的任務我們稱其有監督學習包括眾人耳熟能詳的眾多算法??KNN決策樹支持向量機線性回歸邏輯回歸等等自然也包括大部分神經網絡對于沒有標簽的任務被稱為無監督學習包括了聚類分析協同過濾(推薦系統中的核心算法之一),以及變分自編碼器等深度學習算法

有監督學習非常符合人工智能誕生之初人們對于算法的要求從我們已知的歷史數據中進行學習,然后去預測我們渴望了解的東西無論是從過去的股價預測未來的股價還是從過去的天氣預測未來的天歷史數據都帶有正確答案也就是有標簽現代大部分應用廣泛的算法都是有監督學習這些算法能夠將可觀察到可記錄到并且已知答案的輸入數據轉變為需要邏輯分析才能夠得出的有價值的輸出。在之后的課程中,我們將廣泛體會到有監督學習的力量

無監督學習相對的由于沒有標簽所以我們沒有給算法提供任何的正確答案大多數時候我們只是告訴無監督算法說好了這些是數據你去學學看然后告訴我你得到了什么在深度學習中監督算法在許多時候都被我們用來作為輔助算法以增強有監督算法的學習效果

在實際使用中還存在著半監督學習算法強化學習等更加深入的領域在所有這些領域都有著大量的算法供我們學習和使用,在后續的課程中我們也會提到其中常用和經典的部分

4?如何判斷我的模型是一個好模型

現代機器學習算法大約有幾十個每年還有許多新的算法在被提出從中選出效果優秀符合需求的模型也是機器學習中的重要課題為此我們需要模型的評價機制如何判斷模型是一個好模型呢?在這我們提出模型的評估三角

  • 型預測效果

在機器學習能夠落地的場景模型進行判斷/預測的效果一定是我們追求的核心目標在工業場景如人臉識別中,如果模型效果不能達到幾乎100%準確,那我們就無法使用算法代替人工檢查因為沒有人可以承擔算法判斷失敗之后的責任因為相似的理由深度學習在醫療領域的應用永遠只能處于輔助醫務人員進行判斷的地位在一些其他場景如推薦系統雖然模型的效果可能不需要達到近乎100%的準但優秀的推薦系統所帶來的效應是非常強大的而效果不夠好的算法則是又昂貴又失敗的代碼罷

對于不同類型的算法我們有不同的模型評估指標我們依據這些評估指標來衡量模型的判斷/預測效果。在之前的課程中,你應該已經接觸了線性回歸的評估指標之一SSE也就是真實值與預測值的差異的平方和在之后的學習中我們會展開來談不同算法的評估指標當課程結束時你將會了解如何評估有監督無監督強化學習模型的效果

  • 運算速度

能夠同時處理大量數據可以在超短時間內極速學習可以實時進行預測是機器學習的重要優勢果機器學習的判斷速度不能接近/超越人類那規模化預測就沒有了根基如果算法的運算速度太慢不利于調優和實驗同時運算緩慢的算法可能需要占用更多的計算和儲存資源對企業來說成本會得更高事實上現代神經網絡做出的許多改進以及算法工程師崗位對于數據結構方面的知識要求都是為了提升神經網絡的運算速度而存在的的在模型效果不錯的情況下保障運算速度較快是機器學習中重要的一環

  • 可解釋性

機器學習是一門技術,是一門有門檻的技術曲高客寡大眾注定不太可能在35分鐘之內就理解機器學習甚至深度學習算法的計算原理但是技術人員肩負著要向老板客戶同事甚至親朋好友解釋機器學習在做什么的職責否則算法的預測結果很可能不被利益相關人員所接受。尤其是在算法做出一些涉及到道德層面的判斷時,可解釋性就變得更加重要——例如前段時間鬧得沸沸揚揚的UBER算法解雇UBER司機事件,UBER算法在司機們違規之前就預測他們會違約因而解雇了他們從算法的角度來看沒什么問題但由于UBER無法向司機們解釋算法具體的運行規則司機們自然也不會輕易接受自己被解雇的事實。幸運的是,隨著人工智能相關知識的普及人們已經不太在意深度學習領域的可解釋性了(因為神經網絡在預測效果方面的優勢已經全面壓倒了它在其他方面的劣勢)。但在機器學習的其他領域,可解釋性依然是非常關鍵的問題

  • 務于業務

只有服務于業務,或服務于推動人類認知的研究,算法才會具有商業價值一個能100%預測你明天午飯內容的算法或許對個人而言非常有用(解決了人生三大難題之一午飯吃什么),但不會有公司為它投資也不會有人希望將它規模化機器學習算法的落地成本很高因此企業會希望看到算法落地后確定的商業價值只有資金流動技術才能持續發展算法才能繼續發光發熱

在傳統機器學習領域評估三角的因素缺一不可但在深度學習領域沒有什么比效果好速度快更加重要如果還能有一部分可解釋性那就是錦上添花了當我們在訓練深度學習模型時我們會最優先考慮模型效果的優化同時加快模型的運算速度每時每刻我們都是為了模型效果或預算速度而行動的。記住這一點,它會成為日后我們學習任何新知識時的動力

總結

以上是生活随笔為你收集整理的Lesson 7(12)神经网络的诞生与发展机器学习基本概念的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。