从数学入手,3招打破机器学习的边界
全世界只有3.14 %?的人關(guān)注了
數(shù)據(jù)與算法之美
本文約2007余字,閱讀需要約6分鐘;
系統(tǒng)資料領(lǐng)取見文末;
關(guān)鍵詞:人工智能,機(jī)器學(xué)習(xí),深度學(xué)習(xí),數(shù)學(xué),學(xué)習(xí)建議
01.機(jī)器學(xué)習(xí)工程師的邊界是什么?
大多數(shù)的事物都是有邊界的。那機(jī)器學(xué)習(xí)的邊界又是什么呢?
對(duì),就是數(shù)學(xué)。掌握了數(shù)學(xué)這個(gè)機(jī)器學(xué)習(xí)的底層基礎(chǔ),不僅可以加深對(duì)算法的理解,還能在模型優(yōu)化階段更加游刃有余。
02.如何打破邊界?
希望以下的內(nèi)容能給你參考思路。
????機(jī)器學(xué)習(xí)中的數(shù)學(xué)基礎(chǔ)
方法建議:將實(shí)際意義與興趣賦予看似枯燥的學(xué)習(xí)之后,盡量死磕最少必要知識(shí)。
上圖是個(gè)使用邏輯回歸判斷一個(gè)男生是否是一位合適的女婿的例子。
其中,Y=w1*身高+w2*品德+w3*財(cái)富+w4*顏值+w5*就可以表達(dá)為多項(xiàng)式Y(jié)=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,通過Sigmoid函數(shù)后,轉(zhuǎn)化為該男生可能成為優(yōu)秀女婿的概率問題。
這里會(huì)涉及sigmoid函數(shù)、求導(dǎo)算法、梯度下降、正則項(xiàng)控制過擬合等數(shù)學(xué)知識(shí)。遇到問題解決問題,死磕關(guān)鍵點(diǎn),才不會(huì)鉆入牛角尖,陷入數(shù)學(xué)知識(shí)的汪洋大海中孤立無援。
????機(jī)器學(xué)習(xí)中的線性代數(shù)
方法建議:盡量將線性代數(shù)與現(xiàn)實(shí)意義結(jié)合起來
對(duì)于線性代數(shù),理解它與機(jī)器學(xué)習(xí)的關(guān)鍵在于:理解線性代數(shù)與現(xiàn)實(shí)世界的巧妙的耦合。
上圖中的x,y可以分別代表觀察事物的2個(gè)維度。
x,y各自有大量的線性組合,意味著事物的2個(gè)維度有大量不同的看法,
將這些看法用機(jī)器來進(jìn)行計(jì)算、歸納、演繹,并組合大量個(gè)別的看法,抽離出符合大多數(shù)的平衡點(diǎn),從而得出普遍適用的結(jié)論。這不就是一件奇妙的巧妙而耦合的事件嘛~
????機(jī)器學(xué)習(xí)中的概率統(tǒng)計(jì)
方法建議:盡量將看似無味的概率統(tǒng)計(jì)知識(shí)與感興趣的話題結(jié)合起來理解
隱馬爾科夫(HMM)算法是機(jī)器學(xué)習(xí)中的一個(gè)概率圖模型,也是很多算法崗位面試中的考察難點(diǎn)。來自知乎的王蒟蒻,就用一個(gè)游戲的場(chǎng)景清楚的解釋了隱馬爾科夫(HMM)算法的原理。
https://www.zhihu.com/question/20962240/answer/33614574(鏈接)
我是一戰(zhàn)士,修煉出了三種戰(zhàn)斗形態(tài),分別為暴怒態(tài),正常狀態(tài)和防御態(tài)。同時(shí)我也會(huì)三個(gè)被動(dòng)技能,分別是普通平A,爆擊(攻擊傷害翻倍),吸血(生命汲取)。
我在暴怒狀態(tài)下打出暴擊的概率是80%,打出吸血概率為5%;
在平衡形態(tài)下,打出暴擊的比率為30%,打出吸血的概率是20%;
在防御形態(tài)下,暴擊成功概率為5%,吸血概率為60%。
總結(jié)一下,戰(zhàn)士在不同狀態(tài)下能打出技能的概率不一樣。
本來,戰(zhàn)士這個(gè)職業(yè)在暴怒態(tài)時(shí),身邊會(huì)有一圈紅光環(huán);防御態(tài)時(shí),會(huì)有一圈藍(lán)光環(huán)。但是,現(xiàn)在我正在玩游戲,游戲突然出了個(gè)bug:有個(gè)傻x程序員改了游戲的代碼,他給寫崩了,從此戰(zhàn)士身邊光環(huán)都看不見了。那我沒法通過看腳下的光環(huán)知道戰(zhàn)士在爆什么狀態(tài)了。
話說,現(xiàn)在問題來了:由于看不到腳下光環(huán),我只能估計(jì)“戰(zhàn)士”在爆什么狀態(tài);但我現(xiàn)在打一boss,砍10次,發(fā)現(xiàn)8次都是暴擊,血嘩嘩地翻倍在掉,你覺得我這戰(zhàn)士最可能是爆了什么狀態(tài)?
所以,通過自己感興趣的話題來理解深?yuàn)W的概率問題,就輕松很多了。
?
03.打破邊界的誤區(qū)
也許你早已意識(shí)到高等數(shù)學(xué)、線性代數(shù)、概率統(tǒng)計(jì)對(duì)做機(jī)器學(xué)習(xí)的重要性,也在積極補(bǔ)課中,于是一頭扎進(jìn)大學(xué)的教材中。但埋頭死磕了好多次,每次都半途而費(fèi),學(xué)了很多,學(xué)到的很少。
因?yàn)榻滩氖冀K更偏向理論。優(yōu)點(diǎn)是每一步都可靠,邏輯嚴(yán)謹(jǐn);但缺點(diǎn)就是很難理解。
古語有云:“獨(dú)學(xué)而無友則孤陋而寡聞”,多人學(xué)習(xí),協(xié)作學(xué)習(xí)能較快認(rèn)識(shí)到打破機(jī)器學(xué)習(xí)邊界的誤區(qū),盡可能的使用合適的學(xué)習(xí)方法。
推薦網(wǎng)易云課堂聯(lián)合稀牛學(xué)院共同推出的人工智能系列微專業(yè)課程,由知名企業(yè)一線人工智能專家打造,結(jié)合工業(yè)界應(yīng)用經(jīng)驗(yàn)設(shè)計(jì)學(xué)習(xí)路徑,并且有講師助教為你答疑解惑,真正帶你從入門到精通。
以下福利限時(shí)免費(fèi):
PART 1
免費(fèi)直播課
▼
直播主題
《用機(jī)器學(xué)習(xí)算法剖析大神戰(zhàn)術(shù),順利吃雞!》
12月13日 周四 20:00
直播大綱
1.?數(shù)據(jù)可視化, 花樣分析吃雞的必勝之道
2. 從數(shù)據(jù)角度區(qū)分玩家風(fēng)格:非監(jiān)督學(xué)習(xí)之k-means聚類
3.動(dòng)態(tài)數(shù)據(jù)可視化,深層分析每一類玩家特征
4. 搭建游戲排名預(yù)測(cè)的基線:監(jiān)督學(xué)習(xí)之RandomForest做回歸預(yù)測(cè)
5.特征工程在預(yù)測(cè)中的重要性,如何提升預(yù)測(cè)準(zhǔn)確率
直播講師
潘皓文?哥倫比亞大學(xué)
三年Kaggle 比賽經(jīng)歷,多次獲得top 5%名次
主研機(jī)器學(xué)習(xí)在金融行業(yè)的應(yīng)用和深度學(xué)習(xí)終端產(chǎn)品化落地
PART 2
免費(fèi)體驗(yàn)課
▼
《機(jī)器學(xué)習(xí)基礎(chǔ)》
課程大綱
1.機(jī)器學(xué)習(xí)的就業(yè)前景
2.Python實(shí)戰(zhàn)學(xué)習(xí)
(附15天學(xué)習(xí)計(jì)劃和趣味項(xiàng)目源碼)
3.機(jī)器學(xué)習(xí)工程師的實(shí)際應(yīng)用
小姐姐群內(nèi)答疑
▼
PART 3
人工智能學(xué)習(xí)資料包
▼
6個(gè)實(shí)戰(zhàn)案例學(xué)習(xí)資料及代碼
▼
面試相關(guān)問題
▼
程序員簡(jiǎn)歷模板
▼
數(shù)學(xué)基礎(chǔ)學(xué)習(xí)資料
▼
134篇國(guó)際經(jīng)典論文集
領(lǐng)取方式
掃碼即可預(yù)約小姐姐直播
獲取所有免費(fèi)福利
點(diǎn)擊【閱讀原文】,一鍵領(lǐng)取所有福利~
總結(jié)
以上是生活随笔為你收集整理的从数学入手,3招打破机器学习的边界的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Facebook上的一道题,超过50万的
- 下一篇: 凭自己本事单的身是一种怎样的体验?你根本