机器学习之邹博笔记1
1、機(jī)器學(xué)習(xí)分為兩部分:建模和預(yù)測
建模:根據(jù)已有數(shù)據(jù)(文本,圖像,聲音等)并可能有標(biāo)記值,提取出數(shù)據(jù)中的特征向量,使用某一個(gè)機(jī)器學(xué)習(xí)算法(最小二乘法),對(duì)模型進(jìn)行訓(xùn)練得出模型。
預(yù)測:現(xiàn)有新數(shù)據(jù)(文本,圖像,聲音等)并可能有標(biāo)記值,提取出數(shù)據(jù)中的特征向量,根據(jù)模型對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測。
2、整體看機(jī)器學(xué)習(xí)就是模仿人識(shí)別事物的過程即:學(xué)習(xí)、提取特征、識(shí)別、分類
由于機(jī)器不能跟人類思維一樣根據(jù)事物特征自然而然的選擇分類方法,所以機(jī)器學(xué)習(xí)方法的選擇依然還需要人工選擇。目前,機(jī)器學(xué)習(xí)的方法主要有三種:監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程。白話一點(diǎn),就是根據(jù)已知的,推斷未知的。代表方法有:Nave Bayes、SVM、決策樹、KNN、神經(jīng)網(wǎng)絡(luò)以及Logistic分析等;半監(jiān)督方法主要考慮如何利用少量的標(biāo)注樣本和大量的未標(biāo)注樣本進(jìn)行訓(xùn)練和分類的問題,也就是根據(jù)少量已知的和大量未知的內(nèi)容進(jìn)行分類。代表方法有:最大期望、生成模型和圖算法等。無監(jiān)督學(xué)習(xí)是利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程。也就是及其自個(gè)兒學(xué)。代表方法有:Apriori、FP樹、K-means以及目前比較火的Deep Learning。從這三方面看,無監(jiān)督學(xué)習(xí)是最智能的,有能實(shí)現(xiàn)機(jī)器主動(dòng)意識(shí)的潛質(zhì),但發(fā)展還比較緩慢;監(jiān)督學(xué)習(xí)是不太靠譜的,從已知的推斷未知的,就必須要把事物所有可能性全都學(xué)到,這在現(xiàn)實(shí)中是不可能的,人也做不到;半監(jiān)督學(xué)習(xí)是“沒辦法中的辦法”,既然無監(jiān)督學(xué)習(xí)很難,監(jiān)督學(xué)習(xí)不靠譜,就取個(gè)折中,各取所長。目前的發(fā)展是,監(jiān)督學(xué)習(xí)技術(shù)已然成熟,無監(jiān)督學(xué)習(xí)還在起步,所以對(duì)監(jiān)督學(xué)習(xí)方法進(jìn)行修改實(shí)現(xiàn)半監(jiān)督學(xué)習(xí)是目前的主流。但這些方法基本只能提取信息,還不能進(jìn)行有效的預(yù)測。來源:https://www.cnblogs.com/xpNLP/p/4678636.html
3、鄒博將機(jī)器學(xué)習(xí)流程比作西紅柿炒蛋
4、清晰地理解各個(gè)算法原理、優(yōu)缺點(diǎn)
針對(duì)新的數(shù)據(jù)新的問題,知道使用什么算法。
參考https://blog.csdn.net/u013369277/article/details/51645672
總結(jié)
以上是生活随笔為你收集整理的机器学习之邹博笔记1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。