AI零基础入门之人工智能开启新时代—下篇
?
人工智能概述
人工智能的定義
· 人工智能是通過機器來模擬人類認識能力的一種科技能力
· 人工智能最核心的能力就是根據給定的輸入做出判斷或預測
· 思考:通過什么途徑才能讓機器具備這樣的能力?
· 舉一個例子:
機器也需要學習
什么是機器學習
機器學習的定義
· 機器學習為人工智能提供了基礎,機器學習就是一種使用數據來訓練軟件模型的技術。
什么是機器學習
理解模型
模型可以根據X的數值計算出Y的值,簡單的說,如果有一個函數,輸入一組X的數值(特征值),機器計算出中Y(預測值)的數值,f(x) = y 函數可以理解為一個簡單的模型。
什么是機器學習
丼例:通過波士頓房價信息預測房價
什么是機器學習
丼例:通過波士頓房價信息預測房價
X1,X2,X3…代表特征,W1,W2,W3…代表權重, 復雜權重計算交給機器處理,得到f(x)=0.1231xX1+0.41xX2+0.57xX3,畫出廣義的f(x)=y坐標圖
監督學習
從給定的訓練數據集(歷史數據)中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。
監督學習的訓練集需要包括輸入和輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。
label是標注,是要預測的目標值,feature是特征
?
以下用例基于華為云機器服務平臺演示
監督學習:回歸
線性回歸舉例:假設有一項健康運動的研究調查,通過手腕傳感器收集一些健身者的數據,比如性別、身高、體
重、年齡、心率、運動時長、體溫、消耗的卡里路數據,現在要利用這些數據來預測羅西鍛煉所消耗的卡路里。
監督學習:回歸
線性回歸建模實操演示
監督學習:回歸
回歸模型的評估標準
回歸模型的評估值為MAE(平均絕對誤差)、MSE(均方誤差)、RMSE(均方根誤差)。上述3個誤差值是指評分真實值與預測值乊間的誤差,在多次建模的過程中,每一次建模結果都會產生一組誤差值,評判一個回歸模型好壞的方法就是看這三個誤差值是否變小或者變大,誤差值越小表示回歸模型越好.
平均絕對誤差MAE(mean absolute error)、均方誤差MSE(mean squared error)、均方根誤差RMSE(root mean squared error)
監督學習:回歸
算法:隨機決策森林回歸VS線性回歸
?
監督學習:分類
分類舉例:假設有一家診所,收集到患者的一些信息,例如血糖指數、心臟血壓、年齡、身體質量指數等信息,幵且已標注糖尿病患者和非糖尿病患者(1和0),利用數據訓練一個模型來做預測。
監督學習:分類
分類建模實操演示
監督學習:分類
分類模型的評估標準
· 模型預測的值是在0到1乊間,閾值的選擇決定預測值。
· 若一個實例是正例,幵且被預測為正例,即為真正例(True Postive TP)
· 若一個實例是正例,但是被預測成為負例,即為假負例(False Negative FN)
· 若一個實例是負例,但是被預測成為正例,即為假正例(False Postive FP)
· 若一個實例是負例,幵且被預測成為負例,即為真負例(True Negative TN)
· 精確率、準確率: Accuracy =(TP+TN)/(TP+TN+FN+FP)
· 精準率、查準率: Precision = TP/ (TP+FP)
· 召回率、查全率: Recall = TP/ (TP+FN)
· 真正類率(true postive rate TPR)靈敏度,Sensitivity(正類覆蓋率),TPR = TP/(TP+FN)
· 負正類率(false postive rate FPR)特異度,劃分實例中所有負例占所有負例的比例,FPR=FP/(FP+TN)
· 縱軸TPR:Sensitivity(正例覆蓋率),TPR越大,預測正類中實際正類越多
· 橫軸FPR:FPR越大,預測正例中實際負例越多。
· ROC曲線:接收者操作特征(receiveroperating characteristic), ROC曲線上每個點反映著對同一信號刺激的感
受性
監督學習:分類
分類模型的評估標準
ROC曲線下面的區域,稱乊為AUC,是判斷模型預測表現的指標。一般來說,AUC區域越大,曲線越靠近左上角模型的表現越好
監督學習:分類
算法:梯度提升樹分類VS決策樹分類
?
非監督學習:聚類
聚類建模實操演示
現有批發商品交易活動數據,依據每個客戶的年進貨量大小,找出潛在的大客戶,然后定制化銷售策略
大客戶(id:2)、中客戶(id:1)及小客戶(id:0)
非監督學習:聚類
k均值聚類算法:k=3 k是中心點(質心點)
隨機位置繪制k個點 確定網格中每個點最接近哪個中心點
最終產生有良好分離效果的聚類
判斷依據:聚類中心之間的平均距離,和集群中心點到最遠點的距離相對比,這個比例越大,聚類的分離程度越大
機器學習流程
核心流程:
數據收集:理解數據的含義,數據質量評估
數據處理:數據清洗(去噪、去重)、數據格式轉換、特性提取
模型訓練:了解常用的機器學習算法,選擇合適的算法去訓練
評估模型:通過測試數據集去預測目標,分析評估模型指標數據,評估結果可視化
應用模型:導出或發布模型進行應用,最后對模型的效果進行反饋跟蹤
如何快速掌握AI應用的能力
角色定位:
AI應用工程師:主要將AI與行業應用結合,開發各種應用或者中間件
AI售前工程師:主要是結合各行業,提出各種AI應用的場景,向客戶提供解決方案
AI集成工程師:主要是與AI產品供應商合作,提供整體集成解決方案,包括實施和運維
AI產品經理:主要是將AI 功能落地到產品上,提升產品交互體驗,增強產品競爭力
AI研發工程師:主要負責核心AI技術的研發工作(算法、模型)
詳細內容可以結合直播學習
直播地址:http://zhibo.huaweicloud.com/watch/2668613
版權聲名:部分圖片素材來源網絡,如有侵僅及時聯系本人
轉載請注明來源
作者:劉毅超 微信號:yichao233
轉載于:https://www.cnblogs.com/chaochao6078/p/10628671.html
總結
以上是生活随笔為你收集整理的AI零基础入门之人工智能开启新时代—下篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV+Qt+CMake安装+十种
- 下一篇: 计算首站到末站最小费用