日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

机器学习笔记(十):机器学习系统的设计

發布時間:2023/12/10 windows 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习笔记(十):机器学习系统的设计 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

1)Prioritizing what to work on:Spam classification example

2)Error analysis

3)Error metrics for skewed classes

4)Trading off precision and recall

5)Data for machine learning


下面將學習到在構建大型機器學習系統時有用的方法,數學性不會很強,但是也很使用。來看一個垃圾郵件分類器。

1)Prioritizing what to work on:Spam classification example

首先我們構建一個垃圾分類器:

我們接下來可以按照以下方法嘗試:

2)Error analysis

除了學習曲線外,誤差分析也是很有用的工具。構建一個學習算法的推薦方法為:

3)Error metrics for skewed classes

類偏斜問題表現為我們的訓練集中有非常多的同一類的實例,只是很少或沒有其他類的實例。來看我們最初的癌癥診斷的例子:

我們訓練的邏輯回歸模型比我們非學習來的算法準確率還低,此時誤差大小不能視為評判算法的依據。

我們要學習到兩個重要指標:準確率和召回率

準確率:?

召回率:

4)Trading off precision and recall

還是以癌癥檢查的例子來說明情況:下圖顯示了我們如何改變閾值提高準確率和召回率:

但在實際中我們一般使用?F1值?來作為判別標準:

5)Data for machine learning

下圖顯示了數據量大小對算法性能的影響:

下面介紹了如何解決高偏差(特征足夠多)和高方差問題(龐大訓練集)的方法。

總結

以上是生活随笔為你收集整理的机器学习笔记(十):机器学习系统的设计的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。