支持向量机简述
??? 支持向量機是一種二分類模型,它的基本思想就是基于訓練集D在樣本空間中找到一個劃分超平面,將不同類別的樣本分開。但是,能將訓練樣本分開的劃分超平面可能有很多,因此,我們應該致力于找位于兩類訓練樣本“正中間”的劃分超平面,因為這樣的劃分超平面對訓練樣本局部擾動的容忍性最好。支持向量機學習算法主要有三種,有:線性可分支持向量機,線性支持向量機和非線性支持向量機。當訓練數據線性可分時,通過硬間隔最大化,學習一個線性分類器,又稱硬間隔支持向量機;當訓練數據近似線性可分但不是完全線性可分時,通過軟間隔最大化,學習一個線性分類器,即線性支持向量機;當訓練數據線性不可分時,通過核技巧及軟間隔最大化,學習非線性支持向量機。
??? 劃分超平面可以通過以下線性方程來描述
?
?
??? 假設超平面能將所有訓練樣本正確分類,則有
?
?
??? 上式中使等式成立的訓練樣本被稱為支持向量。由此可知,兩個異類支持向量到超平面的距離之和是
?
?
支持向量機算法的計算目標就是要找到符合條件的具有最大間隔的劃分超平面,這可以寫成一個最優化問題即
?
?
?
?
上面問題重寫即支持向量機的基本型:
?
?
?
?
?
經過數學推導,我們可以得到上式的對偶形式
?
?
?
?
?
求得 后,可以得到
?
?
?
以上是支持向量機中最簡單的一種,即樣本點可以由一個空間平面完全分割開。這是一種“硬間隔”。有的時候,訓練樣本點不能由一個空間平面完全分開,即一種“軟間隔”,這時需要需要對上述公式做出一點修改即可。
??? 修改后的公式如下
?
?
?
?
?
解法與上面類似。
??? 以上解決的都是線性問題。有時候,訓練數據并不能由一個空間平面完全分開,而是可以由一個其他形式的面分開,此時就是非線性問題。此時用核技巧往往可以解決問題。
??? 此時的對偶函數公式可以寫作
?
?
?
?
?
轉載于:https://www.cnblogs.com/Yolanda7171/p/5790217.html
總結
- 上一篇: 零基础建站第一季视频分享
- 下一篇: 问题集录