支持向量機(jī)(Support Vector Machine,SVM)是一種用于分類(lèi)問(wèn)題的監(jiān)督算法。主要用于二分類(lèi)和多分類(lèi)問(wèn)題。其基本思想是找到一個(gè)超平面,能夠?qū)⒉煌?lèi)別的樣本點(diǎn)盡可能地分開(kāi),并使得離超平面最近的樣本點(diǎn)盡可能遠(yuǎn)離超平面,從而實(shí)現(xiàn)較好的分類(lèi)效果。
SVM的關(guān)鍵是找到一個(gè)最優(yōu)的超平面,這個(gè)超平面可以通過(guò)使得最靠近超平面的樣本點(diǎn)之間的間隔最大化來(lái)定義。這些最靠近超平面的樣本點(diǎn)被稱(chēng)為支持向量。SVM的優(yōu)化目標(biāo)可以表示為一個(gè)凸二次規(guī)劃問(wèn)題,可以通過(guò)求解對(duì)應(yīng)的拉格朗日函數(shù)來(lái)得到最優(yōu)解。
SVM除了能夠處理線性可分離的問(wèn)題外,還可以通過(guò)核函數(shù)的引入處理線性不可分的問(wèn)題,將樣本映射到高維空間,從而使得在高維空間中變得線性可分。SVM使用鉸鏈損失函數(shù)計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn)并在求解系統(tǒng)中加入了正則化項(xiàng)以?xún)?yōu)化結(jié)構(gòu)風(fēng)險(xiǎn),是一個(gè)具有稀疏性和穩(wěn)健性的分類(lèi)器。同時(shí),SVM可以通過(guò)核方法進(jìn)行非線性分類(lèi),是常見(jiàn)的核學(xué)習(xí)方法之一。常見(jiàn)的核函數(shù)包括線性核、多項(xiàng)式核、高斯核等。
超平面與最近的類(lèi)點(diǎn)之間的距離稱(chēng)為邊距。最優(yōu)超平面具有最大的邊界,可以對(duì)點(diǎn)進(jìn)行分類(lèi),從而使最近的數(shù)據(jù)點(diǎn)與這兩個(gè)類(lèi)之間的距離最大化。
例如,H1 沒(méi)有將這兩個(gè)類(lèi)分開(kāi)。但 H2 有,不過(guò)只有很小的邊距。而 H3 以最大的邊距將它們分開(kāi)了。
SVM是一種常見(jiàn)的監(jiān)督學(xué)習(xí)算法,具有很好的泛化能力和較高的分類(lèi)準(zhǔn)確率。在實(shí)際應(yīng)用中,SVM廣泛用于文本分類(lèi)、圖像識(shí)別、生物信息學(xué)等領(lǐng)域。
如有疑問(wèn)請(qǐng)進(jìn)群交流,點(diǎn)擊鏈接加入群聊【信創(chuàng)技術(shù)交流群】:http://qm.qq.com/cgi-bin/qm/qr?_wv=1027&k=EjDhISXNgJlMMemn85viUFgIqzkDY3OC&authKey=2SKLwlmvTpbqlaQtJ%2FtFXJgHVgltewcfvbIpzdA7BMjIjt2YM1h71qlJoIuWxp7K&noverify=0&group_code=721096495