Atraminių vektorių klasifikatorius

Iš testwiki.
Pereiti į navigaciją Jump to search

Atraminių vektorių klasifikatorius (ang. support vector machine, SVM) [1] - sistemos mokymosi (machine learning) algoritmas skirtas klasifikuoti duomenims. Tai prižiūrimo mokymosi (supervised learning) metodas, kuomet siekiama suklasifikuoti jau pažymėtus (t. y. skirtingų, iš anksto žinomų klasių) duomenis.

Duomenų klasifikavimo problema

Skirtingi būdai nubrėžti sprendimo ribą tarp dviejų klasių. Intuityviai, tiesė y2 padalija duomenis geriau, nei tiesė y1.

Dažnai duomenų analizėje sutinkama problema − žinant dvi skirtingas klases kurioms priklauso turimi duomenys, priskirti naują duomenų tašką kažkuriai iš klasių. Šią problemą galima nesunkiai išspręsti, jeigu duomenys yra vienmačiai arba dvimačiai. Tačiau esant daugiau matmenų bei siekiant automatizuoti procesą reikalingi sudėtingesni algoritmai. Šie algoritmai kiekvieną turimų duomenų tašką priskiria kuriai nors (prižiūrimo mokymosi atveju žinomai) klasei. Tarp skirtingų klasių atsiranda taip vadinama sprendimo riba (decision boundary), kuri visus duomenis suskaido į sritis, priklausančias skirtingoms klasėms (žr. paveikslą dešinėje).

Apibrėžimas

Klasifikavimas atraminiais vektoriais. Algoritmas maksimizuoja atstumą tarp punktyrinių linijų. Taškai, per kuriuos eina šios linijos vadinami atraminiais vektoriais.

Atraminių vektorių klasifikatorius (AVK) siekia surasti tiesę (sprendimo ribą) tokią, kad atstumas nuo jos iki dviejų taškų (tiesių einančių per juos), priklausančių skirtingoms klasėms būtų didžiausias (esant daugiau matmenų ši tiesė pavirsta hiperplokštuma). Šie ypatingi taškai nusako vektorius, vadinamus atraminiais vektoriais, nes jie vieninteliai daro įtaką sprendimo ribai. Formaliai sprendimo riba nusakoma vektoriumi

ω

ir skaliaru

b

taip, jog galioja nelygybė

ci(ωvi+b)>1 i-ajam duomenų taškui.

Čia ci yra i-ojo taško klasė (+1 arba 1), vi=(xi,yi) yra vektorius nukreiptas į i-ąjį tašką. Pagal šią formuluotę, kiekvienas naujas taškas nusakomas vektoriumi v yra klasifikuojamas surandant šio vektoriaus projekciją į w ir pridedant skaliarą b. Jei wc+b>0, taškas priskiriamas klasei +1, jei wc+b<0, taškas priskiriamas klasei 1.

Žinoma, norint taikyti AVK, reikia nustatyti vektoriaus w ir skaliaro b reikšmes. Tam pasinaudojama jau turimais duomenimis, žinant kuriai klasei priklauso kiekvienas taškas. Atstumas tarp tiesių, einančių per atraminius vektorius (punktyrinės linijos paveiksle dešinėje) išreiškiamas dydžiu 1||w||. Atraminių vektorių nustatymas susiveda į dydžio ||w||2/2 minimizavimą. Šis uždavinys sprendžiamas Lagranžo daugiklių metodu, kuomet ieškoma funkcijos ekstremumo daugiklių αi atžvilgiu. Ši funkcija lygi

(α)=||w||22iαi[ci(wvi+b)1],čia αi - Lagranžo daugikliai lygūs 0 visiems i, išskyrus kai vi yra atraminis vektorius. Šią išraišką įprasta perrašyti (remiantis Karush-Kuhn-Tucker sąlygomis) kaip [2]

(α)=iαiviviijαiαjcicjvivj.

Apskaičiavus Lagranžo daugiklius αi, vektorius ω ir skaliaras b išreiškiami pagal ω=i=1Nαicivi ir b=1NAiA(cijAαjcjvivj), kur viA yra atraminiai vektoriai.

Netiesinis klasifikavimas transformacijos branduolių metodu

Tiesiškai neatskiriami taškai paveikus juos transformacija xϕ(x) tampa tiesiškai atskiriamais naujame atvaizdavime.

Dažnai neįmanoma nubrėžti tiesės (hiperplokštumos) taip, kad visi taškai būtų padalinti į dvi atskiras grupes. Tokiu atveju AVK metodas modifikuojamas, įvedant transformacijos funkciją ϕ(v), kuri kiekvieną tašką (nusakomą vektoriumi) transformuoja pagal vϕ(v). Tinkamai parinkus šią funkciją visi tiesiškai neatskiriami taškai įprastame atvaizdavime, taps tiesiškai atskiriamais funkcijos ϕ(v) atvaizdavime. Dažnai įvedama taip vadinama transformacijos branduolio funkcija 𝓀(a,b)=ϕ(a)ϕ(b), kuria pakeičiamos visos vektorių skaliarinės sandaugos Lagranžiane (α). Šis virsta (α)=iαi𝓀(vi,vi)ijαiαjcicj𝓀(vi,vj). Transformacijos branduolio funkcijos gali būtų įvairių formų ir parenkamos pagal situaciją. Keletas pavyzdžių [3]:

𝓀(a,b)=aTMb, kur M yra tam tikra matrica.

𝓀(a,b)=exp[d(ab)m], kur d ir m yra tam tikri skaičiai.

Šaltiniai

Šablonas:Išn