Gaussiako prozesuak (GP) marko malgu eta indartsua dira aldagaien arteko erlazio konplexuak modelatzeko. Bere oinarrian, GPak ausazko aldagaien bilduma bat dira, eta horietako edozein zenbaki finitu Gauss-en banaketa bateratua dute. Erregresioan eta modelizazio probabilistikoan asko erabiltzen dira iragarpenak ez ezik ere iragarpen horietarako ziurgabetasun estimazioak emateko duten gaitasunagatik.
Funtsean, GPek suposatzen dute datuak sortzen dituen azpiko funtzioa ez dela funtzio finko bat, prozesu estokastiko batetik gauzatzea baizik. Bi osagai nagusik definitzen dituzte:
-
Mean Function: Funtzio honek funtzioaren espero den balioa definitzen du sarrera-espazioko puntu bakoitzean. Datuetan joera orokorra edo alborapena jasotzen du.
-
Kobariantza-funtzioa (kernel): kobariantza-funtzioak sarrera-puntu desberdinetako funtzio-balioak elkarren artean nola aldatzen diren zehazten du. Sarrerako puntuen arteko antzekotasunaren nozioa kodetzen du eta funtzioaren leuntasuna eta portaera gobernatzen du.
GP erregresioan, behatutako sarrera-irteera bikoteen multzoa emanda, helburua sarrera-puntu berrien irteera aurreikustea da, iragarpen horiekin lotutako ziurgabetasuna estimatzen duen bitartean. GPek hori lortzen dute irteerak elkarrekin Gaussian banatutako ausazko aldagai gisa tratatuz. Batez besteko eta kobariantza-funtzioek funtzioaren portaerari buruzko aurretiazko ustea jasotzen dute, eta behatutako datuekin konbinatuta, datuak interpolatzen dituzten funtzioen gaineko banaketa ematen dute.
GPen abantaila erlazio konplexu eta ez-linealak modelatzeko gaitasunean datza, eredu finkoko egiturarik ezarri gabe. Datu mugatuak dituzten eszenatokietan gailentzen dira, berez ziurgabetasuna jasotzen baitute. Aplikazioak honako hauek dira:
-
Datuen erregresio txikiak: datu mugatuak dituzunean, medikuek kalkulu sendoak eman ditzakete ziurgabetasun kuantifikatuarekin batera, behaketa mugatuak direla-eta gehiegi egokitu edo gutxiegi izan dezaketen beste eredu batzuek ez bezala.
-
Bayesiako Optimizazioa: GP-ak kutxa beltzaren funtzio garestiak optimizatzeko erabiltzen dira, non funtzioaren ebaluazioa garestia den, eta ziurgabetasunaren kalkuluak funtsezkoak diren bilaketa modu eraginkorrean gidatzeko.
Hala ere, GPak konputazionalki zorrotzak izan daitezke bere konplexutasun konputazionala kubikoki eskalatzen baitu datu-puntu kopuruarekin. Horrek ez dira hain praktikoak izan eskala handiko datu-multzoetarako, non konputazio-zama debekatu egiten den. Hurbilketa urri edo nukleo-funtzio espezifikoak erabiltzea bezalako teknikek arazo hau arintzen lagun dezakete neurri batean, baina baliteke datu-multzo oso handietarako sare neuronalak bezalako beste eredu batzuekin alderatuta, eraginkortasun txikiagoak izatea.
Laburbilduz, Gauss-eko prozesuek harreman konplexuak modelatzeko esparru indartsua eskaintzen dute, ziurgabetasun-estimazioak emanez eta datu mugatuak dituzten eszenatokietan nabarmentzea. Hala ere, haien konplexutasun konputazionalak erronkak sor ditzake eskala handiko datu multzoak maneiatzeko. Ereduaren konplexutasunaren eta eraginkortasun konputazionalaren arteko oreka lortzea funtsezkoa da Gaussiar prozesuak aplikazio praktikoetarako kontuan hartzean.