Alborapen-bariantza-konpromisoa oinarrizko kontzeptua da, eredu baten orokortze-errorea ulertzen laguntzen diguna.
Alborapen-bariantzaren deskonposizioa
Alborapena benetako problema bat eredu sinplifikatu batekin hurbiltzean sartutako erroreari egiten zaio erreferentzia. Gure ereduarenbatez besteko aurreikuspenareneta iragartzen saiatzen ari garen balio zuzenaren arteko aldea adierazten du.Alborapen handiaksarritanegokitzea** dakar, datuen konplexutasuna jasotzen ez duten eredu sinplifikatuak.
Bariantzak, berriz, ereduaren datu multzoko gorabeherekiko sentikortasuna neurtzen du. Ereduaren iragarpenak zenbat aldatuko liratekeen datu-multzo desberdinetan trebatuko balira kuantifikatzen du. Aldantzia handiak gehiegitzea sor dezake: entrenamendu-datuetan ondo funtzionatzen duten ereduak, baina gaizki orokortzen diren datu berrietara, ikusten ez direnak.
Konpromisoa eta Ereduaren konplexutasunarekin erlazioa
Alborapenaren eta bariantzaren arteko trukea funtsezkoa da. Ereduaren konplexutasuna handitzen den heinean, alborapena gutxitu ohi da (ereduak eredu konplexuagoak har ditzake), baina bariantza areagotu ohi da (eredua zaratarekiko eta entrenamendu-datuen berezitasunekiko sentikorrago bihurtzen da). Bi osagai hauek orekatzea funtsezkoa da ereduaren errendimendu optimoa lortzeko.
Errore ekarpena eta kalkulua
Espero den iragarpen-errorea hiru zatitan deskonposa daiteke:
-
Errore murriztezina (zarata)
-
Alborapena karratua
-
Bariantza
Matematikoki:
Esperotako errorea = Errore murrizezina + Alborapena2+ Bariantza
Alborapena eta bariantza zuzenean kalkulatzea konplexua izan daiteke, batez ere mundu errealeko datuetarako. Baldazio gurutzatua, ikaskuntza-kurbak edo datu-multzoaren azpimultzo desberdinak trebatzeko eta baliozkotzeko erabiltzeak osagai hauek estimatzen lagun dezakete.
Alborapen handiari edo bariantza handiari aurre egiteko estrategiak
-
Alborapen handia: alborapen handia arintzeko, eredu sofistikatuagoak erabiliz modeloaren konplexutasuna handitu daiteke (adibidez, ezaugarri gehiago gehituz, sare neuronalak erabiliz eredu linealen ordez).
-
Bariantza handia: bariantza handiari aurre egiteko, erregularizazioa (adibidez, Lasso, Ridge), modeloaren konplexutasuna murriztea (ezaugarrien hautaketa, dimentsio-murrizketa) edo datu gehiago biltzea bezalako teknikak. lagungarria izan daiteke.
Analisiaren bidezko hobekuntza
Alborapen-bariantza-konpromisoa aztertuz, ereduaren portaerari buruzko ikuspegiak lor ditzakegu. Arazorako konplexutasun-maila egokia hauta dezakegu, eredua gutxiegi edo gehiegi egokitzen den ulertu eta errendimendua hobetzeko estrategia egokiak aplika ditzakegu.
Adibidez, eredu batek bariantza handia erakusten badu, sinplifikatzea kontuan izan genezake ezaugarri kopurua murriztuz edo erregularizazio teknikak erabiliz. Alderantziz, alborapen handia erakusten badu, eredu konplexuago bat erabiltzeak edo ezaugarri garrantzitsuagoak gehitzeak lagun dezake.
Azken finean, helburua alborapenaren eta bariantzaren arteko oreka lortzea da, ikusten ez diren datuetara ondo orokortzen diren ereduak eraikitzeko.