Generalisatiefouten in Machine Learning-modellen begrijpen

Bijgewerkt op June 21, 2024 3 Minuten lezen

De bias-variantie-afweging is een fundamenteel concept dat ons helpt de generalisatiefout van een model te begrijpen.

Bias-variantie-ontleding

Bias verwijst naar de fout die wordt geïntroduceerd door een reëel probleem te benaderen met een vereenvoudigd model. Het vertegenwoordigt het verschil tussen de gemiddelde voorspelling van ons model en de juiste waarde die we proberen te voorspellen. Hoge bias leidt vaak tot underfitting: te vereenvoudigde modellen die er niet in slagen de complexiteit van de gegevens vast te leggen.

Variantie meet daarentegen de gevoeligheid van het model voor fluctuaties in de dataset. Het kwantificeert hoeveel de voorspellingen van het model zouden variëren als het op verschillende datasets zou worden getraind. Hoge variantie kan leiden tot overfitting: modellen die goed presteren op het gebied van trainingsgegevens, maar slecht generaliseren naar nieuwe, onzichtbare gegevens.

Afweging en relatie met modelcomplexiteit

De afweging tussen bias en variantie is cruciaal. Naarmate de complexiteit van het model toeneemt, neemt de bias doorgaans af (het model kan complexere patronen vastleggen), maar de variantie neemt doorgaans toe (het model wordt gevoeliger voor ruis en de specifieke kenmerken van de trainingsgegevens). Het balanceren van deze twee componenten is de sleutel tot het bereiken van optimale modelprestaties.

Foutbijdrage en berekening

De verwachte voorspellingsfout kan in drie delen worden opgesplitst:

Onherleidbare fout (ruis)
Vooroordeel in het kwadraat
Variantie

Wiskundig:

Verwachte fout = Onherleidbare fout + Bias²+ Variantie

Het rechtstreeks berekenen van bias en variantie kan complex zijn, vooral als het gaat om gegevens uit de echte wereld. Technieken zoals kruisvalidatie, leercurves of het gebruik van verschillende subsets van de dataset voor training en validatie kunnen helpen bij het schatten van deze componenten.

Strategieën om hoge bias of hoge variantie aan te pakken

Hoge bias: om hoge bias te verminderen, kan men de modelcomplexiteit vergroten door meer geavanceerde modellen te gebruiken (bijvoorbeeld door meer functies toe te voegen, door neurale netwerken te gebruiken in plaats van lineaire modellen).
Hoge variantie: Om hoge variantie aan te pakken, kunnen technieken als regularisatie (bijv. Lasso, Ridge), de modelcomplexiteit verminderen (kenmerkselectie, dimensionaliteitsreductie) of meer gegevens verzamelen kan nuttig zijn.

Verbetering door analyse

Door de afweging tussen bias en variantie te analyseren, kunnen we inzicht krijgen in het gedrag van het model. We kunnen een passend complexiteitsniveau voor het probleem selecteren, begrijpen of het model ondermaats of overmaats is, en passende strategieën toepassen om de prestaties te verbeteren.

Als een model bijvoorbeeld een grote variantie vertoont, kunnen we overwegen het te vereenvoudigen door het aantal kenmerken te verminderen of door regularisatietechnieken te gebruiken. Omgekeerd, als er sprake is van een grote bias, kan het gebruik van een complexer model of het toevoegen van meer relevante functies helpen.

Uiteindelijk is het doel om een evenwicht te vinden tussen vertekening en variantie om modellen te bouwen die goed generaliseren naar onzichtbare gegevens.