Přeplnění nastane, když se model naučí nejen základní vzorce v trénovacích datech, ale také šum a náhodnost přítomné v dané konkrétní datové sadě. Výsledkem je model, který funguje velmi dobře na trénovacích datech, ale nedaří se zobecnit na nová, neviditelná data.
Identifikace
-
Vysoká přesnost tréninku, nízká přesnost testu: Jedním z primárních ukazatelů je, když model funguje výjimečně dobře na tréninkových datech, ale špatně na testech nebo validačních datech.
-
Složitost modelu: Modely s překrytím mají tendenci být příliš složité a zachycují spíše šum než základní vzory.
-
Vizualizace: Grafy jako křivky učení ukazující výkon při tréninku a ověřovacích sadách mohou odhalit nadměrné vybavení, pokud se tréninkový výkon nadále zlepšuje, zatímco výkon ověřování stagnuje nebo klesá.
Prevence a techniky pro zmírnění nadměrného vybavení
-
Cross-Validation: Techniky jako k-násobná křížová validace mohou pomoci vyhodnotit výkon modelu na různých podmnožinách dat a zajistit, že bude dobře zobecněn.
-
Train-Validation-Test Split: Rozdělení dat do odlišných sad pro školení, validaci a testování zajišťuje, že model je vyhodnocen na neviditelných datech.
-
Výběr funkcí: K trénování modelu používejte pouze nejrelevantnější funkce, vyhněte se hluku z méně informativních atributů.
-
Regularizace: Techniky jako regularizace L1 nebo L2 přidávají do ztrátové funkce modelu podmínky penalizace, což odrazuje od příliš složitých modelů.
-
Předčasné zastavení: Monitorujte výkon modelu na ověřovací sadě a zastavte trénink, když výkon začne klesat, čímž zabráníte nadměrné optimalizaci tréninkových dat.
-
Metody seskupení: Použití technik, jako je pytlování, posilování nebo skládání, může pomoci snížit nadměrné vybavení tím, že kombinuje předpovědi více modelů.
-
Rozšiřování dat: U určitých typů modelů může generování dodatečných trénovacích dat pomocí transformací nebo poruch na existující data pomoci zabránit nadměrnému přizpůsobení.
Vyvážení složitosti modelu, velikosti datové sady a regularizačních technik je zásadní pro to, aby se zabránilo nadměrnému přizpůsobení a zároveň bylo zajištěno, že model dobře zobecní na nová, neviditelná data.