Ikaskuntza automatikoaren (ML) eta ikaskuntza sakonaren (DL) mundu anitzetan, galera-funtzioek zeregin garrantzitsua dute prestakuntza-ereduetan eraginkortasunez. Algoritmoei denboran zehar doitzen eta hobetzen laguntzen dieten argi gidari gisa balio dute, aurreikusitako emaitzen eta benetako datuen arteko aldea gutxituz. Galera-funtzio ugarien artean, kontraste-galera eta berreraikuntza-galera nabarmentzen dira bereziki beren aplikazio eta onura bereziengatik. Artikulu honek galera horiek zer diren, nola desberdintzen diren eta non aplikatzen diren ML-n azaltzen du.
Galera kontrastiboa: oinarriak eta aplikazioa
Kontraste-galera oinarrizkoa da antzekotasun-ikaskuntzan edo ikaskuntza metrikoan. Ikaskuntzan zentratzen da embeddings, edo irudikapenak, laginen arteko antzekotasunak edo desberdintasunak islatzen dituzten datuen. Kontraste-galeren atzean dagoen oinarrizko printzipioa antzeko elementuak ikasitako espazioan hurbiltzen direla ziurtatzea da, eta ezberdintasunak bereizten diren bitartean.
Definizioa: formalki, kontraste-galera defini daiteke lagin pare baterako. Laginak antzekoak badira, galerak haien irudikapenen arteko distantzia minimizatzea du helburu. Alderantziz, laginak desberdinak badira, haien distantzia maximizatzea du helburu, sarritan, gainjartzea saihesteko tampon-eremu gisa jokatzen duen marjina batekin.
Aplikazioak: galera-funtzio hau asko erabiltzen da aurpegi-ezagutza bezalako zereginetan, non algoritmoak gizabanakoen aurpegiak bereizten ikasi behar duen, edo anomalien detekzioan, non helburua eredu normaletatik anormalak bereiztea den.
Berreraikuntza galera: oinarriak eta aplikazioa
Berreraikuntza-galera, berriz, funtsezkoa da gainbegiratu gabeko ikaskuntza, bereziki [autoencoders] bezalako ereduetan (https://www.tensorflow.org/tutorials/generative/autoencoder#:~:text=An%20autoencoder%20is%20a %20special,representation%20back%20to%20an%20image.) datuen kodeketa eraginkorra gainbegiratu gabeko modu batean ikasten dutenak. Galera-funtzio honek ereduaren irteerak kodetu eta deskodetu ondoren jatorrizko sarrerako datuak nola berreraiki ditzakeen neurtzen du.
Definizioa: jatorrizko sarreraren eta berreraikitako bertsioaren arteko desadostasuna kuantifikatzen du, askotan mean squared error (MSE) bezalako neurriak erabiliz etengabeko datuetarako edo cross-entropy loss datu kategorikoetarako. Desadostasun hori gutxitzea da helburua, sarrerako datuen funtsezko ezaugarriak jaso eta errepika ditzakeen eredu bat lortuz.
Aplikazioak: Kodegailu automatikoak, dimentsio-murrizketarako edo ezaugarrien ikaskuntzarako aprobetxatuta, berreraikuntza-galeran oinarritzen dira. Sorkuntza-ereduetan ere erabiltzen da, non fokua prestakuntza-datuen antza duten datu-lagin berriak sortzean dagoen.
Galera kontrastiboa vs. Berreraikuntza galera: Desberdintasun nagusiak
Kontraste-galera eta berreraikuntza-galera ikaskuntza automatikoan funtsezkoak diren arren, haien oinarrizko printzipioak, aplikazioak eta ondorioak nabarmen desberdinak dira:
1. Foku objektiboa:
-
Kontraste-galera: Antzekotasunean oinarritutako laginak bereiztea du helburu, txertatzeko espazioan datu-puntuen kokapen erlatiboa azpimarratuz.
-
Berreraikuntza-galera: jatorrizko datuak birsortzearen zehaztasunean zentratzen da, kodetze-deskodetze prozesuaren bidez informazioaren kontserbazioa azpimarratuz.
2. Erabilera testuingurua:
-
Kontraste-galera: nagusiki gainbegiratuta edo erdi-gainbegiratutako ezarpenetan erabiltzen da, non datu-laginen arteko erlazioak (antzekoak edo desberdinak) funtsezkoak diren.
-
Berreraikuntza-galera: Ohikoa da gainbegiratu gabeko ikaskuntza-eszenatokietan, non helburua datuen azpiko egitura ulertzea edo harrapatzea den etiketa espliziturik gabe.
3. Aplikazioak:
-
Kontraste-galera: ezinbestekoa klase edo kategoria ezberdinen arteko bereizketa zehatza eskatzen duten aplikazioetan, esate baterako, aurpegiak egiaztatzeko sistemetan.
-
Berreraikuntza-galera: jatorrizko datuen banaketa imitatzen duten datuen konpresio, zarata kentzea edo jatorrizko datuen banaketa imitatzen duten datu-lagin berriak sortzea helburu duten zereginetan, adibidez, eredu sortzaileetan.
Ondorioa
Kontraste-galeren eta berreraikuntza-galeren arteko ñabardurak ulertzeak ikaskuntza automatikoko ereduek nola ikasten duten eta nola moldatzen diren jakiteko informazio baliotsua eskaintzen du. Galera-funtzio hauek behar bezala aprobetxatuz, profesionalek beren ereduak zeregin zehatzetara egokitu ditzakete, eredu korapilatsuak bereizten edo datuen funtsa modu eraginkorrean atzematen eta erreproduzitzen duten. ML-k eboluzionatzen jarraitzen duen heinean, xede-galera-funtzio horien esplorazioa eta aplikazioa funtsezko eragilea izaten jarraituko du algoritmo sofistikatuagoak eta gaitasunagoak garatzeko.