Apgrieztā lāsta apmācība

Apgrieztā lāsta apmācība

Arxiv Link

2024. gada 20. marts

Apvērsuma lāsts

Lielie valodu modeļi (LLM), piemēram, GPT-4 un Llama-2, ir pierādījuši iespaidīgas izpratnes spējas. un ģenerēt cilvēkiem līdzīgu tekstu, kas ietver plašu zināšanu klāstu. Tomēr viņiem neizdodas veikt šķietami vienkāršu uzdevumu: mainīt apgūtos faktus. Šis ierobežojums, ko sauc par "apgriezto lāstu", nozīmē, ka LLM nevar secināt, ka "B ir A iezīme", mācoties "A ir iezīme B", kas ir pamata spriešanas prasme, kas piemīt pat bērniem. Šis raksts iepazīstina ar "Reverse Training", jaunu metodi, lai risinātu šo izaicinājumu, izmantojot divvirzienu apmācības pieeju, lai uzlabotu modeļa izpratni par faktiem gan uz priekšu, gan atpakaļ formātā.

Apgrieztā lāsta izcelsme

Problēma rodas no LLM fundamentālās apmācības pieejas, kas parasti ietver autoregresīvu mācīšanos no kreisās uz labo pusi. Šī metode pēc būtības nemāca modeļiem saprast vai ģenerēt informāciju apgrieztā secībā. Ņemot vērā datu izplatīšanas raksturu saskaņā ar Zipf likumu, daudzi fakti ir minēti tikai vienā virzienā, saasinot šo problēmu. "Apgrieztais lāsts" ierobežo LLM izpratni par savstarpējām attiecībām un apgalvojumu līdzvērtību, iezīmējot būtisku trūkumu viņu argumentācijas spējās.

Apgrieztā lāsta pārvarēšana ar apgrieztu apmācību

Piedāvātais risinājums Reverse Training divkāršo pieejamos treniņu datus, iekļaujot gan oriģinālās, gan apgrieztās apmācības virkņu versijas. Apvērsuma process ir uzmanīgs, lai netiktu mainītas noteiktas apakšvirknes, piemēram, entītiju nosaukumus, saglabājot to sākotnējo secību, lai saglabātu kontekstu. Šī metode, kas līdzinās otras valodas ieviešanai LLM apguvei, ievērojami uzlabo modeļa spēju apstrādāt un ģenerēt informāciju abos virzienos.

Apgrieztās apmācības metodes pārbaude

Autori veica šādus eksperimentus, lai pārbaudītu piedāvāto metodi:

1. Simbolisks apgrieztais uzdevums: kontrolētas vides tests, kas parāda metodes spēju secināt un lietot apgrieztas attiecības.

2. Biogrāfijas uzdevums apgrieztā secībā: Biogrāfijas datu kopas izmantošana, lai novērtētu veiktspēju, ģenerējot personu vārdus no norādītās informācijas, otrādi.

3. Reālās pasaules zināšanu maiņa: metodes efektivitātes novērtēšana reālos scenārijos, tostarp faktu apvēršana par slavenībām un viņu attiecībām.

4. Fiktīvu faktu precizēšana: modeļa mācīšanās spēju pārbaude, izmantojot tikko ieviestus, apgrieztus fiktīvus faktus.

Šajos eksperimentos Reverse Training ne tikai mazināja apvērsuma lāstu, bet dažos gadījumos to pilnībā likvidēja. Metode izrādījās īpaši efektīva, kad entītiju nosaukumi tika saglabāti to sākotnējā secībā apvērsuma procesa laikā, uzsverot noteiktu kontekstuālo enkuru saglabāšanas nozīmi.

Ietekme un turpmākie virzieni

Reverse Training panākumi, risinot apvērsuma lāstu, paver jaunas iespējas LLM apmācības metodoloģijām. Uzlabojot modeļu izpratni par savstarpējām attiecībām un apgalvojumu līdzvērtību, šī pieeja paver durvis uz sarežģītākām spriešanas spējām. Turpmākie pētījumi var izpētīt turpmāku apvērsuma procesa optimizāciju, potenciālu integrēt reverso apmācību citās valodu modeļu arhitektūrās un plašākus šīs metodes pielietojumus dabiskās valodas izpratnes un ģenerēšanas uzdevumos.

Code Labs Academy © 2024 Visas tiesības paturētas.