Omvendt træning for at pleje den omvendte forbandelse

Senest opdateret November 19, 2024 3 minutters læsning

marts 2024

Tilbageførselsforbandelsen

Store sprogmodeller (LLM’er) som GPT-4 og Llama-2 har demonstreret imponerende evner til at forstå og generere menneskelignende tekst, der omfatter en bred vifte af viden. Men de fejler en tilsyneladende ligetil opgave: at vende lærte fakta om. Denne begrænsning, benævnt “Reversal Curse”, indebærer, at LLM’er ikke kan udlede, at “B er et træk ved A” ud fra at lære “A har en funktion B”, en grundlæggende ræsonnementfærdighed, som selv børn besidder. Dette papir introducerer “Omvendt træning”, en ny metode til at løse denne udfordring ved at udnytte en tovejs træningstilgang til at forbedre modellens forståelse af fakta i både fremadgående og omvendte formater.

Oprindelsen af vendingsforbandelsen

Problemet opstår fra LLM’ers grundlæggende træningstilgang, som typisk involverer autoregressiv, venstre-til-højre-læring. Denne metode lærer ikke i sig selv modellerne at forstå eller generere information i omvendt rækkefølge. I betragtning af arten af datadistribution efter Zipfs lov, er mange fakta kun nævnt i én retning, hvilket forværrer dette problem. “Reversal Curse” begrænser LLM’ernes forståelse af gensidige relationer og ækvivalens i udsagn, hvilket markerer en væsentlig mangel i deres ræsonnementevner.

Overvinde omvendt forbandelse med omvendt træning

Den foreslåede løsning, Reverse Training, fordobler de tilgængelige træningsdata ved at inkludere både originale og omvendte versioner af træningsstrenge. Tilbageførselsprocessen er omhyggelig med ikke at ændre visse understrenge, såsom enhedsnavne, og bibeholde deres oprindelige sekvens for at bevare konteksten. Denne metode, i lighed med at introducere et andet sprog for LLM at lære, forbedrer modellens evne til at behandle og generere information i begge retninger markant.

Test af den omvendte træningsmetode

Forfatterne udførte følgende eksperimenter for at teste deres foreslåede metode:

1- Symbolsk omvendt opgave: En kontrolleret miljøtest, der viser metodens evne til at udlede og anvende omvendte relationer.

2- Omvendt biografiopgave: Brug af et biografidatasæt til at vurdere præstationer ved generering af personnavne ud fra givne detaljer, omvendt.

3- Reversering af viden fra den virkelige verden: Evaluering af metodens effektivitet i scenarier i den virkelige verden, herunder vending af fakta om berømtheder og deres forhold.

4- Finjustering af fiktive fakta: Test af modellens indlæringsevne på nyligt introducerede, omvendte fiktive fakta.

På tværs af disse eksperimenter mildnede omvendt træning ikke kun den omvendte forbandelse, men i nogle tilfælde eliminerede den fuldstændigt. Metoden viste sig at være særlig effektiv, når entitetsnavne blev bevaret i deres oprindelige rækkefølge under vendingsprocessen, hvilket understregede vigtigheden af at opretholde visse kontekstuelle ankre.

Implikationer og fremtidige retninger

Succesen med omvendt træning med at adressere den omvendte forbandelse åbner nye veje for LLM-træningsmetoder. Ved at forbedre modellernes forståelse af gensidige relationer og ækvivalens i udsagn, åbner denne tilgang døren til mere sofistikerede ræsonnementer. Fremtidig forskning kan udforske yderligere optimering af vendingsprocessen, potentialet for at integrere omvendt træning i andre sprogmodelarkitekturer og bredere anvendelser af denne metode i naturlig sprogforståelse og genereringsopgaver.

Bliv en Coding Pro i dit eget tempo! Deltag i Code Labs Academys Online Part-Time Bootcamp og opgrader kodning. Tilpas læring omkring din tidsplan, og start din rejse ind i teknologien i dag!