20 mart 2024-cü il
Ters lənət
GPT-4 və Llama-2 kimi Böyük Dil Modelləri (LLM) anlamada təsirli qabiliyyətlər nümayiş etdirib. və geniş bilik spektrini əhatə edən insana bənzər mətn yaratmaq. Bununla belə, onlar sadə görünən bir işdə uğursuzluğa düçar olurlar: öyrənilən faktları geri qaytarmaq. “Tərsinə lənət” adlanan bu məhdudiyyət o deməkdir ki, LLM-lər hətta uşaqların da malik olduğu əsas düşünmə bacarığı olan “A-nın B xüsusiyyətinə malikdir” öyrənməkdən “B-nin A-nın xüsusiyyətidir” nəticəsinə gələ bilməzlər. Bu məqalə həm irəli, həm də tərs formatlarda modelin faktları qavramasını artırmaq üçün iki istiqamətli təlim yanaşmasından istifadə etməklə bu problemi həll etmək üçün yeni üsul olan "Əks təlim" təqdim edir.
Əks Lənətin Mənşəyi
Problem adətən avtoreqressiv, soldan sağa öyrənmə daxil olan LLM-lərin fundamental təlim yanaşmasından irəli gəlir. Bu üsul mahiyyət etibarilə modellərə məlumatı tərs qaydada başa düşməyi və ya yaratmağı öyrətmir. Zipf qanununa uyğun olaraq məlumatların paylanmasının xarakterini nəzərə alaraq, bir çox faktlar yalnız bir istiqamətdə qeyd olunur və bu məsələni daha da gücləndirir. "Tərsinə lənət" LLM-lərin ifadələrdəki qarşılıqlı əlaqələr və ekvivalentlik anlayışını məhdudlaşdırır və onların əsaslandırma imkanlarında əhəmiyyətli çatışmazlıq göstərir.
Əks Təlimlə Tərs Lənətə qalib gəlmək
Təklif olunan həll, Tərs Təlim, təlim sətirlərinin həm orijinal, həm də tərs versiyalarını daxil etməklə mövcud təlim məlumatlarını ikiqat artırır. Geri çevirmə prosesi konteksti qorumaq üçün onların orijinal ardıcıllığını qoruyaraq, müəssisə adları kimi müəyyən alt sətirləri dəyişdirməməyə diqqət yetirir. LLM-nin öyrənməsi üçün ikinci dilin tətbiqinə bənzəyən bu üsul modelin hər iki istiqamətdə məlumatı emal etmək və yaratmaq qabiliyyətini əhəmiyyətli dərəcədə yaxşılaşdırır.
Əks Təlim Metodunun Test Edilməsi
Müəlliflər təklif etdikləri metodu sınaqdan keçirmək üçün aşağıdakı təcrübələri həyata keçirdilər:
1- Simvolik Əks Tapşırıq: Metodun əks əlaqələri çıxarmaq və tətbiq etmək qabiliyyətini nümayiş etdirən idarə olunan mühit testi.
2- Tərcümeyi-halın dəyişdirilməsi tapşırığı: Tərcümeyi-hal məlumat dəstindən istifadə edərək, verilmiş təfərrüatlardan tərsinə şəxs adlarının yaradılması performansını qiymətləndirmək.
3- Real-dünya Biliyinin dəyişdirilməsi: Məşhurlar və onların münasibətləri haqqında faktların dəyişdirilməsi də daxil olmaqla, real dünya ssenarilərində metodun effektivliyinin qiymətləndirilməsi.
4- Uydurma Faktların İncə Tənzimlənməsi: Modelin yeni təqdim edilmiş, dəyişdirilmiş uydurma faktlar üzərində öyrənmə qabiliyyətinin sınaqdan keçirilməsi.
Bu təcrübələr arasında Tərs Təlim nəinki Reversal Curse-ni azaltdı, həm də bəzi hallarda onu tamamilə aradan qaldırdı. Metod, müəyyən kontekstual lövbərlərin saxlanmasının vacibliyini vurğulayaraq, geri çevrilmə prosesi zamanı müəssisə adları orijinal qaydada saxlandıqda xüsusilə effektiv oldu.
Nəticələr və Gələcək İstiqamətlər
Reversal lənətə müraciət etməkdə Tərs Təlimin uğuru LLM təlim metodologiyaları üçün yeni imkanlar açır. Modellərin ifadələrdəki qarşılıqlı əlaqələr və ekvivalentlik anlayışını gücləndirməklə, bu yanaşma daha mürəkkəb düşünmə imkanlarına qapı açır. Gələcək tədqiqatlar geri çevrilmə prosesinin daha da optimallaşdırılmasını, digər dil model arxitekturalarında əks təlimin inteqrasiyası potensialını və bu metodun təbii dilin anlaşılması və nəsil tapşırıqlarında daha geniş tətbiqlərini araşdıra bilər.