Каргыштын медайымына тескери тренинг

Жаңыртылды September 23, 2024 2 Протокол окуу

20-март, 2024-жыл

Кайтарма каргыш

GPT-4 жана Llama-2 сыяктуу чоң тил моделдери (LLMs) түшүнүү боюнча таасирдүү жөндөмдөрдү көрсөтүштү. жана билимдин кеңири спектрин камтыган адамга окшош текстти түзүү. Бирок, алар жөнөкөй көрүнгөн тапшырманы аткара алышпайт: үйрөнгөн фактыларды артка кайтаруу. “Кайрылуу каргышы” деп аталган бул чектөө, LLMлер балдарда да ээ болгон негизги ой жүгүртүү жөндөмү болгон “Анын В өзгөчөлүгү бар” дегенди үйрөнүүдөн “В - Анын өзгөчөлүгү” деп жыйынтык чыгара албасын билдирет. Бул макалада моделдин фактыларды туура жана тескери форматта түшүнүүсүн жогорулатуу үчүн эки багыттуу окутуу ыкмасын колдонуу аркылуу бул көйгөйдү чечүүнүн жаңы ыкмасы болгон “Тескери окутуу” киргизилет.

Кайталануучу каргыштын келип чыгышы

Көйгөй адатта авторегрессивдүү, солдон оңго окууну камтыган LLMдердин фундаменталдык окутуу ыкмасынан келип чыгат. Бул ыкма моделдерди тескери тартипте маалыматты түшүнүүгө же түзүүгө табиятынан үйрөтпөйт. Zipf мыйзамына ылайык маалыматтарды бөлүштүрүүнүн мүнөзүн эске алганда, көптөгөн фактылар бир гана багытта айтылып, бул маселени курчутат. “Кайрылуу каргыш” LLMлердин өз ара мамилелерди жана билдирүүлөрдөгү эквиваленттүүлүгүн түшүнүүсүн чектеп, алардын ой жүгүртүү мүмкүнчүлүктөрүндөгү олуттуу кемчиликти белгилейт.

Кайтарма каргышты тескери машыгуу менен жеңүү

Сунушталган чечим, Reverse Training, окутуу саптарынын түпнуска жана тескери версияларын кошуу менен жеткиликтүү окуу маалыматтарын эки эсеге көбөйтөт. Кайтаруу процесси контекстти сактап калуу үчүн алардын баштапкы ырааттуулугун сактап, объекттин аталыштары сыяктуу айрым субсаптарды өзгөртпөө үчүн этияттык менен жүргүзүлөт. Бул ыкма, LLM үйрөнүү үчүн экинчи тилди киргизүүгө окшош, моделдин эки багытта маалыматты иштеп чыгуу жана түзүү жөндөмдүүлүгүн кыйла жакшыртат.

Тескери окутуу ыкмасын сыноо

Авторлор сунуштаган ыкманы текшерүү үчүн төмөнкү эксперименттерди жүргүзүшкөн:

1- Символикалык тескери тапшырма: Методдун тескери мамилелерди тыянак чыгаруу жана колдонуу жөндөмүн көрсөтүүчү башкарылуучу чөйрө тести.

2- Өмүр баянын өзгөртүү тапшырмасы: Берилген маалыматтардан тескери түрдө адамдын атын чыгаруудагы натыйжалуулукту баалоо үчүн биографиялык маалымат топтомун колдонуу.

3- Чыныгы дүйнөдөгү билимди жокко чыгаруу: Чыныгы сценарийлерде методдун натыйжалуулугун баалоо, анын ичинде атактуулар жана алардын мамилелери тууралуу фактыларды жокко чыгаруу.

4- Fictitious Facts Finettuning: Жаңы киргизилген, тескери жасалма фактылар боюнча моделдин үйрөнүү жөндөмдүүлүгүн текшерүү.

Бул эксперименттер боюнча, Reverse Training бир гана Reversal каргышын жумшартпастан, бирок, кээ бир учурларда, аны толугу менен жок кылды. Метод айрым контексттик анкерлерди сактоонун маанилүүлүгүн баса белгилеп, объектилердин аталыштары кайра өзгөртүү процессинде баштапкы тартипте сакталганда өзгөчө натыйжалуу болду.

Натыйжалары жана келечектеги багыттары

Reversal Curse менен күрөшүүдө Reverse Trainingдин ийгилиги LLM окутуу методологиясы үчүн жаңы жолдорду ачат. Моделдердин билдирүүлөрдөгү өз ара мамилелерди жана эквиваленттүүлүгүн түшүнүүсүн өркүндөтүү менен, бул ыкма татаалыраак ой жүгүртүү мүмкүнчүлүктөрүнө эшик ачат. Келечектеги изилдөөлөр тескери процессти андан ары оптималдаштырууну, башка тил моделдеринин архитектурасына тескери окутууну интеграциялоо потенциалын жана бул ыкманы табигый тилди түшүнүүдө жана муун тапшырмаларында кеңири колдонууну изилдеши мүмкүн.