Oiliúint Droim ar Ais chun Altraí an Mhallacht Aisiompú

Oiliúint Droim ar Ais chun Altraí an Mhallacht Aisiompú

Nasc Arxiv

20 Márta, 2024

An Mallacht Aisiompaithe

Léirigh Múnlaí Móra Teanga (LLManna) cosúil le GPT-4 agus Llama-2 cumais iontacha i dtuiscint agus ag giniúint téacs cosúil le duine, a chuimsíonn raon leathan eolais. Mar sin féin, teipeann orthu ag tasc atá simplí de réir dealraimh: fíricí foghlamtha a aisiompú. Tugann an teorannú seo, ar a dtugtar an "Mallacht Aisiompaithe," le tuiscint nach féidir le LLManna a bhaint amach gur "gné de A" é B ó fhoghlaim "go bhfuil gné B ag A," bunscil réasúnaíochta atá ag leanaí fiú. Tugann an páipéar seo isteach "Reverse Training," modh nua chun aghaidh a thabhairt ar an dúshlán seo trí chur chuige oiliúna déthreo a ghiaráil chun tuiscint an mhúnla ar fhíorais a fheabhsú i bhformáidí chun cinn agus i bhformáidí droim ar ais.

Bunús an Mhallacht Aisiompaithe

Eascraíonn an fhadhb as cur chuige oiliúna bunúsacha LLManna, a bhaineann go hiondúil le foghlaim atá forchéimnitheach ó chlé go deas. Ní mhúineann an modh seo go bunúsach na samhlacha chun faisnéis a thuiscint nó a ghiniúint san ord droim ar ais. Mar gheall ar nádúr an dáileacháin sonraí de réir dhlí Zipf, ní luaitear go leor fíricí ach i dtreo amháin, rud a chuireann an cheist seo níos measa. Cuireann an "Mallacht Aisiompaithe" teorainn le tuiscint na LLM ar chaidrimh chómhalartacha agus ar choibhéis i ráitis, rud a fhágann go bhfuil easnamh suntasach ina gcumas réasúnaíochta.

An Mallacht Aisiompú a Shárú le hOiliúint Aisiompaithe

Déanann an réiteach atá beartaithe, Reverse Training, na sonraí oiliúna atá ar fáil a dhúbailt trí bhunleaganacha agus leaganacha droim ar ais de theaghráin oiliúna a áireamh. Tá an próiseas aisiompaithe cúramach gan fotheidil áirithe a athrú, mar ainmneacha aonáin, ag coinneáil a seicheamh bunaidh chun an comhthéacs a chaomhnú. Cuireann an modh seo, cosúil le tabhairt isteach an dara teanga don LLM le foghlaim, go mór le cumas an mhúnla faisnéis a phróiseáil agus a ghiniúint sa dá threo.

An Modh Oiliúna Droim ar Ais a Thástáil

Rinne na húdair na turgnaimh seo a leanas chun a modh molta a thástáil:

1- Tasc Droim ar Ais Siombailí: Triail timpeallachta rialaithe a thaispeánann cumas an mhodha gaolmhaireacht aisiompaithe a bhaint amach agus a chur i bhfeidhm.

2- Tasc Beathaisnéise a Fhreaschur: Úsáid a bhaint as tacar sonraí beathaisnéise chun feidhmíocht a mheas maidir le hainmneacha daoine a ghiniúint ó mhionsonraí tugtha, ar chúl.

3- Fíor-Aisiompú Faisnéise an Domhain: Measúnú a dhéanamh ar éifeachtacht an mhodha i gcásanna sa saol fíor, lena n-áirítear fíricí faoi dhaoine cáiliúla agus a gcaidrimh a aisiompú.

4- Mionchoigeartú ar Fhíricí Bréige: Cumas foghlama na samhla a thástáil ar fhíorais bhréige nua-thionscanta.

Ar fud na dturgnaimh seo, ní hamháin gur mhaolaigh Reverse Training an Mallacht Aisiompaithe ach, i gcásanna áirithe, chuir siad deireadh leis go hiomlán. Bhí an modh an-éifeachtach nuair a caomhnaíodh ainmneacha aonán ina n-ord bunaidh le linn an phróisis aisiompaithe, rud a chuir béim ar a thábhachtaí atá sé go gcoimeádfaí ancairí comhthéacsúla áirithe.

Impleachtaí agus Treonna Amach Anseo

Osclaíonn rathúlacht Reverse Training maidir le dul i ngleic leis an Reversal Curse bealaí nua le haghaidh modheolaíochtaí oiliúna LLM. Trí fheabhas a chur ar thuiscint samhlacha ar chaidrimh chómhalartacha agus ar choibhéis i ráitis, osclaíonn an cur chuige seo an doras chuig cumais réasúnaíochta níos sofaisticiúla. D’fhéadfadh taighde sa todhchaí iniúchadh breise a dhéanamh ar an bpróiseas aisiompaithe, an fhéidearthacht chun oiliúint droim ar ais a chomhtháthú in ailtireachtaí samhlacha teanga eile, agus feidhmiú níos leithne an mhodha seo i dtuiscint teanga nádúrtha agus i dtascanna giniúna.


  • Bí i do Chód Pro ar do Luas Féin! Glac páirt i Code Labs Academy’s Tosaithe Campa Páirtaimseartha Ar Líne agus cuir le scileanna códaithe. Cuir an fhoghlaim thart ar do sceideal agus cuir tús le do thuras chuig an teicneolaíocht inniu!*

Code Labs Academy © 2025 Gach ceart ar cosaint.