D’athraigh tabhairt isteach na próiseála teanga nádúrtha gan téacs (NLP) an bhéim ar mhúnlaí teanga a oiliúint ar sheichimh aonad infhoghlama, scoite seachas ar thrascríbhinní caighdeánacha téacs. Rinneadh iarracht sa straitéis seo tascanna NLP a chur i bhfeidhm go díreach ar an teanga labhartha. San eagarthóireacht gutha, tá samhail dá leithéid ceaptha focail nó frásaí a athrú chun athscríbhinn a mheaitseáil agus bunsubstaint na cainte a choinneáil. Tá an pobal taighde ag obair faoi láthair ar mhúnla aontaithe a fhorbairt a sháraíonn ag náid lámhaigh téacs-go-hurlabhra (TTS) agus eagarthóireacht urlabhra, rud a léiríonn céim mhór sa réimse.
Cuireann foireann ó Ollscoil Texas ag Austin and Rembrand VOICECRAFT, i láthair Samhail Néar-Chodic Teanga (NCLM) bunaithe ar theicneolaíocht claochladáin. Táirgeann VOICECRAFT comharthaí códaithe cainte néaracha lena n-inlíonadh trí úsáid a bhaint as riochtú uathchéimnitheach ar chomhthéacsanna déthreocha, ag baint amach torthaí ceannródaíocha i TTS gan seatanna agus in eagarthóireacht cainte. Ionchorpraíonn an tsamhail seo cur chuige nua athshocraithe comharthaí dhá chéim lena n-áirítear moill ar chruachadh agus chumhdach cúiseach, a chumasaíonn giniúint uath-aischéimnitheach le comhthéacs déthreoch do sheichimh chódacha cainte. Tá an modh seo spreagtha ag an meicníocht chumhdaigh chúise a úsáidtear i samhlacha téacs-íomhá cúpláilte rathúla.
Chun samhaltú ilchódleabhair a fheabhsú, comhcheanglaíonn VOICECRAFT chumhdach cúiseach agus cruachadh moillithe. Rinneadh measúnú ar an tsamhail le REALEDIT, tacar sonraí éilitheach agus éagsúil a chuir na taighdeoirí san áireamh a chuimsigh cásanna eagarthóireachta gutha ón saol fíor ó chlosleabhair, físeáin YouTube, agus podchraoltaí Spotify. Déanann REALEDIT feidhmíocht na samhla a mheas faoi raon cásanna eagarthóireachta, lena n-áirítear breisithe, scriosadh, ionadú, agus athruithe ar réise téacs. Mar gheall ar éagsúlacht ábhar, variant, stíleanna cainte agus torainn chomhshaoil an tacar sonraí is uirlis éifeachtach é chun féidearthacht na n-algartam eagarthóireachta gutha a mheas.
I dtástálacha éisteachta daonna suibiachtúla, sháraigh VOICECRAFT na múnlaí eagarthóireachta gutha a bhí ann roimhe seo, lena n-áirítear bonnlínte láidre ar nós VALL-E dúblach agus an tsamhail tráchtála XTTS v2, i TTS lámhaigh nialasach agus in eagarthóireacht cainte, nach raibh gá le mionchoigeartú. Léiríonn urlabhra athraithe an mhúnla go dlúth na taifeadtaí bunaidh, rud a léiríonn a éifeachtúlacht.
Mar sin féin, aithníonn an fhoireann teorainneacha VOICECRAFT, lena n-áirítear tréimhsí ciúine eadrannach agus fuaimeanna scríobtha ina dhiaidh sin sa chaint chruthaithe. Ina theannta sin, cruthaíonn tabhairt isteach samhlacha sofaisticiúla ar nós VOICECRAFT constaicí nua do shlándáil AI, go háirithe maidir le comhartha uisce agus urlabhra shintéiseach a aithint. Tá rochtain déanta ag na taighdeoirí ar a gcód agus ar mheáchain na samhla chun staidéar a dhéanamh amach anseo ar shábháilteacht AI agus sintéis urlabhra a éascú.