„ChatGPT Plus“ vartotojai gauna išankstinę prieigą prie „OpenAI“ išplėstinio balso režimo

„ChatGPT Plus“ vartotojai gauna išankstinę prieigą prie „OpenAI“ išplėstinio balso režimo

„OpenAI“ antradienį inicijavo „ChatGPT“ išplėstinio balso režimo išleidimą, suteikdama vartotojams pradinę prieigą prie GPT-4o hiperrealistinių garso atsakymų. Alfa versija šiuo metu prieinama ribotai ChatGPT Plus vartotojų grupei, o iki 2024 m. rudens ketinama išplėsti prieinamumą visiems Plus vartotojams.

Kai gegužę OpenAI pristatė GPT-4o balsą, publiką sužavėjo greiti atsakymai ir stulbinantis panašumas į tikrą žmogaus balsą. Balsas, pavadintas Sky, labai atkartojo aktorės Scarlett Johansson iš filmo „Ji“ toną. Paskelbus demonstracinę versiją, Johansson išreiškė nuogąstavimus dėl panašumo ir pasikvietė teisinį atstovą, kad apsaugotų savo įvaizdį. OpenAI paneigė Johanssono balso naudojimą ir vėliau pašalino jį iš demonstracinės versijos. Birželio mėnesį „OpenAI“ atskleidė išplėstinio balso režimo paleidimo atidėjimą, kad sustiprintų saugos protokolus.

Po mėnesio OpenAI pradeda diegti šią funkciją; tačiau pavasario atnaujinime paryškintos vaizdo įrašų ir ekrano bendrinimo funkcijos nebus pradinės alfa versijos leidimo dalis. Šiuo metu tam tikri aukščiausios kokybės vartotojai galės naudotis balso funkcija, kuri buvo parodyta anksčiau.

Išplėstinis balso režimas išsiskiria iš dabartinio balso režimo, naudodamas GPT-4o – daugiarūšį modelį, kuris savarankiškai valdo balso konvertavimo į tekstą, teksto apdorojimo ir teksto į balsą funkcijas, todėl sąveika yra greitesnė. OpenAI tvirtina, kad GPT-4o geba suvokti emocinius niuansus, perteikiamus vartotojo balsu, įskaitant jausmus, tokius kaip liūdesys, jaudulys ar muzikos tonai dainuojant.

Šiame bandomajame etape „ChatGPT Plus“ naudotojai patirs hiperrealistines išplėstinio balso režimo funkcijas. „OpenAI“ palaipsniui pristato šią funkciją, kad galėtų atidžiai prižiūrėti jos naudojimą. Alfa grupės naudotojai bus informuoti „ChatGPT“ programoje ir vėliau gaus išsamias instrukcijas el. paštu.

Nuo gegužės demonstracinės versijos OpenAI atliko GPT-4o balso funkcijų bandymus su daugiau nei 100 išorinių raudonųjų komandos narių, kalbančių 45 skirtingomis kalbomis. Ataskaita apie šias saugos iniciatyvas turėtų būti paskelbta rugpjūčio pradžioje. Išplėstiniame balso režime bus naudojami tik keturi ChatGPT iš anksto nustatyti balsai – Juniper, Breeze, Cove ir Ember – sukurti bendradarbiaujant su profesionaliais balso aktoriais. Gegužės mėnesį demonstruotas Dangaus balsas buvo nutrauktas. „OpenAI“ atstovės Lindsay McCallum teigimu, „ChatGPT“ negali atkartoti konkrečių asmenų balsų ir neleis generuoti išvesties, kurios nukrypsta nuo nustatytų iš anksto nustatytų balsų.


Vaizdas: OpenAI

Code Labs Academy © 2024 Visos teisės saugomos.