ChatGPT Plus lietotāji saņem agrīnu piekļuvi OpenAI uzlabotajam balss režīmam

ChatGPT Plus lietotāji saņem agrīnu piekļuvi OpenAI uzlabotajam balss režīmam

OpenAI otrdien uzsāka ChatGPT uzlabotā balss režīma izlaišanu, nodrošinot lietotājiem sākotnējo piekļuvi GPT-4o hiperreālistiskām audio atbildēm. Alfa versija pašlaik ir pieejama ierobežotai ChatGPT Plus lietotāju grupai, un ir paredzēts līdz 2024. gada rudenim paplašināt pieejamību visiem Plus lietotājiem.

Kad OpenAI maijā atklāja GPT-4o balsi, auditoriju pārsteidza tā ātrā reakcija un tā pārsteidzošā līdzība ar īstu cilvēka balsi. Balss, vārdā Sky, cieši sasaucās ar aktrises Skārletas Johansones toni no filmas “Viņa”. Pēc demonstrācijas publicēšanas Johansone pauda bažas par līdzību un piesaistīja juridisko pārstāvniecību, lai aizsargātu savu tēlu. OpenAI atspēkoja Johansona balss izmantošanu un pēc tam izslēdza to no demonstrācijas. Jūnijā OpenAI atklāja uzlabotā balss režīma palaišanas atlikšanu, lai stiprinātu drošības protokolus.

Pēc mēneša OpenAI sāk šīs funkcijas ieviešanu; tomēr pavasara atjauninājumā izceltās video un ekrāna koplietošanas funkcijas nebūs daļa no sākotnējā alfa laidiena. Pašlaik atsevišķi premium lietotāji varēs izmantot balss funkciju, kas tika demonstrēta iepriekš.

Uzlabotais balss režīms izceļas no pašreizējā balss režīma, izmantojot GPT-4o — multimodālu modeli, kas neatkarīgi pārvalda balss pārveides uz tekstu, teksta apstrādi un teksta pārvēršanu balss funkcijas, tādējādi nodrošinot ātrāku mijiedarbību. OpenAI apgalvo, ka GPT-4o spēj uztvert emocionālas nianses, kas tiek pārraidītas ar lietotāja balsi, tostarp tādas sajūtas kā skumjas, satraukums vai mūzikas toņi dziedāšanas veidā.

Šajā izmēģinājuma posmā ChatGPT Plus lietotāji izjutīs uzlabotā balss režīma hiperreālistiskās funkcijas. OpenAI pakāpeniski ievieš šo funkciju, lai rūpīgi pārraudzītu tās izmantošanu. Alfa grupas lietotāji tiks informēti lietotnē ChatGPT un pēc tam pa e-pastu saņems detalizētus norādījumus.

Kopš maija demonstrācijas OpenAI ir veicis GPT-4o balss funkcionalitātes testus ar vairāk nekā 100 ārējiem sarkanajiem komandas darbiniekiem, kas runā 45 dažādās valodās. Paredzams, ka ziņojums par šīm drošības iniciatīvām tiks publicēts augusta sākumā. Uzlabotajā balss režīmā būs tikai četras ChatGPT iepriekš iestatītās balsis — Juniper, Breeze, Cove un Ember —, kas izstrādātas sadarbībā ar profesionāliem balss aktieriem. Maijā demonstrētā Sky balss darbība ir pārtraukta. Kā norāda OpenAI pārstāve Lindsija Makkaluma, ChatGPT nespēj replicēt konkrētu personu balsis un novērsīs izvadu ģenerēšanu, kas atšķiras no noteiktajām iepriekš iestatītajām balsīm.


Attēls: OpenAI

Code Labs Academy © 2024 Visas tiesības paturētas.