Utilizatorii ChatGPT Plus au acces timpuriu la modul avansat de voce al OpenAI

Actualizat pe September 03, 2024 2 Minute citite

OpenAI a inițiat marți lansarea modului vocal avansat al ChatGPT, oferind utilizatorilor acces inițial la răspunsurile audio hiperrealiste ale GPT-4o. Versiunea alfa este în prezent accesibilă unui grup limitat de utilizatori ChatGPT Plus, cu intenții de a extinde disponibilitatea pentru toți utilizatorii Plus până în toamna lui 2024.

Când OpenAI a dezvăluit vocea lui GPT-4o în mai, publicul a fost impresionat de răspunsurile sale rapide și de asemănarea sa izbitoare cu o voce umană reală. Vocea, numită Sky, a reflectat îndeaproape tonul actriței Scarlett Johansson din filmul „Her”. După demo, Johansson și-a exprimat îngrijorarea cu privire la asemănarea și a solicitat reprezentare legală pentru a-și proteja imaginea. OpenAI a respins utilizarea vocii lui Johansson și ulterior a eliminat-o din demo. În iunie, OpenAI a dezvăluit o amânare a lansării modului vocal avansat pentru a consolida protocoalele de siguranță.

O lună mai târziu, OpenAI începe implementarea acestei caracteristici; cu toate acestea, funcțiile video și de partajare a ecranului evidențiate în Actualizarea de primăvară nu vor face parte din lansarea inițială alfa. În prezent, utilizatorii premium selectați vor putea utiliza funcția de voce care a fost prezentată mai devreme.

Modul vocal avansat se deosebește de modul vocal actual prin utilizarea GPT-4o, un model multimodal care gestionează în mod independent funcțiile voce-text, procesare text și text-voce, ceea ce duce la interacțiuni mai rapide. OpenAI afirmă că GPT-4o are capacitatea de a percepe nuanțele emoționale transmise prin vocea utilizatorului, inclusiv sentimente precum tristețe, entuziasm sau tonuri muzicale sub formă de cânt.

În această etapă pilot, utilizatorii ChatGPT Plus vor experimenta funcțiile hiperrealiste ale modului vocal avansat. OpenAI introduce progresiv această caracteristică pentru a supraveghea îndeaproape utilizarea acesteia. Utilizatorii din grupul alfa vor fi notificați în cadrul aplicației ChatGPT și vor primi ulterior instrucțiuni detaliate prin e-mail.

De la demonstrația din mai, OpenAI a efectuat teste privind funcționalitățile vocale ale GPT-4o, cu mai mult de 100 de echipe roșii externe care vorbesc 45 de limbi diferite. Un raport despre aceste inițiative de siguranță este de așteptat să fie lansat la începutul lunii august. Modul vocal avansat va include doar cele patru voci presetate ale ChatGPT — Juniper, Breeze, Cove și Ember — create în colaborare cu actori vocali profesioniști. Vocea Sky demonstrată în mai a fost întreruptă. Potrivit purtătorului de cuvânt al OpenAI, Lindsay McCallum, ChatGPT nu poate reproduce vocile anumitor persoane și va împiedica generarea de ieșiri care se abate de la vocile prestabilite stabilite.

Utilizatorii ChatGPT Plus au acces timpuriu la modul avansat de voce al OpenAI

Imagine: OpenAI