ChatGPT Plus-gebruikers kry vroeë toegang tot OpenAI se gevorderde stemmodus

ChatGPT Plus-gebruikers kry vroeë toegang tot OpenAI se gevorderde stemmodus

OpenAI het Dinsdag die bekendstelling van ChatGPT se Gevorderde Stemmodus begin, wat gebruikers aanvanklike toegang verleen het tot GPT-4o se hiperrealistiese oudio-antwoorde. Die alfa-weergawe is tans toeganklik vir 'n beperkte groep ChatGPT Plus-gebruikers, met voorneme om beskikbaarheid na alle Plus-gebruikers teen die herfs van 2024 uit te brei.

Toe OpenAI GPT-4o se stem in Mei onthul het, was gehore beïndruk deur sy vinnige reaksies en sy treffende ooreenkoms met 'n werklike menslike stem. Die stem, genaamd Sky, het die toon van die aktrise Scarlett Johansson uit die fliek "Her" goed weerklink. Na die demonstrasie het Johansson kommer oor die ooreenkoms geopper en regsverteenwoordiging ingeroep om haar beeld te beskerm. OpenAI het die gebruik van Johansson se stem weerlê en dit daarna uit die demo uitgeskakel. In Junie het OpenAI 'n uitstel bekend gemaak in die bekendstelling van die Gevorderde Stemmodus om veiligheidsprotokolle te versterk.

Een maand later begin OpenAI met die implementering van hierdie kenmerk; die video- en skermdelingfunksies wat in die Lente-opdatering uitgelig is, sal egter nie deel van die aanvanklike alfa-vrystelling wees nie. Op die oomblik sal uitgesoekte premium gebruikers die stemfunksie kan gebruik wat vroeër ten toon gestel is.

Gevorderde stemmodus onderskei hom van die huidige stemmodus deur die gebruik van GPT-4o, 'n multimodale model wat stem-tot-teks, teksverwerking en teks-na-stem-funksies onafhanklik bestuur, wat lei tot vinniger interaksies. OpenAI beweer dat GPT-4o die vermoë het om emosionele nuanses waar te neem wat deur die gebruiker se stem oorgedra word, insluitend gevoelens soos hartseer, opgewondenheid of musikale tone in die vorm van sang.

In hierdie loodsfase sal gebruikers van ChatGPT Plus die hiperrealistiese funksies van Advanced Voice Mode ervaar. OpenAI stel hierdie funksie geleidelik bekend om noukeurig toesig te hou oor die gebruik daarvan. Gebruikers in die alfagroep sal binne die ChatGPT-toepassing in kennis gestel word en sal vervolgens gedetailleerde instruksies per e-pos ontvang.

Sedert die Mei-demonstrasie het OpenAI toetse op GPT-4o se stemfunksies uitgevoer met meer as 100 eksterne rooi spanne wat 45 verskillende tale praat. 'n Verslag oor hierdie veiligheidsinisiatiewe sal na verwagting vroeg in Augustus vrygestel word. Die gevorderde stemmodus sal slegs ChatGPT se vier voorafbepaalde stemme bevat—Juniper, Breeze, Cove en Ember—gemaak in samewerking met professionele stemakteurs. Die Sky-stem wat in Mei gedemonstreer is, is gestaak. Volgens OpenAI-woordvoerder, Lindsay McCallum, is ChatGPT nie in staat om die stemme van spesifieke individue te herhaal nie en sal dit verhoed dat die generering van uitsette afwyk van die gevestigde voorafbepaalde stemme.


Beeld: OpenAI

Code Labs Academy © 2024 Alle regte voorbehou.