Els usuaris de ChatGPT Plus tenen accés anticipat al mode de veu avançat d'OpenAI

Els usuaris de ChatGPT Plus tenen accés anticipat al mode de veu avançat d'OpenAI

OpenAI va iniciar dimarts el llançament del mode de veu avançat de ChatGPT, donant als usuaris accés inicial a respostes d'àudio hiperrealistes de GPT-4o. Actualment, la versió alfa és accessible per a un grup limitat d'usuaris de ChatGPT Plus, amb la intenció d'estendre la disponibilitat a tots els usuaris de Plus a la tardor del 2024.

Quan OpenAI va presentar la veu de GPT-4o al maig, el públic va quedar impressionat per les seves respostes ràpides i la seva sorprenent semblança amb una veu humana real. La veu, anomenada Sky, va fer ressò de prop el to de l'actriu Scarlett Johansson de la pel·lícula "Her". Després de la demostració, Johansson va manifestar temors sobre la semblança i va demanar representació legal per salvaguardar la seva imatge. OpenAI va refutar l'ús de la veu de Johansson i, posteriorment, la va eliminar de la demostració. Al juny, OpenAI va revelar un ajornament en el llançament del mode de veu avançat per reforçar els protocols de seguretat.

Un mes després, OpenAI comença la implementació d'aquesta característica; tanmateix, les funcions de vídeo i d'ús compartit de pantalla destacades a l'actualització de primavera no formaran part de la versió alfa inicial. Actualment, els usuaris premium seleccionats podran utilitzar la funció de veu que es va mostrar anteriorment.

El mode de veu avançat es diferencia del mode de veu actual mitjançant la utilització de GPT-4o, un model multimodal que gestiona les funcions de veu a text, processament de text i text a veu de manera independent, donant lloc a interaccions més ràpides. OpenAI afirma que GPT-4o té la capacitat de percebre els matisos emocionals que es transmeten a través de la veu de l'usuari, inclosos sentiments com la tristesa, l'emoció o els tons musicals en forma de cant.

En aquesta etapa pilot, els usuaris de ChatGPT Plus experimentaran les funcions hiperrealistes del mode de veu avançat. OpenAI està introduint progressivament aquesta funció per supervisar-ne l'ús de prop. Els usuaris del grup alfa rebran una notificació a l'aplicació ChatGPT i, posteriorment, rebran instruccions detallades per correu electrònic.

Des de la demostració de maig, OpenAI ha realitzat proves sobre les funcionalitats de veu del GPT-4o amb més de 100 equips vermells externs que parlen 45 idiomes diferents. Es preveu que a principis d'agost es publiqui un informe sobre aquestes iniciatives de seguretat. El mode de veu avançat només comptarà amb les quatre veus predefinides de ChatGPT: Juniper, Breeze, Cove i Ember, fetes en col·laboració amb actors de veu professionals. La veu de Sky demostrada al maig s'ha interromput. Segons la portaveu d'OpenAI, Lindsay McCallum, ChatGPT no pot replicar les veus d'individus específics i evitarà la generació de sortides que es desviïn de les veus preestablertes establertes.


Imatge: OpenAI

Code Labs Academy © 2024 Tots els drets reservats.