Uporabniki ChatGPT Plus dobijo zgodnji dostop do naprednega glasovnega načina OpenAI

Uporabniki ChatGPT Plus dobijo zgodnji dostop do naprednega glasovnega načina OpenAI

OpenAI je v torek začel z uvedbo naprednega glasovnega načina ChatGPT in uporabnikom omogočil začetni dostop do hiperrealističnih zvočnih odzivov GPT-4o. Različica alfa je trenutno dostopna omejeni skupini uporabnikov ChatGPT Plus, z namenom razširitve razpoložljivosti na vse uporabnike Plus do jeseni 2024.

Ko je OpenAI maja razkril glas GPT-4o, je bilo občinstvo navdušeno nad njegovimi hitrimi odzivi in ​​presenetljivo podobnostjo z dejanskim človeškim glasom. Glas, imenovan Sky, je zelo podoben tonu igralke Scarlett Johansson iz filma "Her". Po objavi predstavitve je Johanssonova izrazila zaskrbljenost glede podobnosti in najela pravno zastopstvo, da bi zaščitila svojo podobo. OpenAI je zavrnil uporabo Johanssonovega glasu in ga nato izločil iz predstavitve. Junija je OpenAI razkril preložitev uvedbe naprednega glasovnega načina za izboljšanje varnostnih protokolov.

En mesec kasneje OpenAI začenja implementacijo te funkcije; vendar pa funkcije videa in skupne rabe zaslona, ​​poudarjene v spomladanski posodobitvi, ne bodo del začetne izdaje alfa. Trenutno bodo izbrani premium uporabniki lahko uporabljali glasovno funkcijo, ki je bila predstavljena prej.

Napredni glasovni način se razlikuje od trenutnega glasovnega načina z uporabo GPT-4o, multimodalnega modela, ki neodvisno upravlja funkcije glasu v besedilo, obdelavo besedila in besedila v glas, kar vodi do hitrejših interakcij. OpenAI trdi, da ima GPT-4o sposobnost zaznavanja čustvenih odtenkov, ki se prenašajo z uporabnikovim glasom, vključno z občutki, kot so žalost, navdušenje ali glasbeni toni v obliki petja.

V tej pilotni fazi bodo uporabniki ChatGPT Plus izkusili hiperrealistične funkcije naprednega glasovnega načina. OpenAI postopoma uvaja to funkcijo, da bi natančno nadzoroval njeno uporabo. Uporabniki v skupini alfa bodo obveščeni v aplikaciji ChatGPT in nato po e-pošti prejeli podrobna navodila.

Od majske predstavitve je OpenAI izvajal teste glasovnih funkcij GPT-4o z več kot 100 zunanjimi sodelavci, ki govorijo 45 različnih jezikov. Poročilo o teh varnostnih pobudah naj bi bilo objavljeno v začetku avgusta. Napredni glasovni način bo vključeval samo štiri prednastavljene glasove ChatGPT – Juniper, Breeze, Cove in Ember – oblikovane v sodelovanju s profesionalnimi glasovnimi igralci. Glas Sky, predstavljen maja, je bil ukinjen. Po besedah ​​tiskovne predstavnice OpenAI, Lindsay McCallum, ChatGPT ne more posnemati glasov določenih posameznikov in bo preprečil ustvarjanje rezultatov, ki odstopajo od uveljavljenih prednastavljenih glasov.


Slika: OpenAI

Code Labs Academy © 2024 Vse pravice pridržane.