Používatelia ChatGPT Plus získajú skorý prístup k pokročilému hlasovému režimu OpenAI

Používatelia ChatGPT Plus získajú skorý prístup k pokročilému hlasovému režimu OpenAI

OpenAI iniciovala v utorok zavedenie pokročilého hlasového režimu ChatGPT, čím používateľom poskytuje počiatočný prístup k hyperrealistickým zvukovým odpovediam GPT-4o. Alfa verzia je v súčasnosti prístupná pre obmedzenú skupinu používateľov ChatGPT Plus so zámerom rozšíriť dostupnosť pre všetkých používateľov Plus do jesene 2024.

Keď OpenAI v máji odhalila hlas GPT-4o, na publikum zapôsobili jeho rýchle reakcie a nápadná podobnosť so skutočným ľudským hlasom. Hlas s názvom Sky presne odrážal tón herečky Scarlett Johansson z filmu „Her“. Po deme Johansson vzbudila obavy týkajúce sa podobnosti a požiadala o právne zastúpenie, aby ochránila svoj obraz. OpenAI vyvrátilo použitie Johanssonovho hlasu a následne ho odstránilo z dema. V júni OpenAI zverejnila odloženie spustenia pokročilého hlasového režimu na posilnenie bezpečnostných protokolov.

O mesiac neskôr OpenAI začína s implementáciou tejto funkcie; funkcie videa a zdieľania obrazovky zvýraznené v jarnej aktualizácii však nebudú súčasťou počiatočnej verzie alfa. V súčasnosti budú môcť vybraní prémioví používatelia využívať hlasovú funkciu, ktorá bola predstavená skôr.

Pokročilý hlasový režim sa odlišuje od súčasného hlasového režimu využitím GPT-4o, multimodálneho modelu, ktorý nezávisle spravuje funkcie hlasu na text, spracovanie textu a text na hlas, čo vedie k rýchlejšej interakcii. OpenAI tvrdí, že GPT-4o má schopnosť vnímať emocionálne nuansy prenášané cez hlas používateľa, vrátane pocitov ako smútok, vzrušenie alebo hudobné tóny vo forme spevu.

V tejto pilotnej fáze zažijú používatelia ChatGPT Plus hyperrealistické funkcie pokročilého hlasového režimu. OpenAI postupne zavádza túto funkciu, aby podrobne dohliadala na jej používanie. Používatelia v skupine alfa budú upozornení v rámci aplikácie ChatGPT a následne dostanú podrobné pokyny e-mailom.

Od májového dema OpenAI vykonalo testy hlasových funkcií GPT-4o s viac ako 100 externými červenými tímami, ktorí hovoria 45 rôznymi jazykmi. Očakáva sa, že správa o týchto bezpečnostných iniciatívach bude zverejnená začiatkom augusta. Pokročilý hlasový režim bude obsahovať iba štyri prednastavené hlasy ChatGPT – Juniper, Breeze, Cove a Ember – vytvorené v spolupráci s profesionálnymi hlasovými hercami. Hlas Sky demonštrovaný v máji bol ukončený. Podľa hovorkyne OpenAI, Lindsay McCallum, ChatGPT nedokáže replikovať hlasy konkrétnych jednotlivcov a zabráni generovaniu výstupov, ktoré sa odchyľujú od zavedených prednastavených hlasov.


Obrázok: OpenAI

Code Labs Academy © 2024 Všetky práva vyhradené.