Uživatelé ChatGPT Plus získají včasný přístup k pokročilému hlasovému režimu OpenAI

Uživatelé ChatGPT Plus získají včasný přístup k pokročilému hlasovému režimu OpenAI

OpenAI v úterý zahájila zavádění pokročilého hlasového režimu ChatGPT, který uživatelům poskytuje počáteční přístup k hyperrealistickým zvukovým odpovědím GPT-4o. Alfa verze je v současné době přístupná omezené skupině uživatelů ChatGPT Plus se záměrem rozšířit dostupnost pro všechny uživatele Plus do podzimu 2024.

Když OpenAI v květnu odhalila hlas GPT-4o, byli diváci ohromeni jeho rychlými reakcemi a nápadnou podobností se skutečným lidským hlasem. Hlas, pojmenovaný Sky, přesně odrážel tón herečky Scarlett Johansson z filmu „Her“. Po demu Johansson vzbudila obavy ohledně podobnosti a požádala o právní zastoupení, aby ochránila svou image. OpenAI vyvrátilo použití Johanssonova hlasu a následně jej odstranilo z dema. V červnu OpenAI zveřejnilo odložení spuštění pokročilého hlasového režimu pro posílení bezpečnostních protokolů.

O měsíc později OpenAI zahajuje implementaci této funkce; funkce videa a sdílení obrazovky zvýrazněné v jarní aktualizaci však nebudou součástí počáteční verze alfa. V současné době budou moci vybraní prémioví uživatelé využívat hlasovou funkci, která byla představena dříve.

Pokročilý hlasový režim se odlišuje od současného hlasového režimu využitím GPT-4o, multimodálního modelu, který nezávisle spravuje funkce hlasu na text, zpracování textu a text na hlas, což vede k rychlejší interakci. OpenAI tvrdí, že GPT-4o má schopnost vnímat emocionální nuance přenášené hlasem uživatele, včetně pocitů jako smutek, vzrušení nebo hudební tóny ve formě zpěvu.

V této pilotní fázi si uživatelé ChatGPT Plus vyzkouší hyperrealistické funkce pokročilého hlasového režimu. OpenAI postupně zavádí tuto funkci, aby pečlivě dohlížela na její používání. Uživatelé v alfa skupině budou upozorněni v rámci aplikace ChatGPT a následně obdrží podrobné pokyny e-mailem.

Od květnového dema provedla OpenAI testy hlasových funkcí GPT-4o s více než 100 externími červenými týmy hovořícími 45 různými jazyky. Očekává se, že zpráva o těchto bezpečnostních iniciativách bude zveřejněna začátkem srpna. Pokročilý hlasový režim bude obsahovat pouze čtyři přednastavené hlasy ChatGPT – Juniper, Breeze, Cove a Ember – vytvořené ve spolupráci s profesionálními hlasovými herci. Hlas Sky demonstrovaný v květnu byl ukončen. Jak uvádí mluvčí OpenAI, Lindsay McCallum, ChatGPT není schopen replikovat hlasy konkrétních jednotlivců a zabrání generování výstupů odchylujících se od zavedených přednastavených hlasů.


Obrázek: OpenAI

Code Labs Academy © 2024 Všechna práva vyhrazena.