Користувачі ChatGPT Plus отримують ранній доступ до розширеного голосового режиму OpenAI

Користувачі ChatGPT Plus отримують ранній доступ до розширеного голосового режиму OpenAI

У вівторок OpenAI ініціював розгортання розширеного голосового режиму ChatGPT, надаючи користувачам початковий доступ до гіперреалістичних аудіовідповідей GPT-4o. Наразі альфа-версія доступна для обмеженої групи користувачів ChatGPT Plus із наміром розширити доступність для всіх користувачів Plus до осені 2024 року.

Коли OpenAI оприлюднив голос GPT-4o у травні, глядачі були вражені його швидкою реакцією та вражаючою схожістю з реальним людським голосом. Голос на ім'я Скай дуже нагадував інтонацію актриси Скарлетт Йоханссон з фільму «Вона». Опублікувавши демонстрацію, Йоханссон висловила побоювання щодо схожості та залучила юридичне представництво, щоб захистити свій імідж. OpenAI спростував використання голосу Йоханссон і згодом виключив його з демонстрації. У червні OpenAI повідомила про відкладення запуску розширеного голосового режиму для посилення протоколів безпеки.

Через місяць OpenAI починає впровадження цієї функції; однак функції перегляду відео та екрану, виділені у весняному оновленні, не будуть частиною початкової альфа-версії. Наразі окремі користувачі преміум-класу зможуть використовувати голосову функцію, яку було продемонстровано раніше.

Розширений голосовий режим відрізняється від поточного голосового режиму використанням GPT-4o, мультимодальної моделі, яка незалежно керує функціями перетворення голосу в текст, обробки тексту та перетворення тексту в голос, що забезпечує швидшу взаємодію. OpenAI стверджує, що GPT-4o має здатність сприймати емоційні нюанси, передані через голос користувача, включаючи почуття, такі як смуток, хвилювання або музичні тони у формі співу.

На цьому пілотному етапі користувачі ChatGPT Plus відчують гіперреалістичні функції розширеного голосового режиму. OpenAI поступово запроваджує цю функцію, щоб ретельно контролювати її використання. Користувачі альфа-групи отримають сповіщення в додатку ChatGPT і згодом отримають докладні інструкції електронною поштою.

Після травневої демонстрації OpenAI проводив тестування голосових функцій GPT-4o з більш ніж 100 зовнішніми червоними командами, які розмовляли 45 різними мовами. Очікується, що звіт про ці ініціативи безпеки буде опубліковано на початку серпня. Розширений голосовий режим міститиме лише чотири попередньо встановлені голоси ChatGPT — Juniper, Breeze, Cove і Ember, створені у співпраці з професійними акторами голосу. Голос Sky, продемонстрований у травні, припинено. За словами прес-секретаря OpenAI Ліндсі МакКаллум, ChatGPT не може відтворювати голоси конкретних осіб і запобігає створенню результатів, що відхиляються від встановлених попередньо встановлених голосів.


Зображення: OpenAI

Code Labs Academy © 2024 Всі права захищені.