Карыстальнікі ChatGPT Plus атрымліваюць ранні доступ да пашыранага галасавога рэжыму OpenAI

Карыстальнікі ChatGPT Plus атрымліваюць ранні доступ да пашыранага галасавога рэжыму OpenAI

OpenAI ініцыяваў разгортванне пашыранага галасавога рэжыму ChatGPT у аўторак, падаючы карыстальнікам першапачатковы доступ да гіперрэалістычных гукавых адказаў GPT-4o. У цяперашні час альфа-версія даступная абмежаванай групе карыстальнікаў ChatGPT Plus з намерам пашырыць даступнасць для ўсіх карыстальнікаў Plus да восені 2024 года.

Калі ў траўні OpenAI прадставіў голас GPT-4o, аўдыторыя была ўражана яго хуткімі рэакцыямі і дзіўным падабенствам з сапраўдным чалавечым голасам. Голас пад назвай Скай вельмі пераклікаўся з тонам актрысы Скарлет Ёхансан з фільма «Яна». Размясціўшы дэманстрацыю, Ёхансан выказала асцярогі адносна падабенства і звярнулася да юрыдычнага прадстаўніка, каб абараніць свой імідж. OpenAI абверг выкарыстанне голасу Ёхансана і пасля выключыў яго з дэманстрацыі. У чэрвені OpenAI абвясціла аб адтэрміноўцы запуску пашыранага галасавога рэжыму для ўмацавання пратаколаў бяспекі.

Праз месяц OpenAI пачынае ўкараненне гэтай функцыі; аднак функцыі абагульвання відэа і экрана, вылучаныя ў вясновым абнаўленні, не будуць часткай першапачатковага альфа-рэлізу. У цяперашні час асобныя прэміум-карыстальнікі змогуць выкарыстоўваць галасавую функцыю, якая была прадэманстравана раней.

Пашыраны галасавы рэжым адрозніваецца ад цяперашняга галасавога рэжыму выкарыстаннем GPT-4o, мультымадальнай мадэлі, якая незалежна кіруе функцыямі пераўтварэння голасу ў тэкст, апрацоўкі тэксту і пераўтварэння тэксту ў голас, што прыводзіць да больш хуткага ўзаемадзеяння. OpenAI сцвярджае, што GPT-4o мае магчымасць успрымаць эмацыйныя адценні, якія перадаюцца праз голас карыстальніка, у тым ліку такія пачуцці, як смутак, хваляванне або музычныя тоны ў форме спеваў.

На гэтай пілотнай стадыі карыстальнікі ChatGPT Plus адчуюць гіперрэалістычныя функцыі Advanced Voice Mode. OpenAI паступова ўкараняе гэтую функцыю, каб уважліва сачыць за яе выкарыстаннем. Карыстальнікі ў альфа-групе будуць апавешчаныя ў дадатку ChatGPT і пасля атрымаюць падрабязныя інструкцыі па электроннай пошце.

Пачынаючы з майскай дэманстрацыі, OpenAI правёў выпрабаванні галасавых функцый GPT-4o з больш чым 100 знешнімі камандамі, якія размаўляюць на 45 розных мовах. Чакаецца, што справаздача аб гэтых ініцыятывах па бяспецы будзе апублікаваная ў пачатку жніўня. Пашыраны галасавы рэжым будзе мець толькі чатыры прадусталяваныя галасы ChatGPT — Juniper, Breeze, Cove і Ember — створаныя ў супрацоўніцтве з прафесійнымі акцёрамі галасавання. Голас Sky, паказаны ў траўні, быў спынены. Па словах прэс-сакратара OpenAI Ліндсэй МакКалум, ChatGPT не можа паўтарыць галасы пэўных людзей і прадухіляе генерацыю вынікаў, якія адхіляюцца ад устаноўленых загадзя настроеных галасоў.


Малюнак: OpenAI

Code Labs Academy © 2024 Усе правы абароненыя.