ChatGPT Plus-ի օգտատերերը վաղաժամ հասանելիություն են ստանում OpenAI-ի Ընդլայնված Ձայնային ռեժիմին

ChatGPT Plus-ի օգտատերերը վաղաժամ հասանելիություն են ստանում OpenAI-ի Ընդլայնված Ձայնային ռեժիմին

OpenAI-ը նախաձեռնել է ChatGPT-ի Ընդլայնված ձայնային ռեժիմի ներդրումը երեքշաբթի օրը՝ օգտվողներին տրամադրելով նախնական մուտք դեպի GPT-4o-ի հիպերիրատեսական աուդիո պատասխանները: Ալֆա տարբերակը ներկայումս հասանելի է ChatGPT Plus օգտվողների սահմանափակ խմբի համար՝ մինչև 2024 թվականի աշուն հասանելիությունը բոլոր Plus օգտվողների համար ընդլայնելու մտադրություններով:

Երբ OpenAI-ը բացահայտեց GPT-4o-ի ձայնը մայիսին, հանդիսատեսը տպավորված էր նրա արագ արձագանքներով և մարդկային իրական ձայնի ապշեցուցիչ նմանությամբ: Սքայ անունով ձայնը սերտորեն կրկնում էր դերասանուհի Սքարլեթ Յոհանսոնի հնչերանգը «Her» ֆիլմից։ Դեմո ցուցադրությունից հետո Յոհանսոնը մտավախություններ առաջացրեց նմանության վերաբերյալ և իր իմիջը պաշտպանելու համար օրինական ներկայացուցչություն ներկայացրեց: OpenAI-ը հերքեց Յոհանսոնի ձայնի օգտագործումը և հետագայում այն ​​վերացրեց ցուցադրությունից: Հունիսին OpenAI-ը բացահայտեց առաջադեմ ձայնային ռեժիմի գործարկման հետաձգումը՝ անվտանգության արձանագրությունները ամրապնդելու համար:

Մեկ ամիս անց OpenAI-ն սկսում է այս գործառույթի ներդրումը. Այնուամենայնիվ, Գարնանային թարմացումում ընդգծված տեսանյութերի և էկրանի փոխանակման գործառույթները չեն լինի սկզբնական ալֆա թողարկման մաս: Ներկայումս ընտրված պրեմիում օգտագործողները կկարողանան օգտագործել ձայնային գործառույթը, որը ցուցադրվել էր ավելի վաղ:

Ընդլայնված Ձայնային ռեժիմն իրեն առանձնացնում է ընթացիկ Ձայնային ռեժիմից՝ օգտագործելով GPT-4o, մուլտիմոդալ մոդել, որը ինքնուրույն կառավարում է ձայնից տեքստ, տեքստի մշակումը և տեքստից ձայնի գործառույթները՝ հանգեցնելով ավելի արագ փոխազդեցությունների: OpenAI-ը պնդում է, որ GPT-4o-ն կարող է ընկալել օգտատիրոջ ձայնի միջոցով փոխանցվող զգացմունքային նրբերանգները, ներառյալ այնպիսի զգացողություններ, ինչպիսիք են տխրությունը, հուզմունքը կամ երաժշտական ​​հնչերանգները երգելու ձևով:

Այս փորձնական փուլում ChatGPT Plus-ի օգտատերերը կզգան Ընդլայնված ձայնային ռեժիմի հիպերռեալիստական ​​գործառույթները: OpenAI-ն աստիճանաբար ներդնում է այս հատկությունը՝ դրա օգտագործումը սերտորեն վերահսկելու համար: Ալֆա խմբի օգտատերերը կտեղեկացվեն ChatGPT հավելվածի շրջանակներում և հետագայում մանրամասն հրահանգներ կստանան էլփոստի միջոցով:

Մայիսի ցուցադրությունից ի վեր OpenAI-ն թեստեր է անցկացրել GPT-4o-ի ձայնային գործառույթների վերաբերյալ ավելի քան 100 արտաքին կարմիր թիմակիցների հետ, ովքեր խոսում են 45 տարբեր լեզուներով: Ակնկալվում է, որ անվտանգության այս նախաձեռնությունների վերաբերյալ զեկույցը կհրապարակվի օգոստոսի սկզբին: Ընդլայնված ձայնային ռեժիմը կներկայացնի միայն ChatGPT-ի չորս նախադրված ձայները՝ Juniper, Breeze, Cove և Ember, որոնք ստեղծված են պրոֆեսիոնալ ձայնային դերասանների հետ համատեղ: Մայիսին ցուցադրված Sky ձայնը դադարեցվել է։ Ինչպես ասում է OpenAI-ի խոսնակ Լինդսի ՄակՔալումը, ChatGPT-ն ի վիճակի չէ կրկնօրինակել կոնկրետ անհատների ձայները և կկանխի սահմանված նախադրված ձայներից շեղվող արդյունքների ստեղծումը:


Պատկեր՝ OpenAI

Code Labs Academy © 2024 Բոլոր իրավունքները պաշտպանված են.