ChatGPT Plus -käyttäjät saavat aikaisen pääsyn OpenAI:n Advanced Voice Mode -tilaan

ChatGPT Plus -käyttäjät saavat aikaisen pääsyn OpenAI:n Advanced Voice Mode -tilaan

OpenAI aloitti ChatGPT:n Advanced Voice Mode -tilan käyttöönoton tiistaina ja antoi käyttäjille pääsyn GPT-4o:n hyperrealistisiin äänivastauksiin. Alfaversio on tällä hetkellä saatavilla rajoitetulle ryhmälle ChatGPT Plus -käyttäjiä, ja aikomuksena on laajentaa saatavuus kaikille Plus-käyttäjille syksyyn 2024 mennessä.

Kun OpenAI julkisti GPT-4o:n äänen toukokuussa, yleisö teki vaikutuksen sen nopeista reaktioista ja sen hämmästyttävästä samankaltaisuudesta todellisen ihmisäänen kanssa. Ääni, nimeltä Sky, toisti läheisesti näyttelijä Scarlett Johanssonin sävyä elokuvasta "Her". Demon julkaisun jälkeen Johansson herätti pelkoa samankaltaisuudesta ja pyysi lainopillista edustajaa suojellakseen imagoaan. OpenAI kiisti Johanssonin äänen käytön ja poisti sen myöhemmin demosta. Kesäkuussa OpenAI ilmoitti lykkäävänsä Advanced Voice Mode -tilan käynnistämistä turvaprotokollien vahvistamiseksi.

Kuukautta myöhemmin OpenAI aloittaa tämän ominaisuuden käyttöönoton; Kevätpäivityksessä korostetut video- ja näytönjakotoiminnot eivät kuitenkaan ole osa alkuperäistä alfajulkaisua. Tällä hetkellä valitut premium-käyttäjät voivat hyödyntää aiemmin esiteltyä ääniominaisuutta.

Advanced Voice Mode erottuu nykyisestä äänitilasta käyttämällä GPT-4o:ta, multimodaalista mallia, joka hallitsee ääni-teksti-, tekstinkäsittely- ja teksti-äänitoimintoja itsenäisesti, mikä nopeuttaa vuorovaikutusta. OpenAI väittää, että GPT-4o pystyy havaitsemaan käyttäjän äänellä välittyviä emotionaalisia vivahteita, mukaan lukien tunteet, kuten surun, jännityksen tai musiikin sävyt laulun muodossa.

Tässä pilottivaiheessa ChatGPT Plus:n käyttäjät kokevat Advanced Voice Moden hyperrealistiset toiminnot. OpenAI ottaa asteittain käyttöön tämän ominaisuuden valvoakseen sen käyttöä tarkasti. Alfaryhmän käyttäjille ilmoitetaan ChatGPT-sovelluksessa, ja he saavat myöhemmin yksityiskohtaiset ohjeet sähköpostitse.

Toukokuun demon jälkeen OpenAI on testannut GPT-4o:n puhetoimintoja yli 100 ulkopuolisen punaisen tiimin kanssa, jotka puhuvat 45 eri kieltä. Näistä turvallisuusaloitteista raportin odotetaan julkaistavan elokuun alussa. Advanced Voice Mode sisältää vain ChatGPT:n neljä esiasetettua ääntä – Juniper, Breeze, Cove ja Ember – jotka on muotoiltu yhteistyössä ammattinäyttelijöiden kanssa. Toukokuussa esitelty Sky-ääni on lopetettu. OpenAI:n tiedottajan Lindsay McCallumin mukaan ChatGPT ei pysty toistamaan tiettyjen henkilöiden ääniä ja estää tulosteiden luomisen, jotka poikkeavat vahvistetuista esiasetetuista äänistä.


Kuva: OpenAI

Code Labs Academy © 2024 Kaikki oikeudet pidätetään.