Pengguna ChatGPT Plus Mendapatkan Akses Awal ke Mode Suara Tingkat Lanjut OpenAI

Pengguna ChatGPT Plus Mendapatkan Akses Awal ke Mode Suara Tingkat Lanjut OpenAI

OpenAI memulai peluncuran Mode Suara Lanjutan ChatGPT pada hari Selasa, memberikan pengguna akses awal ke respons audio hiperrealistis GPT-4o. Versi alfa saat ini dapat diakses oleh sekelompok pengguna ChatGPT Plus terbatas, dengan tujuan untuk memperluas ketersediaan bagi semua pengguna Plus pada musim gugur tahun 2024.

Saat OpenAI meluncurkan suara GPT-4o pada bulan Mei, penonton terkesan dengan responsnya yang cepat dan kemiripannya dengan suara manusia sebenarnya. Suara tersebut, bernama Sky, sangat mirip dengan nada suara aktris Scarlett Johansson dari film “Her.” Pasca demo, Johansson menyampaikan kekhawatiran mengenai kemiripan tersebut dan meminta perwakilan hukum untuk menjaga citranya. OpenAI membantah penggunaan suara Johansson dan kemudian menghilangkannya dari demo. Pada bulan Juni, OpenAI mengungkapkan penundaan peluncuran Mode Suara Tingkat Lanjut untuk meningkatkan protokol keselamatan.

Satu bulan kemudian, OpenAI mulai mengimplementasikan fitur ini; namun, fungsi video dan berbagi layar yang disorot dalam Pembaruan Musim Semi tidak akan menjadi bagian dari rilis alfa awal. Saat ini, pengguna premium terpilih akan dapat memanfaatkan fitur suara yang telah dipamerkan sebelumnya.

Mode Suara Tingkat Lanjut membedakan dirinya dari Mode Suara saat ini melalui pemanfaatan GPT-4o, model multimodal yang mengelola fungsi suara-ke-teks, pemrosesan teks, dan teks-ke-suara secara mandiri, sehingga menghasilkan interaksi yang lebih cepat. OpenAI menegaskan bahwa GPT-4o memiliki kemampuan untuk merasakan nuansa emosional yang disampaikan melalui suara pengguna, termasuk perasaan seperti kesedihan, kegembiraan, atau nada musik dalam bentuk nyanyian.

Dalam tahap uji coba ini, pengguna ChatGPT Plus akan merasakan fungsi hiperrealistis dari Mode Suara Tingkat Lanjut. OpenAI secara bertahap memperkenalkan fitur ini untuk mengawasi penggunaannya dengan cermat. Pengguna di grup alfa akan diberi tahu dalam aplikasi ChatGPT dan selanjutnya akan menerima instruksi terperinci melalui email.

Sejak demo bulan Mei, OpenAI telah melakukan pengujian terhadap fungsi suara GPT-4o dengan lebih dari 100 tim merah eksternal yang berbicara dalam 45 bahasa berbeda. Laporan mengenai inisiatif keselamatan ini diperkirakan akan dirilis pada awal Agustus. Mode Suara Tingkat Lanjut hanya akan menampilkan empat suara preset ChatGPT—Juniper, Breeze, Cove, dan Ember—yang dibuat melalui kolaborasi dengan pengisi suara profesional. Suara Langit yang didemonstrasikan pada bulan Mei telah dihentikan. Menurut juru bicara OpenAI, Lindsay McCallum, ChatGPT tidak dapat mereplikasi suara individu tertentu dan akan mencegah keluaran yang menyimpang dari suara yang telah ditetapkan sebelumnya.


Gambar: OpenAI

Code Labs Academy © 2024 Semua hak dilindungi undang-undang.