Οι χρήστες του ChatGPT Plus αποκτούν πρώιμη πρόσβαση στη σύνθετη λειτουργία φωνής του OpenAI

Οι χρήστες του ChatGPT Plus αποκτούν πρώιμη πρόσβαση στη σύνθετη λειτουργία φωνής του OpenAI

Το OpenAI ξεκίνησε την κυκλοφορία της Advanced Voice Mode του ChatGPT την Τρίτη, παρέχοντας στους χρήστες αρχική πρόσβαση στις υπερρεαλιστικές ηχητικές απαντήσεις του GPT-4o. Η έκδοση alpha είναι προς το παρόν προσβάσιμη σε μια περιορισμένη ομάδα χρηστών ChatGPT Plus, με πρόθεση να επεκταθεί η διαθεσιμότητα σε όλους τους χρήστες Plus έως το φθινόπωρο του 2024.

Όταν το OpenAI παρουσίασε τη φωνή του GPT-4o τον Μάιο, το κοινό εντυπωσιάστηκε από τις γρήγορες απαντήσεις του και την εντυπωσιακή του ομοιότητα με μια πραγματική ανθρώπινη φωνή. Η φωνή, που ονομάζεται Sky, απηχούσε στενά τον τόνο της ηθοποιού Scarlett Johansson από την ταινία "Her". Μετά το demo, η Johansson προκάλεσε ανησυχίες σχετικά με την ομοιότητα και ζήτησε νομική εκπροσώπηση για να διαφυλάξει την εικόνα της. Το OpenAI διέψευσε τη χρήση της φωνής του Johansson και στη συνέχεια την απέκλεισε από το demo. Τον Ιούνιο, το OpenAI αποκάλυψε μια αναβολή στην κυκλοφορία του Advanced Voice Mode για την ενίσχυση των πρωτοκόλλων ασφαλείας.

Ένα μήνα αργότερα, το OpenAI ξεκινά την εφαρμογή αυτής της δυνατότητας. Ωστόσο, οι λειτουργίες βίντεο και κοινής χρήσης οθόνης που επισημαίνονται στο Spring Update δεν θα αποτελούν μέρος της αρχικής έκδοσης alpha. Προς το παρόν, επιλεγμένοι χρήστες premium θα μπορούν να χρησιμοποιούν τη δυνατότητα φωνής που παρουσιάστηκε νωρίτερα.

Η προηγμένη λειτουργία φωνής ξεχωρίζει από την τρέχουσα λειτουργία φωνής μέσω της χρήσης του GPT-4o, ενός πολυτροπικού μοντέλου που διαχειρίζεται ανεξάρτητα τις λειτουργίες φωνής σε κείμενο, επεξεργασίας κειμένου και κειμένου με φωνή, οδηγώντας σε ταχύτερες αλληλεπιδράσεις. Το OpenAI βεβαιώνει ότι το GPT-4o έχει την ικανότητα να αντιλαμβάνεται συναισθηματικές αποχρώσεις που μεταφέρονται μέσω της φωνής του χρήστη, συμπεριλαμβανομένων συναισθημάτων όπως λύπη, ενθουσιασμό ή μουσικούς τόνους με τη μορφή τραγουδιού.

Σε αυτό το πιλοτικό στάδιο, οι χρήστες του ChatGPT Plus θα βιώσουν τις υπερρεαλιστικές λειτουργίες της Advanced Voice Mode. Το OpenAI εισάγει σταδιακά αυτή τη δυνατότητα για να επιβλέπει στενά τη χρήση του. Οι χρήστες στην ομάδα alpha θα ειδοποιηθούν μέσω της εφαρμογής ChatGPT και στη συνέχεια θα λάβουν λεπτομερείς οδηγίες μέσω email.

Από την επίδειξη του Μαΐου, το OpenAI έχει πραγματοποιήσει δοκιμές στις λειτουργίες φωνής του GPT-4o με περισσότερους από 100 εξωτερικούς συνεργάτες που μιλούν 45 διαφορετικές γλώσσες. Μια έκθεση σχετικά με αυτές τις πρωτοβουλίες ασφάλειας αναμένεται να δημοσιευτεί στις αρχές Αυγούστου. Η Advanced Voice Mode θα περιλαμβάνει μόνο τις τέσσερις προκαθορισμένες φωνές του ChatGPT—Juniper, Breeze, Cove και Ember—δημιουργημένες σε συνεργασία με επαγγελματίες φωνητικούς ηθοποιούς. Η φωνή του Sky που παρουσιάστηκε τον Μάιο έχει διακοπεί. Σύμφωνα με την εκπρόσωπο του OpenAI, Lindsay McCallum, το ChatGPT δεν είναι σε θέση να αναπαράγει τις φωνές συγκεκριμένων ατόμων και θα αποτρέψει τη δημιουργία εξόδων που αποκλίνουν από τις καθιερωμένες προκαθορισμένες φωνές.


Εικόνα: OpenAI

Code Labs Academy © 2024 Όλα τα δικαιώματα διατηρούνται.