ผู้ใช้ ChatGPT Plus สามารถเข้าถึงโหมดเสียงขั้นสูงของ OpenAI ได้ก่อนใคร

ผู้ใช้ ChatGPT Plus สามารถเข้าถึงโหมดเสียงขั้นสูงของ OpenAI ได้ก่อนใคร

OpenAI เริ่มเปิดตัวโหมดเสียงขั้นสูงของ ChatGPT เมื่อวันอังคาร โดยให้สิทธิ์ผู้ใช้ในการเข้าถึง การตอบสนองด้วยเสียงที่สมจริงเกินจริงของ GPT-4o ขณะนี้เวอร์ชันอัลฟ่าสามารถเข้าถึงได้โดยกลุ่มผู้ใช้ ChatGPT Plus ในจำนวนจำกัด โดยมีเป้าหมายที่จะขยายการให้บริการแก่ผู้ใช้ Plus ทุกคนภายในช่วงฤดูใบไม้ร่วงปี 2024

เมื่อ OpenAI เปิดตัวเสียงของ GPT-4o ในเดือนพฤษภาคม ผู้ชมประทับใจกับการตอบสนองที่รวดเร็วและความคล้ายคลึงกับเสียงมนุษย์จริงๆ เสียงที่ชื่อ Sky สะท้อนน้ำเสียงของนักแสดงสาว Scarlett Johansson จากภาพยนตร์เรื่อง “Her” อย่างใกล้ชิด หลังการสาธิต Johansson ทำให้เกิดความกังวลเกี่ยวกับความคล้ายคลึงกัน และเกณฑ์ตัวแทนทางกฎหมายเพื่อปกป้องภาพลักษณ์ของเธอ OpenAI ปฏิเสธการใช้เสียงของ Johansson และตัดออกจากการสาธิตในเวลาต่อมา ในเดือนมิถุนายน OpenAI เปิดเผยการเลื่อนในการเปิดตัวโหมดเสียงขั้นสูงเพื่อสนับสนุนโปรโตคอลด้านความปลอดภัย

หนึ่งเดือนต่อมา OpenAI กำลังเริ่มใช้งานฟีเจอร์นี้ อย่างไรก็ตาม ฟังก์ชั่นการแชร์วิดีโอและหน้าจอที่ไฮไลต์ใน Spring Update จะไม่เป็นส่วนหนึ่งของการเปิดตัวอัลฟ่าครั้งแรก ในปัจจุบัน ผู้ใช้ระดับพรีเมียมที่ได้รับเลือกจะสามารถใช้ฟีเจอร์เสียงที่จัดแสดงไว้ก่อนหน้านี้ได้

โหมดเสียงขั้นสูงทำให้ตัวเองแตกต่างจากโหมดเสียงปัจจุบันผ่านการใช้ GPT-4o ซึ่งเป็นโมเดลหลายรูปแบบที่จัดการฟังก์ชันเสียงเป็นข้อความ การประมวลผลข้อความ และข้อความเป็นเสียงอย่างเป็นอิสระ ทำให้มีการโต้ตอบที่รวดเร็วยิ่งขึ้น OpenAI ยืนยันว่า GPT-4o มีความสามารถในการรับรู้ความแตกต่างทางอารมณ์ที่ถ่ายทอดผ่านเสียงของผู้ใช้ รวมถึงความรู้สึก เช่น ความเศร้า ความตื่นเต้น หรือโทนเสียงดนตรีในรูปแบบของการร้องเพลง

ในขั้นนำร่องนี้ ผู้ใช้ ChatGPT Plus จะได้สัมผัสประสบการณ์ฟังก์ชันเหนือจริงของโหมดเสียงขั้นสูง OpenAI กำลังเปิดตัวฟีเจอร์นี้อย่างต่อเนื่องเพื่อดูแลการใช้งานอย่างใกล้ชิด ผู้ใช้ในกลุ่มอัลฟ่าจะได้รับแจ้งภายในแอป ChatGPT และจะได้รับคำแนะนำโดยละเอียดทางอีเมลในภายหลัง

นับตั้งแต่การสาธิตในเดือนพฤษภาคม OpenAI ได้ทำการทดสอบฟังก์ชันเสียงของ GPT-4o กับทีมงานสีแดงภายนอกมากกว่า 100 คนที่พูดได้ 45 ภาษา รายงานเกี่ยวกับโครงการริเริ่มด้านความปลอดภัยเหล่านี้คาดว่าจะเผยแพร่ในช่วงต้นเดือนสิงหาคม โหมดเสียงขั้นสูงจะมีเฉพาะเสียงที่ตั้งไว้ล่วงหน้าของ ChatGPT เพียงสี่เสียง ได้แก่ Juniper, Breeze, Cove และ Ember ซึ่งสร้างขึ้นโดยความร่วมมือกับนักพากย์มืออาชีพ เสียงของ Sky ที่แสดงในเดือนพฤษภาคมได้ถูกยกเลิกแล้ว ตามโฆษกของ OpenAI, Lindsay McCallum, ChatGPT ไม่สามารถจำลองเสียงของบุคคลใดบุคคลหนึ่งได้ และจะป้องกันการสร้างเอาต์พุตที่เบี่ยงเบนไปจากเสียงที่ตั้งไว้ล่วงหน้า

รูปภาพ: OpenAI

Code Labs Academy © 2024 สงวนลิขสิทธิ์.