ในการแสวงหาการจำลองแบบสติปัญญาของมนุษย์ จุดเน้นของการแข่งขันด้านอาวุธปัญญาประดิษฐ์เริ่มแรกมีศูนย์กลางอยู่ที่การสร้างแบบจำลองขนาดใหญ่ที่ได้รับการฝึกฝนบนชุดข้อมูลที่กว้างขวาง อย่างไรก็ตาม มีการเปลี่ยนแปลงที่โดดเด่นในช่วงไม่กี่ครั้งที่ผ่านมา โดยยักษ์ใหญ่ด้านเทคโนโลยีและสตาร์ทอัพหันมาให้ความสนใจกับซอฟต์แวร์ AI ที่มีความคล่องตัวและเฉพาะทางมากขึ้น ซึ่งมีราคาถูกกว่าและเร็วกว่า
โมเดลภาษาขนาดเล็กและขนาดกลางเหล่านี้ ออกแบบมาโดยเฉพาะสำหรับงานเฉพาะและฝึกฝนโดยใช้ข้อมูลน้อย ได้รับความนิยมอย่างมาก ต่างจากคู่แข่งรายใหญ่ตรงที่สามารถพัฒนาได้ด้วยต้นทุนต่ำกว่า 10 ล้านดอลลาร์ และใช้พารามิเตอร์น้อยกว่า 1 หมื่นล้านตัว สำหรับการเปรียบเทียบ OpenAI's GPT-4o หนึ่งในโมเดลที่ใหญ่ที่สุด ต้องใช้เงินกว่า 100 ล้านเหรียญสหรัฐในการสร้างและใช้พารามิเตอร์มากกว่าหนึ่งล้านล้านรายการ ขนาดที่เล็กกว่าของโมเดลเหล่านี้ส่งผลให้ความต้องการพลังงานในการคำนวณลดลงและราคาต่อการสืบค้นลดลง
ตัวอย่างเช่น Microsoft ได้ให้ความสำคัญกับโมเดลขนาดเล็กตระกูล Phi Satya Nadella ซีอีโอของ Microsoft อ้างว่าโมเดลเหล่านี้มีขนาด 1/100 ของโมเดลที่อยู่เบื้องหลัง ChatGPT ของ OpenAI แต่สามารถจัดการงานต่างๆ มากมายได้อย่างมีประสิทธิภาพที่เทียบเคียงได้ Yusuf Mehdi ประธานเจ้าหน้าที่ฝ่ายพาณิชย์ของ Microsoft ตอกย้ำความต้องการโมเดลที่แตกต่างกันสำหรับงานที่แตกต่างกัน โดยอ้างถึงต้นทุนที่สูงกว่าที่คาดไว้ที่เกี่ยวข้องกับการใช้งานโมเดลขนาดใหญ่ นอกจากนี้ Microsoft เพิ่งเปิดตัวแล็ปท็อป AI ที่ใช้โมเดล AI มากมายสำหรับการค้นหาและสร้างภาพ โมเดลเหล่านี้ทำงานบนอุปกรณ์เองโดยไม่ต้องอาศัยซูเปอร์คอมพิวเตอร์บนระบบคลาวด์ที่กว้างขวาง เช่นเดียวกับ ChatGPT
บริษัทอื่นๆ เช่น Google และสตาร์ทอัพ AI เช่น Mistral, Anthropic และ Cohere ก็ได้เปิดตัวโมเดลขนาดเล็กเช่นกัน นอกจากนี้ Apple ยังเปิดเผยแผนการบูรณาการโมเดลขนาดเล็กเพื่อเพิ่มความเร็วและความปลอดภัยของการทำงานของ AI บนโทรศัพท์
OpenAI ซึ่งมีชื่อเสียงในด้านการสนับสนุนโมเดลขนาดใหญ่ ได้เปิดตัวเวอร์ชันเรือธงที่มีราคาไม่แพงกว่า และตั้งใจที่จะมุ่งเน้นไปที่การพัฒนาโมเดลขนาดเล็กในอนาคต โมเดลขนาดใหญ่มีมากเกินไปสำหรับงานต่างๆ เช่น การสรุปเอกสารหรือการสร้างภาพ ซึ่งคล้ายกับการใช้ถังเพื่อไปซื้อของชำง่ายๆ ในทางกลับกัน โมเดลขนาดเล็กสามารถให้ประสิทธิภาพที่เทียบเคียงได้โดยมีต้นทุนที่ต่ำกว่ามาก โมเดลเหล่านี้มักได้รับการปรับแต่งสำหรับงานเฉพาะ เช่น การจัดการเอกสารทางกฎหมายหรือการสื่อสารภายใน Yoav Shoham จาก AI21 Labs ยืนยันว่าโมเดลขนาดเล็กมีความเป็นไปได้ทางเศรษฐกิจมากกว่าสำหรับการใช้งานอย่างแพร่หลาย โดยมีค่าใช้จ่ายเพียงเศษเสี้ยวของโมเดลขนาดใหญ่ที่จะนำมาซึ่งคำตอบสำหรับคำถามต่างๆ
ธุรกิจต่าง ๆ กำลังนำโมเดลขนาดเล็กเหล่านี้ไปใช้เพื่อเพิ่มประสิทธิภาพและลดต้นทุน ตัวอย่างเช่น Experian เปลี่ยนไปใช้แชทบอท AI รุ่นเล็กลง และได้รับประสิทธิภาพที่ใกล้เคียงกับรุ่นใหญ่แต่มีค่าใช้จ่ายลดลง Clara Shih จาก Salesforce เน้นย้ำถึงการใช้งานจริงของโมเดลขนาดเล็ก เนื่องจากโมเดลมักนำไปสู่ค่าใช้จ่ายที่มากเกินไปและปัญหาเรื่องเวลาในการตอบสนอง
นับตั้งแต่เปิดตัว GPT-4 โดย OpenAI ก็ไม่มีความก้าวหน้าที่สำคัญในการพัฒนาโมเดลขนาดใหญ่ ส่งผลให้ความคืบหน้าหยุดนิ่ง ด้วยเหตุนี้ จึงมีการเปลี่ยนเส้นทางความพยายามไปสู่การปรับปรุงประสิทธิภาพของโมเดลขนาดเล็ก Sébastien Bubeck จาก Microsoft สังเกตเห็นการหยุดชั่วคราวในการพัฒนาขนาดใหญ่ในปัจจุบัน และสนับสนุนความพยายามในการเพิ่มประสิทธิภาพ
แม้จะมีการเปลี่ยนแปลงนี้ โมเดลขนาดใหญ่ยังคงมีคุณค่าสำหรับงานขั้นสูง บริษัทต่างๆ เช่น Apple และ Microsoft ยังคงนำโมเดลขนาดใหญ่เช่น เป็น ChatGPT ในผลิตภัณฑ์ของตน แม้ว่าโดยทั่วไปแล้วการบูรณาการเหล่านี้เป็นเพียงเศษเสี้ยวของความคิดริเริ่มด้าน AI โดยรวมเท่านั้น ความก้าวหน้านี้บ่งบอกถึงการเปลี่ยนแปลงของ AI จากการสาธิตแห่งอนาคตไปสู่การโฆษณาที่ใช้งานได้จริง