A kis mesterséges intelligencia modellek nagy előnyei a technológiai óriások számára

A kis mesterséges intelligencia modellek nagy előnyei a technológiai óriások számára

Az emberi intelligencia reprodukálására törekedve a mesterséges intelligencia fegyverkezési versenyének középpontjában kezdetben a kiterjedt adatkészleteken kiképzett hatalmas modellek létrehozása állt. Az utóbbi időben azonban jelentős elmozdulás történt, a technológiai óriáscégek és a startupok egyre inkább az egyszerűbb és speciálisabb, olcsóbb és gyorsabb mesterségesintelligencia-szoftverek felé irányítják figyelmüket.

Ezek a kisebb és közepes méretű nyelvi modellek, amelyeket kifejezetten speciális feladatokra terveztek és kevesebb adattal képeztek, jelentős népszerűségre tettek szert. Nagyobb társaikkal ellentétben 10 millió dollár alatti költséggel fejleszthetők, és kevesebb mint 10 milliárd paramétert alkalmaznak. Összehasonlításképpen: OpenAI GPT-4o, az egyik legnagyobb modell, több mint 100 millió dollárt igényelt a megalkotásához, és több mint egy billió paramétert használt. Ezeknek a modelleknek a kisebb mérete alacsonyabb számítási teljesítményigényt és lekérdezésenkénti árakat jelent.

A Microsoft például a kis modellek Phi családjára helyezte a hangsúlyt. Satya Nadella, a Microsoft vezérigazgatója azt állítja, hogy ezek a modellek az OpenAI ChatGPT mögötti modellek méretének 1/100-át teszik ki, mégis sok feladatot hasonló hatékonysággal tudnak kezelni. Yusuf Mehdi, a Microsoft kereskedelmi igazgatója megerősíti, hogy a különböző feladatokhoz külön modellekre van szükség, hivatkozva a vártnál magasabb költségekre, amelyek a nagy modellek üzemeltetésével kapcsolatosak. Ezenkívül a Microsoft a közelmúltban bemutatta az AI laptopokat, amelyek számos mesterséges intelligencia-modellt használnak kereséshez és képgeneráláshoz. Ezek a modellek magán az eszközön működnek anélkül, hogy kiterjedt felhőalapú szuperszámítógépekre támaszkodnának, ahogyan az a ChatGPT esetében is történik.

Más vállalatok, például a Google és az AI startupok, mint például a Mistral, az Anthropic és a Cohere szintén kiadtak kisebb modelleket. Ezenkívül az Apple bemutatta a kis modellek integrálásának terveit a telefonokon végzett mesterséges intelligencia-műveletek sebességének és biztonságának növelése érdekében.

Az OpenAI, amely a nagy modellek támogatója, piacra dobta zászlóshajójának megfizethetőbb változatát, és a jövőben kisebb modellek fejlesztésére kíván összpontosítani. A nagy modellek túlzónak bizonyulnak az olyan feladatokhoz, mint a dokumentumok összegzése vagy a képek generálása, hasonlóan ahhoz, mintha egy tartályt használnának egy egyszerű bevásárláshoz. A kisebb modellek viszont lényegesen alacsonyabb költségek mellett, összehasonlítható teljesítményt nyújtanak. Ezeket a modelleket gyakran olyan konkrét feladatokra szabják, mint a jogi dokumentumok vagy a belső kommunikáció kezelése. Yoav Shoham, az AI21 Labs munkatársa azt állítja, hogy a kis modellek gazdaságosabbak a széles körű használathoz, mivel a nagy modellek csak töredékébe kerülnek, miközben választ adnak a kérdésekre.

A vállalkozások azonnal alkalmazzák ezeket a kisebb modelleket a hatékonyság növelése és a költségek csökkentése érdekében. Például az Experian áttért a kisebb modellekre az AI chatbotjaihoz, és hasonló teljesítményt ért el a nagyobb modellekhez, de alacsonyabb költséggel. A Salesforce Clara Shih a kisebb modellek praktikusságát emeli ki, mivel a modellek gyakran túlzott kiadásokhoz és késleltetési problémákhoz vezetnek.

A GPT-4 OpenAI általi kiadása óta nem történt jelentős előrelépés a nagy modellek fejlesztésében, ami a fejlődés stagnálását eredményezte. Következésképpen az erőfeszítések a kisebb modellek hatékonyságának javítására irányultak. Sébastien Bubeck, a Microsoft munkatársa azt tapasztalja, hogy a nagy fejlesztések jelenleg szünetelnek, és a hatékonyság növelésére irányuló törekvéseket bátorítja.

E változás ellenére a nagy modellek továbbra is értékesek a fejlett feladatokhoz. Az olyan cégek, mint az Apple és a Microsoft továbbra is beépítenek olyan nagy modelleket, mint pl. ChatGPT-ként a termékeikbe, bár ezek az integrációk általában csak töredékét képviselik az AI-kezdeményezéseiknek. Ez a fejlődés az AI átalakulását jelenti a futurisztikus bemutatókból a gyakorlati reklámokká.

Code Labs Academy © 2025 Minden jog fenntartva.