Az evolúció szimulálása: Hogyan alakítja át az ESM3 nyelvi modell a fehérjefejlődést

Az evolúció szimulálása: Hogyan alakítja át az ESM3 nyelvi modell a fehérjefejlődést
2024. november 5

Az ESM3, egy új mesterséges intelligencia (AI), amelyet az EvolutionaryScale, a korábbi Meta-munkások által alapított amerikai cég hozott létre, meghatározott tulajdonságokkal rendelkező fehérjék tervezésére, egy folyamatra aminek rendszerint több száz millió évre lenne szüksége ahhoz, hogy szerves módon fejlődjön ki. A vállalat a BioRxiv legújabb preprintjében mutatta be ezt a generatív maszkolt nyelvi modellt, amely az egyik legnagyobb biológiai mesterséges intelligencia az eddigieknél. Az ESM3 azon képessége, hogy egyidejűleg állítsa elő egy fehérje aminosavszekvenciáját, háromdimenziós szerkezetét és funkcióját adott jelekre adott válaszként, egyedülálló, és megnyitja az ajtót az anyagkutatásban, a gyógyszerfejlesztési gyógyszerekben és a széntároló fehérjékben való felhasználás előtt.

Mivel a fehérjék mikroszkopikus biogépek, amelyek létfontosságúak számos testi folyamathoz, beleértve az izmok, haj és köröm képződését, valamint hormonok és antitestek termelését, háromdimenziós szerkezetük nagy biológiai és farmakológiai jelentőséggel bír. A fehérjék szerkezetének ismerete segít megérteni biológiai funkciójukat, értékelni terápiás célpontként való alkalmazhatóságukat, és meghatározni kezelési hatékonyságukat. A fehérjék számos életmentő gyógyszer építőkövei, beleértve az inzulint és a súlyos légúti fertőzések, például az RSV és a rák elleni szintetikus antitesteket. A természetes változatok fáradságos keresése helyett az orvosi kutatásnak egyre inkább teljesen új, bizonyos tulajdonságokkal rendelkező fehérjéket kell előállítania.

A fehérjeszintézishez az EvolutionaryScale ESM3 rejtett nyelvi modellt használ, amely képes pótolni a különböző kategóriákban lévő hiányosságokat, ha a kontextust különböző szemszögből nézi. A modell minden kategóriához (szekvencia, 3D szerkezet és funkció) külön ábécét használt, és egy nagy adathalmazra képezték ki, amely 2,8 milliárd aminosavszekvenciát, 236 millió fehérjeszerkezetet és 539 millió fehérjefunkciót tartalmazott. Annak érdekében, hogy a modell megértse a kontextust ezen a sok rétegen belül és azon belül is, a csapat megtalálta a módját, hogy az egyes 3D-s szerkezeteket karakterek sorozataként ábrázolják.

A startup azzal a kihívással bízta meg a modellt, hogy a zöld fluoreszcens fehérje (GFP) szintetikus változatát hozza létre, amely a tengeri fajok, például a korallok és a medúza természetes fényéért felelős, hogy bemutassa az ESM3 potenciálját. A GFP, amely 2008-ban elnyerte a kémiai Nobel-díjat, a molekuláris biológiában nélkülözhetetlen fehérje, amely lehetővé teszi a tudósok számára az élő sejtek összetevőinek azonosítását és nyomon követését. Bár csak 58%-ban hasonlított genetikailag természetes megfelelőjéhez, az „esmGFP”, az ESM3 által előállított GFP legfinomabb szintetikus változata, a természetes GFP-hez hasonló nagy fényerővel rendelkezik. A kutatók szerint ennek az új fluoreszcens fehérjének a létrehozása több mint 500 millió éves evolúció utánzásával egyenértékű lenne.

Alex Rives, az EvolutionaryScale vezető tudósa részt vett az ESM modell korábbi iterációiban a Metánál. A csapat úgy döntött, hogy egyedül folytatja ezt a tanulmányt, miután Meta tavaly abbahagyta ezen a területen. Ennek eredményeként a fluoreszcens fehérjét nemrég jelentették be, és 142 millió dollárt fektettek be ezen fejlesztések kereskedelmi forgalomba hozatalába. Az EvolutionaryScale egy kisebb, nyílt hozzáférésű változatát is elérhetővé tették tudományos kutatások számára, de az nem teljesen működőképes. Miközben izgatottan várta a modell tesztelését, Martin Pacesa, az Ecole Polytechnique Fédérale de Lausanne munkatársa egy interjúban megemlítette, hogy ehhez egy sok számítási teljesítmény a teljes verzió reprodukálásához.

Code Labs Academy © 2025 Minden jog fenntartva.