Simulacija evolucije: kako jezikovni model ESM3 spremeni razvoj beljakovin

Simulacija evolucije: kako jezikovni model ESM3 spremeni razvoj beljakovin
5. november 2024

ESM3, nova umetna inteligenca (AI), ki jo je ustvarilo EvolutionaryScale, ameriško podjetje, ki so ga ustanovili nekdanji delavci Mete, lahko oblikuje beljakovine z določenimi lastnostmi, proces ki bi običajno trajalo na stotine milijonov let, da bi se razvilo na organski način. Podjetje je razkrilo ta generativni maskirani jezikovni model, enega največjih bioloških AI do danes, v nedavnem prednatisu na BioRxiv. Sposobnost ESM3, da istočasno proizvaja aminokislinsko zaporedje, tridimenzionalno strukturo in funkcijo proteina kot odgovor na določene signale, je edinstvena in odpira vrata za uporabo v raziskavah materialov, zdravilih za razvoj zdravil in proteinih za shranjevanje ogljika.

Ker so beljakovine mikroskopski biostroji, bistveni za številne telesne procese, vključno z tvorbo mišic, las in nohtov ter proizvodnjo hormonov in protiteles, je njihova tridimenzionalna struktura velikega biološkega in farmakološkega pomena. Poznavanje strukture beljakovin pomaga razumeti njihovo biološko funkcijo, oceniti njihovo primernost kot terapevtske tarče in določiti njihovo učinkovitost kot zdravljenje. Beljakovine so gradniki številnih zdravil, ki rešujejo življenja, vključno z insulinom in sintetičnimi protitelesi proti resnim okužbam dihal, kot sta RSV in rak. Namesto mukotrpnega iskanja naravnih variant morajo medicinske raziskave vedno bolj izdelovati popolnoma nove beljakovine z določenimi značilnostmi.

Za sintezo beljakovin ESM3 EvolutionaryScale uporablja skriti jezikovni model, ki lahko zapolni vrzeli v različnih kategorijah tako, da gleda na kontekst iz različnih zornih kotov. Model je uporabljal ločeno abecedo za vsako kategorijo (zaporedje, 3D struktura in funkcija) in je bil usposobljen na velikem naboru podatkov, vključno z 2,8 milijarde aminokislinskih zaporedij, 236 milijonov beljakovinskih struktur in 539 milijonov proteinskih funkcij. Da bi modelu omogočili razumevanje konteksta znotraj in prek teh številnih plasti, je ekipa našla način za predstavitev vsake 3D-strukture kot serije znakov.

Startup je modelu zadolžil izziv ustvarjanja sintetičnih različic zelenega fluorescenčnega proteina (GFP), odgovornega za naravno prisotno svetlobo v morskih vrstah, kot so korale in meduze, da bi prikazali potencial ESM3. GFP, ki je leta 2008 prejel Nobelovo nagrado za kemijo, je bistvena beljakovina v molekularni biologiji, ki znanstvenikom omogoča prepoznavanje in sledenje komponent živih celic. Čeprav je imel le 58-odstotno genetsko podobnost z naravnim primerkom, je imel "esmGFP", najboljša sintetična različica GFP, ki jo proizvaja ESM3, visoko svetlost, primerljivo z naravno GFP. Po mnenju raziskovalcev bi bilo ustvarjanje tega novega fluorescenčnega proteina enakovredno posnemanju več kot 500 milijonov let evolucije.

Glavni znanstvenik EvolutionaryScale Alex Rives je sodeloval pri prejšnjih iteracijah modela ESM pri Meti. Ekipa se je odločila nadaljevati to študijo sama, potem ko je Meta lani prenehala delati na tem področju. Posledično je bil pravkar objavljen fluorescentni protein in 142 milijonov dolarjev je bilo vloženih v komercializacijo teh napredkov. Za znanstvene raziskave je bila na voljo tudi manjša različica EvolutionaryScale z odprtim dostopom, vendar ni popolnoma funkcionalna. Medtem ko je bil navdušen nad preizkušanjem modela, je Martin Pacesa iz Ecole Polytechnique Fédérale de Lausanne v intervjuju omenil, da bo potrebno veliko računalniške moči za reprodukcijo polne različice.

Ostanite na tekočem z najnovejšo tehnologijo in inovacijami s posodobitvami izCode Labs Academy.

Code Labs Academy © 2024 Vse pravice pridržane.