Evoliucijos modeliavimas: kaip ESM3 kalbos modelis transformuoja baltymų vystymąsi

Evoliucijos modeliavimas: kaip ESM3 kalbos modelis transformuoja baltymų vystymąsi
2024 m. lapkričio 5 d

ESM3, naujas dirbtinis intelektas (AI), sukurtas JAV bendrovės EvolutionaryScale, kurią įkūrė buvę Meta darbuotojai, gali sukurti baltymus su nurodytomis savybėmis, procesą. kuris paprastai užtruktų šimtus milijonų metų, kad išsivystytų organiniu būdu. Bendrovė pristatė šį generatyvų užmaskuotos kalbos modelį, vieną didžiausių iki šiol biologinių AI, neseniai išspausdintame BioRxiv. ESM3 gebėjimas vienu metu gaminti aminorūgščių seką, trimatę struktūrą ir baltymo funkciją, reaguojant į konkrečius signalus, yra unikalus ir atveria galimybes naudoti medžiagų tyrimuose, vaistų kūrimo vaistams ir anglies kaupimo baltymams.

Kadangi baltymai yra mikroskopinės biomašinos, gyvybiškai svarbios daugeliui kūno procesų, įskaitant raumenų, plaukų ir nagų formavimąsi, taip pat hormonų ir antikūnų gamybą, jų trimatė struktūra turi didelę biologinę ir farmakologinę reikšmę. Baltymų struktūros žinojimas padeda suprasti jų biologinę funkciją, įvertinti jų tinkamumą terapiniams tikslams ir nustatyti jų kaip gydymo efektyvumą. Baltymai yra kelių gyvybę gelbstinčių vaistų, įskaitant insuliną ir sintetinius antikūnus prieš sunkias kvėpavimo takų infekcijas, tokias kaip RSV ir vėžys, sudedamosios dalys. Užuot sunkiai ieškoję natūralių variantų, medicininiams tyrimams vis dažniau reikia sukurti visiškai naujus baltymus su tam tikromis savybėmis.

Baltymų sintezei EvolutionaryScale ESM3 naudoja paslėptą kalbos modelį, kuris gali užpildyti įvairių kategorijų spragas žiūrint į kontekstą iš skirtingų kampų. Modelis naudojo atskirą abėcėlę kiekvienai kategorijai (sekai, 3D struktūrai ir funkcijai) ir buvo apmokytas naudojant didelį duomenų rinkinį, apimantį 2,8 milijardo aminorūgščių sekų, 236 milijonus baltymų struktūrų ir 539 milijonus baltymų funkcijų. Kad modelis galėtų suprasti kontekstą tiek šiuose sluoksniuose, tiek tarp jų, komanda rado būdą, kaip kiekvieną 3D struktūrą pavaizduoti kaip simbolių seriją.

Startuolis pavedė modeliui sukurti sintetines žalio fluorescencinio baltymo (GFP), atsakingo už natūraliai jūros rūšių, pavyzdžiui, koralų ir medūzų, šviesą, versijas, kad būtų parodytas ESM3 potencialas. GFP, 2008 m. apdovanotas Nobelio chemijos premija, yra esminis molekulinės biologijos baltymas, leidžiantis mokslininkams identifikuoti ir sekti gyvų ląstelių komponentus. Nors jis turėjo tik 58% genetinį panašumą į savo natūralų atitikmenį, „esmGFP“, geriausias sintetinis ESM3 pagamintas GFP variantas, turėjo didelį ryškumą, palyginus su natūralaus GFP. Pasak mokslininkų, šio naujo fluorescencinio baltymo sukūrimas prilygtų daugiau nei 500 milijonų metų evoliucijos imitacijai.

„EvolutionaryScale“ vyriausiasis mokslininkas Alexas Rivesas dalyvavo ankstesnėse ESM modelio iteracijose „Meta“. Tęsti šį tyrimą komanda nusprendė viena po to, kai Meta pernai nustojo dirbti šioje srityje. Dėl to ką tik buvo paskelbta apie fluorescencinį baltymą ir investuota 142 mln. Mažesnė atviros prieigos EvolutionaryScale versija taip pat buvo prieinama moksliniams tyrimams, tačiau ji nėra visiškai funkcionali. Nors jam buvo įdomu išbandyti modelį, Martinas Pacesa iš Ecole Polytechnique Fédérale de Lausanne minėjo interviu, kad tam prireiks daug skaičiavimo galios atkurti visą versiją.

Code Labs Academy © 2024 Visos teisės saugomos.