Evoluution simulointi: Kuinka ESM3-kielimalli muuttaa proteiinin kehitystä

Evoluution simulointi: Kuinka ESM3-kielimalli muuttaa proteiinin kehitystä
5.11.2024

ESM3, entisten Meta-työntekijöiden perustaman yhdysvaltalaisen EvolutionaryScalen luoma uusi tekoäly (AI) voi suunnitella proteiineja, joilla on tietyt ominaisuudet, prosessi. jonka kehittyminen orgaanisella tavalla vie normaalisti satoja miljoonia vuosia. Yritys julkisti tämän generatiivisen naamioituneen kielimallin, joka on yksi suurimmista biologisista tekoälyistä tähän mennessä, äskettäisessä BioRxiv-julkaisussa. ESM3:n kyky tuottaa samanaikaisesti proteiinin aminohapposekvenssi, kolmiulotteinen rakenne ja toiminta vasteena tiettyihin signaaleihin on ainutlaatuinen ja avaa oven materiaalitutkimukseen, lääkekehityslääkkeisiin ja hiilivarastoproteiineihin.

Koska proteiinit ovat mikroskooppisia biokoneita, jotka ovat tärkeitä monille kehon prosesseille, mukaan lukien lihasten, hiusten ja kynsien muodostuminen sekä hormonien ja vasta-aineiden tuotanto, niiden kolmiulotteisella rakenteella on suuri biologinen ja farmakologinen merkitys. Proteiinien rakenteen tunteminen auttaa ymmärtämään niiden biologista toimintaa, arvioimaan niiden soveltuvuutta hoitokohteiksi ja määrittämään niiden tehokkuuden hoitona. Proteiinit ovat useiden hengenpelastuslääkkeiden rakennuspalikoita, mukaan lukien insuliini ja synteettiset vasta-aineet vakavia hengitystieinfektioita, kuten RSV:tä ja syöpää, vastaan. Luonnollisten varianttien vaivalloisen etsimisen sijaan lääketieteellisen tutkimuksen on yhä useammin tehtävä kokonaan uusia proteiineja, joilla on tietyt ominaisuudet.

Proteiinisynteesiä varten EvolutionaryScalen ESM3 käyttää piilotettua kielimallia, joka voi täyttää aukot eri luokissa tarkastelemalla kontekstia eri näkökulmista. Mallissa käytettiin erillistä aakkosta kullekin luokalle (sekvenssi, 3D-rakenne ja toiminto), ja sitä koulutettiin suurella tietojoukolla, joka sisälsi 2,8 miljardia aminohapposekvenssiä, 236 miljoonaa proteiinirakennetta ja 539 miljoonaa proteiinitoimintoa. Jotta malli voisi ymmärtää kontekstin sekä näiden monien kerrosten sisällä että niiden välillä, tiimi löysi tavan esittää jokainen 3D-rakenne sarjana hahmoja.

Startup antoi mallille haasteen luoda synteettisiä versioita vihreästä fluoresoivasta proteiinista (GFP), joka on vastuussa merellisten lajien, kuten korallien ja meduusojen, luonnollisesta valosta ESM3:n potentiaalin osoittamiseksi. GFP, joka voitti 2008 Nobelin kemian palkinnon, on olennainen proteiini molekyylibiologiassa, jonka avulla tutkijat voivat tunnistaa ja seurata elävien solujen komponentteja. Vaikka sillä oli vain 58 % geneettinen samankaltaisuus luonnolliseen vastineeseensa, "esmGFP", ESM3:n tuottama GFP:n hienoin synteettinen variantti, oli korkealla kirkkaudella verrattavissa luonnolliseen GFP:hen. Tutkijoiden mukaan tämän uuden fluoresoivan proteiinin luominen vastaisi yli 500 miljoonan vuoden evoluution matkimista.

EvolutionaryScalen päätutkija Alex Rives oli mukana aiemmissa ESM-mallin iteraatioissa Metassa. Tiimi päätti jatkaa tätä tutkimusta yksin, kun Meta lopetti työskentelyn tällä alalla viime vuonna. Tämän seurauksena fluoresoiva proteiini on juuri julkistettu ja 142 miljoonaa dollaria on investoitu näiden edistysten kaupallistamiseen. Pienempi, avoimen pääsyn versio EvolutionaryScalesta on myös tuotu tieteelliseen tutkimukseen, mutta se ei ole täysin toimiva. Martin Pacesa Ecole Polytechnique Fédérale de Lausannesta mainitsi haastattelussa innostuessaan testaamaan mallia, että se vaatisi paljon laskentatehoa täysversion toistamiseen.

Pysy ajan tasalla uusimmista tekniikasta ja innovaatioista päivitysten avulla Code Labs Academy](https://codelabsacademy.com/).

Code Labs Academy © 2025 Kaikki oikeudet pidätetään.