Evolutie simuleren: hoe het ESM3-taalmodel de eiwitontwikkeling transformeert

Evolutie simuleren: hoe het ESM3-taalmodel de eiwitontwikkeling transformeert
5 november 2024

ESM3, een nieuwe kunstmatige intelligentie (AI) gecreëerd door EvolutionaryScale, een Amerikaans bedrijf opgericht door voormalige Meta-arbeiders, kan eiwitten ontwerpen met gespecificeerde eigenschappen, een proces dat normaal gesproken honderden miljoenen jaren zou duren om op een organische manier te evolueren. Het bedrijf onthulde dit generatieve gemaskeerde taalmodel, een van de grootste biologische AI’s tot nu toe, in een recente preprint op BioRxiv. Het vermogen van ESM3 om tegelijkertijd de aminozuursequentie, de driedimensionale structuur en de functie van een eiwit te produceren als reactie op bepaalde signalen is uniek en opent de deur naar toepassingen in materiaalonderzoek, geneesmiddelenontwikkeling en koolstofopslageiwitten.

Omdat eiwitten microscopische biomachines zijn die essentieel zijn voor veel lichaamsprocessen, waaronder de vorming van spieren, haar en nagels en de productie van hormonen en antilichamen, is hun driedimensionale structuur van groot biologisch en farmacologisch belang. Het kennen van de structuur van eiwitten helpt om hun biologische functie te begrijpen, hun geschiktheid als therapeutische doelen te evalueren en hun effectiviteit als behandelingen te bepalen. Eiwitten zijn de bouwstenen van verschillende levensreddende medicijnen, waaronder insuline en synthetische antilichamen tegen ernstige luchtweginfecties zoals RSV en kanker. In plaats van moeizaam te zoeken naar natuurlijke varianten, moet medisch onderzoek steeds vaker geheel nieuwe eiwitten met bepaalde eigenschappen maken.

Voor de eiwitsynthese gebruikt ESM3 van EvolutionaryScale een verborgen taalmodel dat de gaten in verschillende categorieën kan opvullen door vanuit verschillende invalshoeken naar de context te kijken. Het model gebruikte voor elke categorie (sequentie, 3D-structuur en functie) een apart alfabet en werd getraind op een grote dataset met 2,8 miljard aminozuursequenties, 236 miljoen eiwitstructuren en 539 miljoen eiwitfuncties. Om het model in staat te stellen de context zowel binnen als tussen deze vele lagen te begrijpen, vond het team een ​​manier om elke 3D-structuur weer te geven als een reeks karakters.

De startup gaf het model de uitdaging om synthetische versies te maken van groen fluorescerend eiwit (GFP), verantwoordelijk voor het natuurlijk voorkomende licht in mariene soorten zoals koralen en kwallen, om het potentieel van ESM3 aan te tonen. GFP, dat in 2008 de Nobelprijs voor de Scheikunde won, is een essentieel eiwit in de moleculaire biologie waarmee wetenschappers componenten van levende cellen kunnen identificeren en volgen. Hoewel het slechts 58% genetische gelijkenis vertoonde met zijn natuurlijke tegenhanger, had ‘esmGFP’, de beste synthetische variant van GFP geproduceerd door ESM3, een hoge helderheid vergelijkbaar met die van natuurlijk GFP. Volgens de onderzoekers zou het creëren van dit nieuwe fluorescerende eiwit gelijk staan ​​aan het nabootsen van meer dan 500 miljoen jaar evolutie.

EvolutionaryScale hoofdwetenschapper Alex Rives was betrokken bij eerdere iteraties van het ESM-model bij Meta. Het team besloot dit onderzoek alleen voort te zetten nadat Meta vorig jaar stopte met werken op dit gebied. Als gevolg hiervan is het fluorescerende eiwit zojuist aangekondigd en is er 142 miljoen dollar geïnvesteerd om deze vooruitgang te commercialiseren. Er is ook een kleinere, open access versie van EvolutionaryScale beschikbaar gesteld voor wetenschappelijk onderzoek, maar deze is niet volledig functioneel. Terwijl hij opgewonden was om het model te testen, zei Martin Pacesa van de Ecole Polytechnique Fédérale de Lausanne vermeld in een interview dat het een tijdje zou duren veel rekenkracht om de volledige versie te reproduceren.

Blijf op de hoogte van denieuwste technologie en innovatie met updates vanCode Labs Academy.

Code Labs Academy © 2024 Alle rechten voorbehouden.