Simulazione dell'evoluzione: come il modello linguistico ESM3 trasforma lo sviluppo delle proteine

Simulazione dell'evoluzione: come il modello linguistico ESM3 trasforma lo sviluppo delle proteine
5 novembre 2024

ESM3, una nuova intelligenza artificiale (AI) creata da EvolutionaryScale, una società statunitense fondata da ex lavoratori di Meta, può progettare proteine ​​con proprietà specifiche, un processo che normalmente richiederebbero centinaia di milioni di anni per evolversi in modo organico. L’azienda ha svelato questo modello generativo di linguaggio mascherato, una delle più grandi IA biologiche fino ad oggi, in una recente prestampa su BioRxiv. La capacità di ESM3 di produrre simultaneamente la sequenza amminoacidica, la struttura tridimensionale e la funzione di una proteina in risposta a particolari segnali è unica e apre le porte a usi nella ricerca sui materiali, nello sviluppo di farmaci e nelle proteine ​​di stoccaggio del carbonio.

Poiché le proteine ​​sono biomacchine microscopiche vitali per molti processi corporei, tra cui la formazione di muscoli, capelli e unghie, nonché la produzione di ormoni e anticorpi, la loro struttura tridimensionale è di grande importanza biologica e farmacologica. Conoscere la struttura delle proteine ​​aiuta a comprenderne la funzione biologica, a valutarne l’idoneità come bersagli terapeutici e a determinarne l’efficacia come trattamenti. Le proteine ​​sono gli elementi costitutivi di numerosi farmaci salvavita, tra cui l’insulina e gli anticorpi sintetici contro gravi infezioni respiratorie come l’RSV e il cancro. Invece di cercare faticosamente varianti naturali, la ricerca medica ha sempre più bisogno di produrre proteine ​​completamente nuove con determinate caratteristiche.

Per la sintesi proteica, ESM3 di EvolutionaryScale utilizza un modello di linguaggio nascosto in grado di colmare le lacune in varie categorie guardando il contesto da diverse angolazioni. Il modello ha utilizzato un alfabeto separato per ciascuna categoria (sequenza, struttura e funzione 3D) ed è stato addestrato su un ampio set di dati che includeva 2,8 miliardi di sequenze di amminoacidi, 236 milioni di strutture proteiche e 539 milioni di funzioni proteiche. Per consentire al modello di comprendere il contesto sia all'interno che attraverso questi numerosi strati, il team ha trovato un modo per rappresentare ciascuna struttura 3D come una serie di personaggi.

La startup ha affidato al modello la sfida di creare versioni sintetiche della proteina fluorescente verde (GFP), responsabile della luce naturale nelle specie marine come coralli e meduse, per dimostrare il potenziale dell’ESM3. La GFP, che ha vinto il Premio Nobel per la Chimica nel 2008, è una proteina essenziale nella biologia molecolare che consente agli scienziati di identificare e monitorare i componenti delle cellule viventi. Sebbene avesse una somiglianza genetica solo del 58% con la sua controparte naturale, “esmGFP”, la variante sintetica più raffinata della GFP prodotta da ESM3, aveva un’elevata luminosità paragonabile a quella della GFP naturale. Secondo i ricercatori, creare questa nuova proteina fluorescente equivarrebbe a imitare più di 500 milioni di anni di evoluzione.

Lo scienziato capo di EvolutionaryScale Alex Rives è stato coinvolto nelle precedenti iterazioni del modello ESM presso Meta. Il team ha deciso di continuare questo studio da solo dopo che Meta ha smesso di lavorare in questo settore lo scorso anno. Di conseguenza, la proteina fluorescente è stata appena annunciata e sono stati investiti 142 milioni di dollari per commercializzare questi progressi. Per la ricerca scientifica è stata resa disponibile anche una versione più piccola e ad accesso aperto di EvolutionaryScale, ma non è completamente funzionante. Sebbene fosse entusiasta di testare il modello, Martin Pacesa dell'Ecole Polytechnique Fédérale de Lausanne menzionato in un'intervista ha affermato che ci sarebbe voluto un molta potenza di calcolo per riprodurre la versione completa.

Rimani aggiornato sulleultime novità in fatto di tecnologia e innovazione con gli aggiornamenti daCode Labs Academy.

Code Labs Academy © 2024 Tutti i diritti riservati.