Мадэляванне эвалюцыі: як моўная мадэль ESM3 трансфармуе развіццё бялку

Мадэляванне эвалюцыі: як моўная мадэль ESM3 трансфармуе развіццё бялку
5 лістапада 2024 г

ESM3, новы штучны інтэлект (AI), створаны амерыканскай кампаніяй EvolutionaryScale, заснаванай былымі супрацоўнікамі Meta, можа распрацоўваць бялкі з зададзенымі ўласцівасцямі, працэс для арганічнага развіцця якіх звычайна патрэбныя сотні мільёнаў гадоў. Кампанія прадставіла гэтую мадэль генератыўнай маскіраванай мовы, адзін з найбуйнейшых на сённяшні дзень біялагічных ІІ, у нядаўнім прэпрынце на BioRxiv. Здольнасць ESM3 адначасова вырабляць амінакіслотную паслядоўнасць, трохмерную структуру і функцыі бялку ў адказ на пэўныя сігналы з'яўляецца унікальнай і адкрывае магчымасці для выкарыстання ў даследаваннях матэрыялаў, распрацоўцы лекаў і вавёрках, якія захоўваюць вуглярод.

Паколькі вавёркі з'яўляюцца мікраскапічнымі біямашынамі, жыццёва важнымі для многіх працэсаў у арганізме, уключаючы фарміраванне цягліц, валасоў і пазногцяў, а таксама выпрацоўку гармонаў і антыцелаў, іх трохмерная структура мае вялікае біялагічнае і фармакалагічнае значэнне. Веданне структуры бялкоў дапамагае зразумець іх біялагічную функцыю, ацаніць іх прыдатнасць у якасці тэрапеўтычных мішэняў і вызначыць іх эфектыўнасць у якасці метадаў лячэння. Вавёркі з'яўляюцца будаўнічым матэрыялам для некалькіх жыццёва важных лекаў, у тым ліку інсуліну і сінтэтычных антыцелаў супраць сур'ёзных рэспіраторных інфекцый, такіх як RSV і рак. Замест карпатлівага пошуку натуральных варыянтаў, медыцынскія даследаванні ўсё часцей маюць патрэбу ў стварэнні цалкам новых бялкоў з пэўнымі характарыстыкамі.

Для сінтэзу бялку ESM3 EvolutionaryScale выкарыстоўвае мадэль схаванай мовы, якая можа запоўніць прабелы ў розных катэгорыях, разглядаючы кантэкст з розных бакоў. Мадэль выкарыстоўвала асобны алфавіт для кожнай катэгорыі (паслядоўнасць, 3D-структура і функцыя) і была навучана на вялікім наборы даных, уключаючы 2,8 мільярда амінакіслотных паслядоўнасцяў, 236 мільёнаў бялковых структур і 539 мільёнаў бялковых функцый. Каб даць магчымасць мадэлі разумець кантэкст як унутры гэтых шматлікіх слаёў, так і паміж імі, каманда знайшла спосаб прадставіць кожную трохмерную структуру ў выглядзе серыі сімвалаў.

Стартап даручыў мадэлі стварыць сінтэтычныя версіі зялёнага флуарэсцэнтнага бялку (GFP), які адказвае за натуральнае святло ў марскіх відаў, такіх як каралы і медузы, каб прадэманстраваць патэнцыял ESM3. GFP, які атрымаў Нобелеўскую прэмію па хіміі ў 2008 годзе, з'яўляецца важным бялком у малекулярнай біялогіі, які дазваляе навукоўцам ідэнтыфікаваць і адсочваць кампаненты жывых клетак. Нягледзячы на ​​тое, што ён меў толькі 58% генетычнага падабенства са сваім натуральным аналагам, «esmGFP», найлепшы сінтэтычны варыянт GFP, выраблены ESM3, меў высокую яркасць, параўнальную з яркасцю натуральнага GFP. Па словах даследчыкаў, стварэнне гэтага новага флуарэсцэнтнага бялку было б эквівалентна імітацыі больш чым 500 мільёнаў гадоў эвалюцыі.

Галоўны навуковы супрацоўнік EvolutionaryScale Алекс Рыўз удзельнічаў у папярэдніх ітэрацыях мадэлі ESM у Meta. Каманда вырашыла працягнуць гэта даследаванне ў адзіночку пасля таго, як Meta спыніла працу ў гэтай галіне ў мінулым годзе. У выніку толькі што быў абвешчаны флуарэсцэнтны бялок, і ў камерцыялізацыю гэтых дасягненняў было ўкладзена 142 мільёны долараў. Меншая версія EvolutionaryScale з адкрытым доступам таксама была даступная для навуковых даследаванняў, але яна не цалкам функцыянальная. У той час як ён быў рады выпрабаваць мадэль, Марцін Пачэза з Федэральнай палітэхнічнай школы Лазаны згадаў у інтэрв'ю, што гэта зойме шмат вылічальнай магутнасці для прайгравання поўнай версіі.

Будзьце ў курсе найноўшых тэхналогій і інавацый з абнаўленнямі адCode Labs Academy.

Code Labs Academy © 2024 Усе правы абароненыя.