Eboluzioa simulatzea: nola ESM3 hizkuntza ereduak proteinen garapena eraldatzen duen

Eboluzioa simulatzea: nola ESM3 hizkuntza ereduak proteinen garapena eraldatzen duen
2024ko azaroaren 5a

ESM3, EvolutionaryScale-k sortutako adimen artifizial (AI) berri batek, Meta langile ohiek sortutako AEBetako konpainiak, propietate zehatzak dituzten proteinak diseina ditzake, prozesu bat. normalean ehunka milioi urte beharko lirateke modu organikoan eboluzionatzeko. Konpainiak hizkuntza maskaradun eredu sortzaile hau, orain arteko AI biologiko handienetako bat, aurkeztu zuen BioRxiv-en azken aurreinprimaketa. ESM3-k aldi berean ekoizteko aminoazidoen sekuentzia, hiru dimentsioko egitura eta proteina baten funtzioa seinale jakin batzuei erantzuteko gaitasuna berezia da eta ateak zabaltzen ditu materialen ikerketan, drogak garatzeko botiketan eta karbono biltegiratzeko proteinen erabileretarako.

Proteinak gorputzeko prozesu askotan ezinbestekoak diren biomakina mikroskopikoak direnez, muskuluak, ilea eta azazkalak sortzeko, baita hormonak eta antigorputzak sortzeko ere, haien hiru dimentsioko egiturak garrantzi biologiko eta farmakologiko handia du. Proteinen egitura ezagutzeak haien funtzio biologikoa ulertzen laguntzen du, helburu terapeutiko gisa duten hautagarritasuna ebaluatzen eta tratamendu gisa duten eraginkortasuna zehazten laguntzen du. Proteinak bizitzak salbatzen dituzten hainbat sendagairen oinarriak dira, intsulina eta antigorputz sintetikoak barne, RSV eta minbizia bezalako arnas infekzio larrien aurka. Aldaera naturalak neketsu bilatu beharrean, ikerketa medikoak gero eta gehiago behar ditu ezaugarri jakin batzuk dituzten proteina guztiz berriak egin.

Proteinen sintesirako, EvolutionaryScale-ren ESM3-k ezkutuko hizkuntza-eredu bat erabiltzen du, hainbat kategoriatako hutsuneak bete ditzakeena testuingurua angelu ezberdinetatik begiratuz. Ereduak alfabeto bereizi bat erabili zuen kategoria bakoitzeko (sekuentzia, 3D egitura eta funtzioa) eta datu multzo handi batean trebatu zen, 2.800 milioi aminoazido sekuentzia, 236 milioi proteina egitura eta 539 milioi proteina funtzio barne. Ereduari testuingurua uler dezan geruza askoren barruan zein zeharka, taldeak 3D egitura bakoitza pertsonaia sorta gisa irudikatzeko modu bat aurkitu zuen.

Startup-ek proteina fluoreszente berdearen (GFP) bertsio sintetikoak sortzeko erronka jarri zion ereduari, koralak eta medusak bezalako itsas espezieetan sortzen den argi naturalaren arduraduna, ESM3ren potentziala frogatzeko. GFP, 2008ko Kimikako Nobel Saria irabazi zuena, biologia molekularrean funtsezko proteina bat da, zientzialariei zelula bizien osagaiak identifikatu eta jarraitzeko aukera ematen diena. Bere pareko naturalarekin % 58ko antza genetikoa besterik ez bazuen ere, "esmGFP", ESM3k ekoitzitako GFP-ren aldaera sintetikorik onenetakoak, GFP naturalaren pareko distira handia zuen. Ikertzaileen arabera, proteina fluoreszente berri hau sortzea 500 milioi urte baino gehiagoko eboluzioa imitatzearen parekoa izango litzateke.

EvolutionaryScale zientzialari burua Alex Rives ESM ereduaren aurreko iterazioetan parte hartu zuen Meta-n. Taldeak azterketa honekin bakarrik jarraitzea erabaki zuen iaz Metak arlo horretan lan egiteari utzi ostean. Ondorioz, proteina fluoreszentea iragarri berri da eta 142 milioi dolar inbertitu dira aurrerapen horiek merkaturatzeko. EvolutionaryScale-ren sarbide irekiko bertsio txikiago bat ere eskuragarri jarri da ikerketa zientifikorako, baina ez da guztiz funtzionala. Eredua probatzeko ilusioz zegoen bitartean, Lausanneko Ecole Polytechnique Fédérale de Martin Pacesak elkarrizketa batean aipatu du beharko lukeela. informatika ahalmen handia bertsio osoa erreproduzitzeko.

Egon zaitez teknologia eta berrikuntzako azkenengo berrien berriekinCode Labs Academy.

Code Labs Academy © 2024 Eskubide guztiak erreserbatuta.