5-ноябрь, 2024-жыл
ESM3, мурдагы Meta жумушчулары негиздеген америкалык EvolutionaryScale компаниясы тарабынан түзүлгөн жаңы жасалма интеллект (AI) белгилүү бир касиеттерге ээ протеиндерди долбоорлой алат. бул органикалык жол менен эволюция үчүн, адатта, жүздөгөн миллиондогон жылдарды талап кылат. Компания бүгүнкү күнгө чейин эң чоң биологиялык AIлардын бири болгон бул генеративдик маскаланган тил моделин [BioRxivде акыркы алдын ала басып чыгарууда] ачты (https://www.biorxiv.org/content/10.1101/2024.07.01.600583v1.full). ESM3 бир эле учурда аминокислота ырааттуулугун, үч өлчөмдүү түзүлүшүн жана белгилүү бир сигналдарга жооп белоктун функциясын өндүрүү жөндөмдүүлүгү уникалдуу болуп саналат жана материалдарды изилдөөдө, дары-дармектерди иштеп чыгууда жана көмүртек сактоочу белоктордо колдонууга жол ачат.
Белоктор булчуңдардын, чачтын жана тырмактардын пайда болушу, ошондой эле гормондордун жана антителолордун өндүрүшү сыяктуу көптөгөн дене процесстери үчүн маанилүү микроскопиялык биомашиналар болгондуктан, алардын үч өлчөмдүү түзүлүшүнүн биологиялык жана фармакологиялык мааниси чоң. Белоктордун түзүлүшүн билүү алардын биологиялык функциясын түшүнүүгө, терапиялык максат катары алардын жарамдуулугун баалоого жана дарылоо катары натыйжалуулугун аныктоого жардам берет. Белоктор бир нече өмүрдү сактап калуучу дарылардын курулуш материалы болуп саналат, анын ичинде инсулин жана RSV жана рак сыяктуу олуттуу респиратордук инфекцияларга каршы синтетикалык антителолор. Табигый варианттарды талыкпай издөөнүн ордуна, медициналык изилдөөлөр барган сайын белгилүү бир өзгөчөлүктөргө ээ болгон жаңы протеиндерди жасоого муктаж.
Белок синтези үчүн, EvolutionaryScale'тин ESM3 контекстти ар кайсы бурчтан карап, ар кандай категориялардагы боштуктарды толтура ала турган жашыруун тил моделин колдонот. Модель ар бир категория үчүн өзүнчө алфавитти колдонгон (ырааттуулук, 3D түзүлүшү жана функциясы) жана 2,8 миллиард аминокислота ырааттуулугун, 236 миллион протеин структурасын жана 539 миллион протеин функцияларын камтыган чоң маалымат топтому боюнча үйрөтүлгөн. Модельге контекстти ушул көптөгөн катмарлардын ичинде да, алардын ичинде да түшүнүүгө мүмкүнчүлүк берүү үчүн, команда ар бир 3D структурасын бир катар каармандар катары көрсөтүүнүн жолун тапты.
Стартап моделге ESM3 потенциалын көрсөтүү үчүн маржан жана медузалар сыяктуу деңиз түрлөрүндө табигый жарыкка жооптуу жашыл флуоресценттүү протеиндин (GFP) синтетикалык версияларын түзүү тапшырмасын койду. 2008-жылы химия боюнча Нобель сыйлыгын утуп алган GFP илимпоздорго тирүү клеткалардын компоненттерин аныктоого жана көзөмөлдөөгө мүмкүндүк берген молекулалык биологиядагы маанилүү белок болуп саналат. Анын табигый аналогуна 58% гана генетикалык окшоштугу болсо да, ESM3 тарабынан чыгарылган GFPдин эң сонун синтетикалык варианты болгон "esmGFP", табигый GFP менен салыштырууга боло турган жогорку жарыкка ээ болгон. Изилдөөчүлөрдүн айтымында, бул жаңы флуоресценттүү протеинди түзүү 500 миллион жылдан ашык эволюцияны туураганга барабар болмок.
EvolutionaryScale башкы окумуштуусу Алекс Ривс Метадагы ESM моделинин мурунку итерацияларына катышкан. Мета өткөн жылы бул тармакта ишин токтоткондон кийин команда бул изилдөөнү жалгыз улантууну чечти. Натыйжада, флуоресценттик протеин жаңы эле жарыяланып, бул жетишкендиктерди коммерциялаштыруу үчүн 142 миллион доллар инвестицияланган. EvolutionaryScaleдин кичирээк, ачык жеткиликтүү версиясы да илимий изилдөөлөр үчүн жеткиликтүү, бирок ал толук иштебейт. Ал моделди сынап көрүү үчүн толкунданып жатканда, Ecole Polytechnique Fédérale de Lausanne кызматкери Мартин Пачеса маегинде айтылган толук версиясын чыгаруу үчүн көп эсептөө күчү.
Code Labs Academy жаңыртуулары менен акыркы технологиялар жана инновациялар боюнча кабардар болуңуз.