Evrimi Simüle Etmek: ESM3 Dil Modeli Protein Gelişimini Nasıl Dönüştürür?

Evrimi Simüle Etmek: ESM3 Dil Modeli Protein Gelişimini Nasıl Dönüştürür?
5 Kasım 2024

Eski Meta çalışanları tarafından kurulan bir ABD şirketi olan EvolutionaryScale tarafından oluşturulan yeni bir yapay zeka (AI) olan ESM3, belirli özelliklere sahip proteinler tasarlayabilir; bu bir süreç bunun organik bir şekilde gelişmesi normalde yüz milyonlarca yıl alır. Şirket, bugüne kadarki en büyük biyolojik yapay zekalardan biri olan bu üretken maskeli dil modelini BioRxiv'de yakın zamanda yayınlanan bir ön baskıda açıkladı. ESM3'ün belirli sinyallere yanıt olarak bir proteinin amino asit dizisini, üç boyutlu yapısını ve işlevini aynı anda üretme yeteneği benzersizdir ve malzeme araştırmalarında, ilaç geliştirme ilaçlarında ve karbon depolama proteinlerinde kullanımların kapısını açar.

Proteinler, kasların, saçların ve tırnakların oluşumu, hormonların ve antikorların üretimi de dahil olmak üzere birçok bedensel süreç için hayati önem taşıyan mikroskobik biyomakineler olduğundan, üç boyutlu yapıları büyük biyolojik ve farmakolojik öneme sahiptir. Proteinlerin yapısını bilmek, onların biyolojik işlevlerini anlamaya, terapötik hedefler olarak uygunluklarını değerlendirmeye ve tedavi olarak etkinliklerini belirlemeye yardımcı olur. Proteinler, RSV ve kanser gibi ciddi solunum yolu enfeksiyonlarına karşı insülin ve sentetik antikorlar da dahil olmak üzere hayat kurtaran birçok ilacın yapı taşlarıdır. Tıbbi araştırmaların zahmetli bir şekilde doğal varyantları aramak yerine, belirli özelliklere sahip tamamen yeni proteinler üretmeye giderek daha fazla ihtiyacı var.

Protein sentezi için EvolutionaryScale'in ESM3'ü, bağlama farklı açılardan bakarak çeşitli kategorilerdeki boşlukları doldurabilen gizli bir dil modeli kullanıyor. Model, her kategori (dizi, 3 boyutlu yapı ve fonksiyon) için ayrı bir alfabe kullandı ve 2,8 milyar amino asit dizisi, 236 milyon protein yapısı ve 539 milyon protein fonksiyonunu içeren geniş bir veri seti üzerinde eğitildi. Modelin bu katmanların hem içindeki hem de arasındaki bağlamı anlamasını sağlamak için ekip, her 3 boyutlu yapıyı bir karakter dizisi olarak temsil etmenin bir yolunu buldu.

Başlangıç, ESM3'ün potansiyelini göstermek için modeli, mercanlar ve denizanası gibi deniz türlerinde doğal olarak oluşan ışıktan sorumlu olan yeşil floresan proteinin (GFP) sentetik versiyonlarını oluşturma göreviyle görevlendirdi. 2008 Nobel Kimya Ödülü'nü kazanan GFP, moleküler biyolojide bilim adamlarının canlı hücrelerin bileşenlerini tanımlamasına ve izlemesine olanak tanıyan önemli bir proteindir. ESM3 tarafından üretilen GFP'nin en iyi sentetik çeşidi olan "esmGFP", doğal benzeriyle yalnızca %58 oranında genetik benzerliğe sahip olmasına rağmen, doğal GFP ile karşılaştırılabilecek yüksek bir parlaklığa sahipti. Araştırmacılara göre bu yeni floresan proteini yaratmak, 500 milyon yılı aşkın evrimi taklit etmekle eş değer olacak.

EvolutionaryScale Baş Bilim Adamı Alex Rives, Meta'da ESM modelinin önceki yinelemelerinde yer almıştı. Ekip, Meta'nın geçen yıl bu alanda çalışmayı bırakmasının ardından bu çalışmaya tek başına devam etme kararı aldı. Sonuç olarak, floresan protein daha yeni duyuruldu ve bu ilerlemelerin ticarileştirilmesi için 142 milyon dolar yatırım yapıldı. EvolutionaryScale'in daha küçük, açık erişimli bir sürümü de bilimsel araştırmalar için kullanıma sunuldu, ancak tam olarak işlevsel değil. Modeli test etmekten heyecan duysa da Ecole Polytechnique Fédérale de Lausanne'den Martin Pacesa bir röportajda bahsetti bunun biraz zaman alacağını söyledi tam sürümü yeniden oluşturmak için çok fazla bilgi işlem gücü.

Code Labs Academy](https://codelabsacademy.com/) güncellemeleriyleteknoloji ve yeniliklerdeki en son gelişmelerden haberdar olun.

Code Labs Academy © 2024 Her hakkı saklıdır.