การจำลองวิวัฒนาการ: แบบจำลองภาษา ESM3 แปลงการพัฒนาโปรตีนอย่างไร

การจำลองวิวัฒนาการ: แบบจำลองภาษา ESM3 แปลงการพัฒนาโปรตีนอย่างไร
5 พฤศจิกายน 2024

ESM3 ปัญญาประดิษฐ์ (AI) ใหม่ที่สร้างโดย EvolutionaryScale ซึ่งเป็นบริษัทในสหรัฐฯ ที่ก่อตั้งโดยอดีตคนงาน Meta สามารถออกแบบโปรตีนที่มีคุณสมบัติตามที่ระบุ ซึ่งเป็นกระบวนการหนึ่ง ซึ่งโดยปกติจะใช้เวลาหลายร้อยล้านปีในการพัฒนาในลักษณะอินทรีย์ บริษัทได้เปิดตัวโมเดลภาษาที่สวมหน้ากากแบบกำเนิดนี้ ซึ่งเป็นหนึ่งใน AI ทางชีวภาพที่ใหญ่ที่สุดจนถึงปัจจุบัน ใน สิ่งพิมพ์ล่าสุดบน BioRxiv ความสามารถของ ESM3 ในการสร้างลำดับกรดอะมิโน โครงสร้างสามมิติ และการทำงานของโปรตีนไปพร้อมกันเพื่อตอบสนองต่อสัญญาณเฉพาะนั้นมีเอกลักษณ์เฉพาะตัวและเปิดประตูสู่การใช้ในการวิจัยวัสดุ ยาพัฒนายา และโปรตีนกักเก็บคาร์บอน

เนื่องจากโปรตีนเป็นเครื่องจักรชีวภาพระดับจุลภาคซึ่งมีความสำคัญต่อกระบวนการต่างๆ ของร่างกาย รวมถึงการสร้างกล้ามเนื้อ ผม และเล็บ ตลอดจนการผลิตฮอร์โมนและแอนติบอดี โครงสร้างสามมิติของพวกมันจึงมีความสำคัญทางชีวภาพและเภสัชวิทยาอย่างมาก การรู้โครงสร้างของโปรตีนช่วยให้เข้าใจการทำงานทางชีวภาพของโปรตีน ประเมินคุณสมบัติเป็นเป้าหมายในการรักษา และกำหนดประสิทธิผลของโปรตีนในการรักษา โปรตีนเป็นส่วนประกอบสำคัญของยาช่วยชีวิตหลายชนิด รวมถึงอินซูลินและแอนติบอดีสังเคราะห์ต่อการติดเชื้อทางเดินหายใจร้ายแรง เช่น RSV และมะเร็ง แทนที่จะค้นหาสายพันธุ์ตามธรรมชาติอย่างอุตสาหะ การวิจัยทางการแพทย์จำเป็นต้องสร้างโปรตีนใหม่ที่มีลักษณะบางอย่างเพิ่มมากขึ้น

สำหรับการสังเคราะห์โปรตีน ESM3 ของ EvolutionaryScale ใช้แบบจำลองภาษาที่ซ่อนอยู่ซึ่งสามารถเติมเต็มช่องว่างในหมวดหมู่ต่างๆ โดยการดูบริบทจากมุมที่ต่างกัน แบบจำลองนี้ใช้ตัวอักษรแยกต่างหากสำหรับแต่ละหมวดหมู่ (ลำดับ โครงสร้าง 3 มิติ และฟังก์ชัน) และได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่ซึ่งประกอบด้วยลำดับกรดอะมิโน 2.8 พันล้านลำดับ โครงสร้างโปรตีน 236 ล้านโครงสร้าง และฟังก์ชันโปรตีน 539 ล้านฟังก์ชัน เพื่อให้โมเดลเข้าใจบริบททั้งภายในและข้ามเลเยอร์ต่างๆ เหล่านี้ ทีมงานได้ค้นพบวิธีในการนำเสนอโครงสร้าง 3 มิติแต่ละรายการเป็นชุดของตัวละคร

การเริ่มต้นมอบหมายให้โมเดลมีความท้าทายในการสร้างโปรตีนเรืองแสงสีเขียว (GFP) แบบสังเคราะห์ ซึ่งรับผิดชอบต่อแสงที่เกิดขึ้นตามธรรมชาติในสัตว์ทะเล เช่น ปะการังและแมงกะพรุน เพื่อแสดงให้เห็นถึงศักยภาพของ ESM3 GFP ซึ่งได้รับรางวัลโนเบลสาขาเคมีประจำปี 2551 เป็นโปรตีนสำคัญในอณูชีววิทยาที่ช่วยให้นักวิทยาศาสตร์สามารถระบุและติดตามส่วนประกอบของเซลล์ที่มีชีวิตได้ แม้ว่าจะมีความคล้ายคลึงทางพันธุกรรมเพียง 58% กับคู่ตามธรรมชาติ แต่ "esmGFP" ซึ่งเป็นตัวแปรสังเคราะห์ที่ดีที่สุดของ GFP ที่ผลิตโดย ESM3 มีความสว่างสูงเทียบได้กับ GFP ธรรมชาติ ตามที่นักวิจัยกล่าวไว้ การสร้างโปรตีนเรืองแสงชนิดใหม่นี้จะเทียบเท่ากับการเลียนแบบวิวัฒนาการมากกว่า 500 ล้านปี

Alex Rives หัวหน้านักวิทยาศาสตร์ EvolutionaryScale มีส่วนร่วมในการจำลองแบบจำลอง ESM ก่อนหน้านี้ที่ Meta ทีมงานตัดสินใจที่จะศึกษาต่อเพียงลำพังหลังจากที่ Meta หยุดทำงานในพื้นที่นี้เมื่อปีที่แล้ว ด้วยเหตุนี้ จึงเพิ่งมีการประกาศโปรตีนเรืองแสงและมีการลงทุน 142 ล้านดอลลาร์เพื่อพัฒนาความก้าวหน้าเหล่านี้ในเชิงพาณิชย์ EvolutionaryScale เวอร์ชันการเข้าถึงแบบเปิดที่เล็กกว่านั้นจัดทำขึ้นเพื่อการวิจัยทางวิทยาศาสตร์ แต่ก็ไม่สามารถใช้งานได้อย่างสมบูรณ์ ขณะที่เขารู้สึกตื่นเต้นที่จะทดสอบโมเดลนี้ Martin Pacesa จาก Ecole Polytechnique Fédérale de Lausanne กล่าวไว้ในการให้สัมภาษณ์ ว่าต้องใช้เวลา พลังการประมวลผลมากมายในการสร้างเวอร์ชันเต็ม

ติดตามเทคโนโลยีและนวัตกรรมล่าสุด พร้อมอัปเดตจากCode Labs Academy.

Code Labs Academy © 2024 สงวนลิขสิทธิ์.