สงครามปัญญาประดิษฐ์ ไขปริศนาจักรกลนาโน III : อีกก้าวแห่งอนาคต/ทะลุกรอบ ป๋วย อุ่นใจ

ดร. ป๋วย อุ่นใจ

ทะลุกรอบ

ป๋วย อุ่นใจ

 

สงครามปัญญาประดิษฐ์ ไขปริศนาจักรกลนาโน III

: อีกก้าวแห่งอนาคต

 

ศึกชิงเจ้าสังเวียนเอไอทำนายโครงสร้างสามมิติของโปรตีนระหว่างอัลฟ่าโฟลด์ 2 (alphafold 2) จากค่ายกูเกิลดีปมายด์ (Google DeepMind) กับโรเบตตา (Robetta) จากค่ายมหาวิทยาลัยวอชิงตัน ซีแอตเติล (University of Washington Seattle) จะช่วยทำให้ทั้งสองค่ายยอมเปิดเผยเทคโนโลยีให้เป็นทรัพยากรสาธารณะ ซึ่งคงจะเป็นคุณูปการอย่างมหาศาลกับวงการชีววิทยา การแพทย์ เภสัช หรือแม้แต่วิทยาการคอมพิวเตอร์

การร่วมทีมกับห้องปฏิบัติการอณูชีววิทยาแห่งยุโรป (European Molecular Biology Laboratory) ของดีปมายด์ เพื่อเปิดตัวฐานข้อมูล Structural proteomics หรือโครงสร้างโปรตีนทั้งหมดในจีโนมของสิ่งมีชีวิตถือเป็นก้าวใหม่ที่สำคัญของวงการชีวเคมีและนาโนเทคโนโลยีชีวภาพ (nanobiotechnology) และทำให้สิ่งที่นักชีวเคมีมากมายเคยได้แต่ฝันกลายเป็นจริงขึ้นมา

ใครสนใจอยากลองโหลดข้อมูลโปรตีนทั้งหมดของสิ่งมีชีวิตมาเปิดดู สามารถไปลองเล่นได้ที่เว็บ https://alphafold.ebi.ac.uk

หลายคนคาดหวังว่าฐานข้อมูล structural proteomics จะช่วยให้นักออกแบบโมเลกุลของยาสามารถออกแบบยาใหม่ได้เลยในคอมพิวเตอร์ ซึ่งจะช่วยเร่งกระบวนการในการพัฒนายาใหม่ให้เกิดขึ้นได้อย่างรวดเร็วและแม่นยำ

อีกทั้งยังช่วยลดต้นทุนในการสกรีนหาสารออกฤทธิ์ที่น่าจะเอามาใช้เป็นยาได้อีกอย่างมหาศาล

แทนที่จะต้องทดสอบเฟ้นหาเป็นล้าน อาจจะเหลือทดสอบแค่บางตัวที่น่าสนใจแค่เป็นร้อย ก็อาจจะเจอยาดีๆ ได้

ต้องบอกว่าหมัดเด็ดของอัลฟ่าโฟลด์ 2 ในยกนี้เสยเปรี้ยงเข้าไปใต้คางทีมโรเบตตาเข้าอย่างจัง ทำให้คะแนนนิยมของทีมอัลฟ่าโฟลด์ 2 นั้นกระโดดขึ้นมานำอีกครั้ง และครั้งนี้คงไม่ง่ายที่ฝั่งโรเบตตาจะพลิกกลับมาชนะได้ง่ายๆ อีกรอบ

ภาพแบบจำลองโปรตีนหนามของไวรัสโควิด-19 ที่มีน้ำตาลหุ้มอยู่เกือบทั้งก้อน

การเดินเกมเร็วในครั้งนี้ของอัลฟ่าโฟลด์น่าจะปิดจ๊อบ หลายคนถามผมว่า แล้วแบบนี้นักชีวเคมีที่เชี่ยวชาญในการหาโครงสร้างสามมิติของโปรตีนอย่างนักตกผลึกโปรตีน (protein crystallographer) หรือช่างถ่ายภาพโมเลกุล (cryoEMer) จะตกงานหรือเปล่า?

ในความเป็นจริง เรื่องราวแห่งสงครามเอไอยังไม่จบ แต่เพิ่งจะเริ่มขึ้น!

แม้ว่าโครงสร้างโปรตีนที่ทำนายขึ้นมาจากอัลกอริธึ่มของเอไออัลฟ่าโฟลด์ 2 จะมีความแม่นยำอย่างน่าประทับใจ และฐานข้อมูล structural proteomics ของอัลฟ่าโฟลด์ก็ได้พลิกวงการไปแล้ว

แต่โรเบตตาก็ใช่จะแพ้แบบสิ้นท่า เพราะที่จริงยังแอบมีความเหนือชั้นซ่อนไว้อยู่ ในขณะที่อัลฟ่าโฟลด์จะทำนายโครงสร้างได้เก่งเป๊ะกว่า แต่โครงสร้างของโปรตีนที่อัลฟ่าโฟลด์ทำนายขึ้นมาจะเป็นโครงสร้างของโปรตีนเดี่ยวๆ ซึ่งสามารถใช้อธิบายบทบาทหน้าที่ของโปรตีนได้บ้าง แต่โดยปกติแล้ว โปรตีนส่วนใหญ่ในเซลล์ของสิ่งมีชีวิตนั้นมักจะไม่ทำงานแยกกันเดี่ยวๆ แต่จะเกาะตัวกันเป็นโครงสร้างขนาดใหญ่ที่สามารถทำงานสอดประสานกันได้เป็นอย่างดีประดุจเครื่องจักรกลที่มนุษย์สร้างมาใช้ในการแบ่งเบาภาระงานในชีวิตจริง จนนักวิทยาศาสตร์หลายๆ คนขนานนามโครงสร้างโปรตีนขนาดใหญ่เหล่านี้ว่าจักรกลโมเลกุล (molecular machine)

และสิ่งที่โรเบตตายังเหนือชั้นกว่าอัลฟ่าโฟลด์ 2 ก็คือมันสามารถที่จะสร้างโมเดลของโครงสร้างของจักรกลโมเลกุลขนาดใหญ่ที่น่าจะเป็นโครงสร้างจริงที่ทำงานในสิ่งมีชีวิตได้ ในขณะที่อัลฟ่าโฟลด์จะเน้นแค่ทำนายโครงสร้างแค่โปรตีนเดี่ยวๆ

และถ้าจะสร้างโมเดลของโครงสร้างจักรกลโมเลกุลสักตัวหนึ่งขึ้นมาก็ยังจะต้องใช้ข้อมูลของโครงสร้างเชิงซ้อนของโปรตีนเหล่านั้นจากผลึก (crystal) หรือการถ่ายภาพโมเลกุลด้วยเทคนิค cryoEM เข้ามาช่วย

 

เทคโนโลยี cryoEM นั้น ที่จริงแล้วก็ถูกพัฒนาขึ้นมายาวนานหลายทศวรรษ ทั้งในเรื่องของเทคนิคการถ่ายภาพ การเตรียมตัวอย่างและการประมวลผลภาพในคอมพิวเตอร์เพื่อประกอบข้อมูลสองมิติที่สกัดออกมาจากภาพให้กลายเป็นสามมิติ

ซึ่งในอดีต ช่วงยุคก่อนปี 2013 ตอนนั้น กล้อง CCD ที่ใช้ในการจับภาพ cryoEM นั้น จับภาพได้ไม่ค่อยไว หลังจากกดชัตเตอร์ไปแล้วก็อาจจะต้องรอเกือบวินาที กว่าภาพจะถ่ายเสร็จ รูปที่ได้ส่วนใหญ่ก็เลยเบลอเล็กๆ ทำให้รายละเอียดของภาพโปรตีนนั้นหายไป เวลาประกอบรูปมาเป็นโครงสร้างสามมิติเลยเบลอๆ เห็นเป็นแค่ก้อนตะปุ่มตะป่ำ (blob)

พวกช่างภาพ cryoEM จึงมักจะถูกค่อนขอดว่าเป็นนักประกอบก้อนตะปุ่มตะป่ำ (blobologist)

แต่พอช่วงยุคหลังปี 2013 ตอนนั้นกล้องจับภาพตัวใหม่ได้ถูกคิดค้นขึ้นมา คราวนี้เป็นกล้อง CMOS ที่ในวงการจะเรียกกันว่า direct detector ซึ่งกล้อง CMOS นี้มีความสามารถในการจับภาพได้ว่องไวมาก สามารถบันทึกทุกเหตุการณ์ได้ภายในเสี้ยววินาที จึงสามารถเก็บรายละเอียดภาพได้อย่างชัดเจนที่ความละเอียดสูง และสามารถเก็บข้อมูลทิศทางการเคลื่อนที่ของวัตถุภาพเป็นมูฟวี่ได้ด้วยในขณะถ่าย ทำให้สามารถปรับภาพให้หายเบลอได้ในกรณีที่วัตถุหรือโปรตีนที่สนใจเลื่อนไปเลื่อนมาในขณะถ่าย

ซึ่งภาพที่ได้หากเอามาประมวลผลดีๆ แล้วประกอบขึ้นมาเป็นสามมิติ ก็จะสามารถให้ข้อมูลที่ความละเอียดสูงมากขนาดที่จะบอกได้เลยว่า กรดอะมิโนตัวไหนอยู่ตรงไหนบ้างในก้อนโปรตีนที่เราสนใจ ทำให้นักวิทยาศาสตร์สามารถเชื่อมโยงข้อมูลโครงสร้างกับหน้าที่และสามารถบ่งบอกกลไกการทำงานของโปรตีนที่สนใจศึกษาได้อย่างแม่นยำในระดับอะตอม

บอกได้หมดว่าจักรกลโมเลกุลมีกี่ส่วน เอนไซม์ที่เป็นส่วนประกอบน่าทำงานยังไง หรือถ้าศึกษาไวรัส ก็จะบอกได้เลยว่าไวรัสเข้าสู่เซลล์ได้ยังไง แอนติบอดี้แบบไหนจะกันไวรัสได้ แล้วกลไกอะไรในระดับโมเลกุลที่ทำให้ไวรัสสามารถหลีกเลี่ยงภูมิจากวัคซีนได้

โจทย์วิจัยเป็นโจทย์วิจัยหมื่นล้าน เพราะนอกจากจะให้องค์ความรู้ที่ทำให้เราเข้าใจธรรมชาติมากขึ้นแล้ว ยังมีมูลค่าสูงยิ่งในเชิงธุรกิจ

ลองจินตนาการดูว่า ในยามกลียุค ที่ตลาดวัคซีนและยานั้นเป็นของผู้ขาย ขาดแคลนจนหาแทบไม่ได้ ใครก็ตามที่สามารถที่จะหายาและวัคซีนตัวใหม่ที่ทำงานได้จริงๆ เจอก่อน ผู้นั้นคือผู้ครองตลาด!

 

ถ้ายังจำกันได้หลังจากที่มีการประกาศจากทางการจีนว่ามีไวรัสสายพันธุ์ใหม่ระบาดในอู่ฮั่น และแพร่กระจายอย่างน่ากังวล เพียงแค่สองเดือนเท่านั้น ช่างภาพ cryoEM จากออสติน เท็กซัส เจสัน แม็กลีแลน (Jason McLellan) ก็ได้อวดโฉมโครงสร้างโปรตีนหนามของไวรัสโควิด-19 จนเป็นที่ฮือฮาไปทั่วในรูปแบบของพรีปรินต์ (preprint) ในฐานข้อมูล bioRxiv ที่ซึ่งนักวิจัยใช้แชร์ข้อมูลต้นฉบับเปเปอร์ก่อนลงวารสารวิทยาศาสตร์จริงๆ

หลังจากนั้นไม่นาน โครงสร้างสามมิติของโปรตีนหนามอีกนับสิบก็ค่อยๆ ทยอยถูกปล่อยออกมาจากห้องทดลองทั่วโลก ข้อมูลเหล่านี้มีความสำคัญมากและเป็นต้นกำเนิดของการปรับเปลี่ยนกรดอะมิโนในวัคซีนโปรตีนซับยูนิต หรือแม้แต่ลำดับพันธุกรรมของวัคซีนเอ็มอาร์เอ็นเอ ที่เรียกว่า 2P modification ที่ช่วยเพิ่มความเสถียรของโปรตีนหนามที่ที่จะช่วยให้การกระตุ้นภูมิจากวัคซีนนั้นเกิดขึ้นได้ดีขึ้นอย่างมหาศาล

นอกจากนี้ ข้อมูลจากโครงสร้างของโปรตีนหนามจาก cryoEM ยังบ่งชี้อีกว่าโปรตีนหนามของไวรัส SARS-CoV-2 นั้นมีสารเคมีจำพวกน้ำตาลเคลือบอยู่บนผิวจนแทบไม่เหลือพื้นที่ว่างยกเว้นอยู่ที่เดียวก็คือบริเวณที่เรียกว่าส่วนที่จับกับโปรตีนตัวรีบบนเซลล์มนุษย์ที่เรียกว่า RBD

โดยปกติ ส่วน RBD ของโปรตีนหนามจะกางออก ในตอนที่ไวรัสเข้ายึดเกาะกับโปรตีนตัวรับ ACE-2 ของคน ซึ่งถ้ากางไม่ได้ ไวรัสก็จะไม่สามารถเข้าติดเชื้อในเซลล์คนได้

ทว่า ยังไม่มีใครรู้หรือเข้าใจบทบาทของน้ำตาลที่เคลือบอยู่นั้นว่ามีหน้าที่อะไรเกี่ยวกับการติดเชื้อของไวรัสหรือเปล่า

ส่วนใหญ่จะเชื่อว่าน่าจะเกี่ยวข้องกับการพรางตัวของไวรัสไม่ให้ภูมิเห็น แต่ไม่แน่ว่าอาจจะมีอะไรมากกว่านั้น

นักวิจัยชีวฟิสิกส์รอมมี่ อมาโร (Rommie Amaro) จากมหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก (University of California San Diego) จึงได้สร้างโมเดลสามมิติของโปรตีนหนามของไวรัสโควิด-19 แบบเต็มๆ ขึ้นมาแล้วเอามาทำเป็นแบบจำลองเสียบลงไปในเยื่อหุ้มแล้วเติมน้ำแล้วคำนวณดูว่าพฤติกรรมของโมเลกุลโปรตีนในแบบจำลองนั้นจะเป็นเช่นไร

พวกเขาปล่อยให้แบบจำลองสามารถขยับได้อย่างอิสระทั้งโปรตีน น้ำตาล น้ำ และเยื่อหุ้ม และสังเกตผล

พวกเขาสามารถเห็นชิ้นส่วนของ RBD กางออกในคอมพิวเตอร์ได้จริงๆ และทำนายได้ว่าน้ำตาลสองตำแหน่ง (ตัวที่ 165 และ 234) บนผิวของโปรตีนหนามน่าจะมีผลกับการกางออกของ RBD และถ้าเขาทดลองตัดเอาน้ำตาลสองตัวนี้ออก โอกาสในการกางออกของ RBD ก็ควรจะลดลงอย่างมาก ซึ่งจะทำให้ไวรัสติดเชื้อได้น้อยลง

และถ้า RBD ไม่สามารถกางออกไปได้ นั่นหมายความว่าโปรตีนหนามที่ถูกดัดแปลงจะคงรูปมากและมีความเสถียรสูงขึ้นอย่างเห็นได้ชัด ไม่ต่างไปจากการทำ 2P modification

 

แต่ยังไงการทำนายก็คือการทำนาย ทีมวิจัยของอมาโรได้ลองทำการทดลองเพิ่มเติมในหลอดทดลองเพื่อยืนยันผล ซึ่งผลที่ได้ก็สอดคล้องกับผลการคำนวณเป็นอย่างดีเยี่ยม พวกเขาเชื่อว่าความรู้ความเข้าใจในเรื่องบทบาทของชิ้นส่วนน้ำตาลบนโปรตีนหนามไวรัสนี้ทั้งจากการทำนายโดยการคำนวณและการทำทดลองจริงอาจจะช่วยเป็นหนึ่งในแรงผลักดันที่จะทำให้เราสามารถออกแบบวัคซีนเจนใหม่จากการปรับแต่งน้ำตาลก็เป็นได้

จะเห็นได้ว่าแม้ว่าฐานข้อมูล structural proteomics ของอัลฟ่าโฟลด์นั้น แม้จะครอบคลุมและน่าตื่นเต้นมากเพียงไร แต่ก็ยังมีจุดอ่อนทั้งในเรื่องของการประกอบโครงสร้างขนาดใหญ่ของจักรกลโมเลกุล ไปจนถึงการเข้าใจกลไกและพฤติกรรมของโมเลกุลที่อยู่เบื้องหลังการทำงานที่ซับซ้อนของโปรตีนได้

และแม้ว่าเทคโนโลยีจะดีแค่ไหน วิสัยทัศน์จะทำให้เราสามารถมองเห็นช่องว่างที่เปิดให้เราเดินต่อไปได้เพื่อการพัฒนาอยู่เสมอ และถ้าเมื่อไรที่เราหยุดอยู่กับที่ เราก็จะโดนทิ้งไว้ข้างหลัง ในยุคแห่งแข่งขัน องค์ความรู้คือจุดพลิกผันที่อาจจะช่วยชีวิตผู้คนได้อีกมากมาย

และที่สำคัญ ถ้ารู้ว่าจะเอามาใช้อย่างไร จะส่งผลกระทบมหาศาลต่อเศรษฐกิจของชาติ