สงครามปัญญาประดิษฐ์ ไขปริศนาจักรกลนาโน II : การกลับมาของกูเกิลดีปมายด์/ทะลุกรอบ ป๋วย อุ่นใจ

ดร. ป๋วย อุ่นใจ

ทะลุกรอบ

ป๋วย อุ่นใจ

 

สงครามปัญญาประดิษฐ์

ไขปริศนาจักรกลนาโน II

: การกลับมาของกูเกิลดีปมายด์

 

สมรภูมิเดือดแห่งวงการเอไออัจฉริยะทำนายโครงสร้างโปรตีนปฏิวัติวงการชีวเคมีนั้นยังไม่สิ้นสุด ที่จริงต้องบอกว่าเพิ่งเริ่มยกแรก ก็ปล่อยหมัดฮุกเข้าหากันแบบไม่ยั้งแล้ว

หลังจากที่กูเกิลดีปมายด์ (Google DeepMind) เหมือนโดนตบหน้าไปฉาดใหญ่โดยทีมนักวิจัยพันธมิตรนำโดยศาสตราจารย์เดวิด เบเกอร์ (David Baker) จาก มหาวิทยาลัยวอชิงตัน ซีแอตเติล (University of Washington Seattle) หมาดๆ ด้วยการออกซอฟต์แวร์เอไอ “โรเซตตาโฟลด์ (rosettafold)” (หรือที่ภายหลังเรียก “โรเบตตา (robetta)”) ออกมาปะทะกันแบบตาต่อตา ฟันต่อฟัน

จนท้ายที่สุด ออกเปเปอร์มาชนกันในวารสารวิชาการระดับเทพของวงการแบบปกชนปก ดีปมายด์ลงเนเจอร์ (Nature) และโรเบตตาลงไซแอนซ์ (Science)

ทีมวิจัยโรเบตตาได้แรงบันดาลใจมาจากเล็กเชอร์เกี่ยวกับของเอไอชื่อดังอัลฟ่าโฟลด์ 2 (alpha fold 2) ปัญญาประดิษฐ์สุดล้ำที่พิชิตชัยนักชีวเคมีและชีวฟิสิกส์มือฉมังนับร้อยในการแข่งขันทำนายโครงสร้างโปรตีนระดับโลก CASP ของทีมดีปมายด์ที่ทางทีมกล่าวว่าแทบไม่ให้ข้อมูลอะไรเลยเกี่ยวกับกลไกการทำงานของเอไอ แต่ด้วยการทำงานอย่างหนัก ท้ายที่สุด พวกเขาก็สามารถแกะและสร้างอัลกอริธึ่มของโรเบตตาออกมาได้เกือบจะเหมือนเป๊ะและให้ผลลัพธ์ได้ดีเลิศประเสริฐศรีใกล้เคียงมากกับเอไอของดีปมายด์

และในที่สุด ทีมดีปมายด์ก็ปล่อยซอร์สโค้ด (source code) ของเอไออัลฟ่าโฟลด์ 2 ออกมาสู่สาธารณะ ให้ทุกคนสามารถดาวน์โหลดไปลองใช้ได้แบบโอเพ่นซอร์ส (open source)

แต่เหมือนได้คืบจะเอาศอก ทีมโรเบตตายังกระตุกหนวดเสือไม่เลิก พวกเขาสร้างเซิร์ฟเวอร์ทำนายโครงสร้างโปรตีนเปิดให้นักวิจัยสามารถเข้าไปทำนายโปรตีนที่ตัวเองสนใจได้ฟรี จนมีนักวิจัยมากมาย (รวมทั้งผมด้วย) เข้าไปลองใช้บริการทำนายโครงสร้างโปรตีนด้วยเอไอมาแล้วอย่างอุ่นหนาฝาคั่ง แค่เดือนเดียว จัดไปแล้วกว่าห้าพันโครงสร้าง

แค่นั้นก็สะเทือนวงการชีวเคมีกันจนพวกทำงานในด้านนี้แทบทุกคนต่างก็กรี๊ด ตื่น กรี๊ด ตื่น ไปสามตลบแล้ว ทุกคนมองว่านี่คือจุดพลิกผันของวงการ ที่จะเปลี่ยนทิศทางของการพัฒนาองค์ความรู้และแลนด์สเคปงานวิจัยทางชีวเคมี ยาวไปจนถึงอุตสาหกรรมยา ฟาร์มาและเทคโนโลยีชีวภาพไปจนไม่อาจจินตนาการได้

เพราะองค์ความรู้ในด้านโครงสร้างสามมิติของโปรตีนจะช่วยให้วิศวกรชีวภาพสามารถออกแบบเอนไซม์ใหม่ๆ ที่ประสิทธิภาพดี มีเสถียรภาพสูงเหมาะแก่การประยุกต์ใช้ในอุตสาหกรรมต่างๆ

นอกจากนี้ ความแตกต่างเพียงเล็กน้อยในโครงสร้างสามมิติของเอนไซม์สำคัญจะเป็นกุญแจสำคัญที่จะนำไปสู่การออกแบบและการพัฒนาโมเลกุลของยาแบบใหม่ๆ ที่จะออกฤทธิ์เฉพาะในเชื้อก่อโรคโดยไม่ส่งผลข้างเคียงใดๆ เลยกับร่างกายมนุษย์

 

“สงครามยังไม่จบอย่าเพิ่งนับศพทหาร” สำนวนนี้ยังคงใช้ได้ดี เพราะผ่านไปเพียงแค่สัปดาห์เดียว ดีปมายด์ก็สร้างเซอร์ไพรส์อีกครั้ง

นี่อาจจะเป็นอะไรที่น่าตื่นเต้น พอๆ กับตอนที่โครงการจีโนมมนุษย์ประกาศความสำเร็จเลยก็เป็นได้

ถ้าจินตนาการว่าโครงการจีโนมมนุษย์ (human genome project) ให้ข้อมูลรหัสดีเอ็นเอ ซึ่งเปรียบเสมือนต้นแบบพิมพ์เขียวเล่มใหญ่สำหรับการสร้างจักรกลชีวภาพที่เรียกว่า โปรตีน เพื่อให้ทำงานทุกสิ่งทุกอย่างภายในเซลล์

ข้อมูลดีเอ็นเอจะแบ่งออกเป็นบทๆ เรียกว่ายีน (gene) แต่ละบท แต่ละยีนก็จะใช้กำหนดการสร้างโปรตีนแต่ละชนิดแตกต่างกันไป เมื่อเซลล์ต้องใช้โปรตีนอะไร ข้อมูลในบทนั้นของดีเอ็นเอก็จะถูกเซลล์ก๊อบปี้ออกมาในรูปแบบของเอ็มอาร์เอ็นเอ (mRNA) เป็นบทๆ ไป ตามที่จำเป็น

ถ้าเปรียบเอ็มอาร์เอ็นเอก็คงเหมือนใบคำสั่งชั่วคราวแบบใช้แล้วทิ้งสำหรับสร้างโปรตีนซึ่งจะถูกอ่านโดยจักรกลภายในเซลล์ที่เรียกว่าไรโบโซม ซึ่งไรโบโซมจะทำประกอบสายโปรตีนขึ้นมาจากกรดอะมิโนตามลำดับของเอ็มอาร์เอ็นเอ

ประเด็นคือโปรตีนที่สร้างเสร็จแล้ว ถ้าจะทำงานได้ จะต้องขึ้นรูป (fold) เป็นโครงสร้างสามมิติที่เหมาะสมให้ได้เสียก่อน

ซึ่งหมายความว่าถ้าเราอยากควบคุมการทำงานของโปรตีนให้ได้ เราจะต้องเข้าใจกลไกการขึ้นรูปและโครงสร้างสามมิติของโปรตีนด้วย

 

ในยุคโพสต์จีโนมิก (postgenomic era) หรือยุคหลังโครงการจีโนมนุษย์เสร็จแล้ว ข้อมูลดีเอ็นเอจะทำให้นักวิจัยสามารถกำหนดหรือปรับแต่งให้เซลล์แต่ละชนิดสร้างโปรตีนที่ต้องการได้แทบจะตามใจสั่ง

เราสามารถปรับแต่งให้ต้นข้าวโพดสร้างโปรตีนสารพิษต้านแมลงที่ช่วยให้มันเติบโตและต้านทานการเข้าทำลายของศัตรูพืชได้เป็นอย่างดี

หรือแม้แต่จะสั่งให้ต้นยาสูบสามารถสร้างโปรตีนหนามของไวรัส SARS-CoV-2 ที่ก่อโรคโควิด-19 เพื่อจะสกัดนำมาใช้เป็นวัคซีนต้านโรคระบาดก็ยังทำได้

แต่การสร้างโปรตีนได้ ไม่ได้การันตีผลว่าโปรตีนที่สร้างขึ้นมานั้นจะสามารถทำงานได้จริง ตราบใดที่ยังไม่สามารถบอกได้ว่าโปรตีนนั้นมีโครงสร้างสามมิติที่ถูกต้องตามที่ควรจะเป็นหรือไม่

ในยุคหลังจีโนมมนุษย์เสร็จใหม่ๆ จึงมีความเคลื่อนไหวจากนักวิทยาศาสตร์หลายแขนงว่าแค่รู้รหัสดีเอ็นเอและรู้ลำดับกรดอะมิโนในโปรตีนแค่นั้นยังไม่พอ เพราะถ้าอยากเข้าใจกลไกจริงๆ ของชีวิต จิ๊กซอว์ตัวสำคัญที่ขาดไปไม่ได้เลยก็คือโครงสร้างสามมิติ!

ประมาณการได้ว่ามนุษย์นั้นมียีนราวๆ สองหมื่นถึงสามหมื่นยีน ซึ่งจากโครงการจีโนม ยังบอกได้อีกด้วยว่ายีนไหนมีลำดับของดีเอ็นเอเป็นอย่างไรกันบ้าง และจะประกอบเป็นสายโปรตีนที่มีลำดับของกรดอะมิโนอย่างไร

ก้าวต่อไปที่สำคัญของโครงการโอมิกส์ที่น่าจะพลิกวงการอีกครั้งก็คือข้อมูลโครงสร้างสามมิติของโปรตีน ไม่ใช่แค่ตัวเดียว แต่เป็นโปรตีนทั้งหมดที่พบในจีโนมนุษย์ ซึ่งก็ราวๆ สองหมื่นตัว ที่มาจากยีนสองหมื่นยีนนั่นแหละ

นักวิทยาศาสตร์เรียกแนวคิดในการสร้างคลังข้อมูลโครงสร้างสามมิติของทุกโปรตีนในสิ่งมีชีวิตนี้ว่า structural genomics หรือ structural proteomics ซึ่งในกลุ่มผู้ผลักดันแนวคิดนี้ ก็มีนักผลึกศาสตร์ (crystallographer) ชื่อดังอย่างเอียน วิลสัน (Ian Wilson) จากสถาบันวิจัยสคริปป์ (Scripp Research) และโรเบิร์ต สเตราด์ (Robert Stroud) จากมหาวิทยาลัยแคลิฟอร์เนียซานฟรานซิสโก (University of California San Francisco) เข้าไปร่วมวงอยู่ด้วย

ซึ่งพอสองคนนี้เข้ามาร่วมด้วย mindset ของนักผลึกศาสตร์รุ่นใหม่หลายคนจึงเริ่มเปลี่ยนไป

 

การตกผลึกโปรตีนนั้น ขึ้นชื่อลือชาว่ามากับดวง บางโปรตีนก็ตกง่ายมาก บางโปรตีนก็ยากเหลือใจ พวกนักผลึกศาสตร์จึงมักจะเลือกตกผลึกเฉพาะกับโปรตีนที่รู้หน้าที่อยู่แล้วว่ามีความสำคัญ แต่อยากได้โครงสร้างสามมิติมาเพื่ออธิบายกลไกการทำงานในระดับโมเลกุล เพื่อเอาไปพัฒนาต่อหรือสร้างองค์ความรู้ใหม่ๆ เกี่ยวกับกระบวนการสำคัญที่โปรตีนนั้นเกี่ยวข้องก็เท่านั้น

แต่พอแนวคิด structural genomics โผล่เข้ามา กระทุ้งโดยบ๊อบ สเตราต์ และเอียน วิลสัน ความสนใจนักผลึกศาสตร์ก็เริ่มเปลี่ยนไป เป็นหันมาแข่งกันตกผลึกหาโครงสร้างสามมิติของโปรตีนทุกตัวที่พบในจีโนมให้ได้มากที่สุดเท่าที่พอจะทำได้ แม้จะไม่รู้ว่าโปรตีนนั้นทำหน้าที่อะไรก็ตาม พอได้โครงสร้างมาแล้ว ค่อยมาทดลองหาดูอีกทีว่าหน้าที่น่าจะเป็นอะไร

ซึ่งกระแส structural genomics นี้ทำให้มีการหาและสับมิตโครงสร้างโปรตีนแปลกๆ เอนไซม์ประหลาดๆ เข้ามามากมายในฐานข้อมูล กลายเป็นผลดีมากับวงการทำนายโปรตีนเพราะมีข้อมูลหลากหลายไว้เทรนเอไอ

แต่อย่างที่บอกไป การตกผลึกโปรตีนนั้น ไม่ใช่เรื่องง่ายๆ ที่จะคาดเดาผลได้ แม้จะมีโครงสร้างโปรตีนเติมเข้ามาเยอะ แต่ถ้าถามว่าใกล้ครบทุกตัวในจีโนมหรือไม่ คำตอบคือยังห่างไกลความเป็นจริงมากนัก

 

ยิ่งตอนนี้ ตัวง่ายๆ โดนนักตกผลึกเก๋าเกมเก็บแต้มไปหมดแล้ว มีแต่โปรตีนที่ตกยากๆ ระดับปราบเซียนทั้งนั้นที่ยังเหลืออยู่ บางคนเริ่มหันไปพึ่งพาเทคโนโลยีใหม่ที่เรียกว่าเทคโนโลยีการสร้างภาพสามมิติจากภาพถ่ายจุลทรรศน์อิเล็กตรอนที่ถ่ายที่อุณหภูมิเย็นยิ่งยวด หรือ cryoEM ซึ่งหลักๆ ก็คือการเอาโปรตีนมาแช่แข็งที่อุณหภูมิต่ำมากๆ แล้วเอาไปถ่ายภาพผ่านกล้องจุลทรรศน์อิเล็กตรอนที่ความละเอียดสูง ก่อนที่จะเอาภาพที่ได้มาวิเคราะห์สร้างเป็นโครงสร้างโปรตีนสามมิติในคอมพิวเตอร์

ซึ่งแม้จะง่ายกว่าและเร็วกว่าการหาโครงสร้างโปรตีนโดยการตกผลึกอย่างมหาศาล แต่เทคโนโลยี cryoEM ก็ยังค่อนข้างจำกัดอยู่ในวงแคบๆ (เมืองไทยก็ยังไม่มี)

ที่จริงโครงสร้างสามมิติของโปรตีนหนามและเอนไซม์ต่างๆ ของไวรัสโควิด-19 ที่จำเป็นมากในการพัฒนาวัคซีน ชุดตรวจและยาต้านไวรัส รวมถึงสามารถช่วยระบุผลของการกลายพันธุ์หนีภูมิต้านทานจากวัคซีนของไวรัสสายพันธุ์กลายต่างๆ ก็ล้วนแล้วแต่มาจาก cryoEM เกือบทั้งสิ้น

หลายคนเชื่อว่า cryoEM จะเป็นเทคโนโลยีที่ทำให้แนวคิด structural genomics หรือการหาโครงสร้างสามมิติของโปรตีนทุกตัวในจีโนมของมนุษย์เป็นจริงขึ้นมาได้

แต่ดูเหมือนว่า cryoEM ก็ยังมาช้าเกินไป

 

ไม่เล่นใหญ่ ไม่ใช่กูเกิล การประกาศตัวครั้งใหม่ของดีปมายด์อัลฟ่าโฟลด์ 2 หลังจากที่เพิ่งจะเสียท่าตีพิมพ์ปะทะกับโรเบตตาไปเพียงแค่สัปดาห์เดียวทำให้ดีปมายด์สามารถชิงบัลลังก์แห่งผู้นำคืนมาได้อย่างสวยๆ

แนวคิด structural genomics ที่นักวิจัยมากมายพยายามผลักดันกันมานานนับทศวรรษกลายเป็นความจริงแล้ว!!

ด้วยความร่วมมือกับห้องปฏิบัติการอณูชีววิทยายุโรป (European Molecular Biology Laboratory, EMBL) กูเกิลดีปมายด์เปิดคลังข้อมูลโครงสร้างสามมิติของโปรตีนทุกตัวในมนุษย์รวมทั้งของสิ่งมีชีวิตอีกหลากหลายชนิดทำนายโดยเอไออัลฟ่าโฟลด์ 2 ให้ดาวน์โหลดไปวิจัยต่อยอดได้ตามอัธยาศัย ทุกอย่างเป็นสาธารณะ

ของเล่นชิ้นใหม่ของนักวิจัยชีวเคมีอภินันทนาการจากดีปมายด์ชิ้นนี้ อาจจะนำไปสู่การพัฒนายาต้านมาลาเรีย ยาต้านมะเร็ง หรือแม้แต่แนวคิดในการออกมาตรการแก้ปัญหาเชื้อดื้อยาก็อาจจะเป็นไปได้

ทว่าการทำนายก็ยังเป็นการทำนาย แม้ว่าเอไอของดีปมายด์จะเก่งเพียงใด แต่ด้วยข้อมูลตั้งต้นที่มีจำกัด โอกาสทำนายผิดก็ยังเกิดขึ้นได้ คงไม่น่าแปลกใจที่อาจจะต้องมีการแก้ไขฐานข้อมูลอยู่บ้างในอนาคต เมื่อมีข้อมูลจริงที่มาจากผลึกหรือ cryoEM เติมเข้ามา

แต่ตอนนี้ ได้มาแค่นี้ สำหรับนักชีวเคมี ก็นอนหลับฝันดีไปหลายคืนแล้ว

 

ต้องบอกว่าก้าวนี้ของดีปมายด์เป็นการพลิกกลับมานำได้อย่างมีสไตล์

ก็คงต้องรอดูต่อไปแล้วล่ะครับว่าโรเบตตาจะเดินเกมโต้กลับด้วยกลยุทธ์แบบใดต่อไป

แต่ไม่ว่าใครจะเป็นผู้นำ ตราบใดที่เป็นโอเพ่นซอร์สแบบนี้ ทุกคนได้ประโยชน์

แหมมมม… แอบอิจฉาทีมดีปมายด์ การมีผู้นำฉลาดมีวิสัยทัศน์พลิกวิกฤตเป็นโอกาสได้มันดีอย่างนี้นี่เอง!

บทความก่อนหน้านี้นายกฯ ถกร่วมพื้นที่แดงเข้ม เว้นกรุงเทพฯ จ่อดัน ฉีดวัคซีนให้ได้ 1 ล้านโดส ต่อวัน!
บทความถัดไปState-Led Gentrification ในย่านเก่ากรุงเทพฯ (1)/พื้นที่ระหว่างบรรทัด ชาตรี ประกิตนนทการ