สงครามปัญญาประดิษฐ์ ไขปริศนาจักรกลนาโน/ทะลุกรอบ ป๋วย อุ่นใจ

ดร. ป๋วย อุ่นใจ

ทะลุกรอบ

ป๋วย อุ่นใจ

 

สงครามปัญญาประดิษฐ์

ไขปริศนาจักรกลนาโน

 

เป็นข่าวครึกโครมอีกครั้ง เมื่อนักวิจัยจากมหาวิทยาลัยวอชิงตัน (University of Washington Seattle) และเหล่าพันธมิตรร่วมกันกระตุกหนวดเสือแห่งวงการปัญญาประดิษฐ์อย่างกูเกิลดีปมายด์ (Google Deepmind) ด้วยการตีพิมพ์เปเปอร์แบบแบ็กทูแบ็ก (ในวงการคือตีพิมพ์ผลงานวิจัยลงวารสารวิทยาศาสตร์แนวหน้าระดับท็อปแบบปกต่อปก)

ดีปมายด์ตั้งขึ้นมาตั้งแต่ปี 2010 และเข้าร่วมกับกูเกิลเมื่อปี 2014 เป็นหนึ่งในบริษัทเอไอฝีมือดีที่ฮอตที่สุดในยุคนี้

หลังจากที่เอไออัลฟ่าโกะ (AlphaGo) ของพวกเขาสามารถทำลายสถิติปราบเซียนโกะระดับโลกลงได้อย่างราบคาบได้สำเร็จจนเป็นข่าวใหญ่ไปทั่วโลก ในปี 2016 จนแชมป์โลกอย่างลี เซดอล (Lee Sedol) ถึงขนาดยอมออกมาประกาศอำลาวงการ

“ด้วยการเปิดตัวของเอไอในเกมของโกะ ผมได้ตระหนักว่าผมไม่ได้อยู่บนสุดอีกแล้ว แม้ว่าผมจะกลายเป็นเบอร์หนึ่ง แต่ก็ยังมีอีกสิ่งหนึ่งที่ไม่มีใครจะโค่นลงได้”

 

ดีปมายด์ได้ฤกษ์เปิดตัวอีกรอบอย่างอลังการในตอนปลายปี 2020 อัลฟ่าโฟลด์ (AlphaFold) เอไอตัวใหม่ของพวกเขาได้รางวัลชนะเลิศการแข่งขันทำนายโครงสร้างสามมิติของโปรตีน CASP หรือชื่อเต็มคือ Critical Assessment of Structure Prediction ที่จัดขึ้นมาอย่างต่อเนื่องแล้วเกือบยี่สิบปี

เป็นอีกครั้งที่เอไอสามารถเอาชนะทีมผู้เชี่ยวชาญที่คร่ำหวอดอยู่ในวงการโปรตีนจากมหาวิทยาลัยดังๆ ระดับท็อปๆ ทั่วโลกนับร้อยทีมที่เข้าร่วมแข่งขัน ไม่มีใครอยากเชื่อว่าเอไอจะสามารถแก้ปัญหาเรื่องโครงสร้างสามมิติของโปรตีนที่นักวิจัยหลายคนมองว่าเป็นเหมือนกับ “จอกศักดิ์สิทธิ์ (holy grail)” ในวงการชีววิทยาและชีวเคมี

ไม่มีใครคาดคิด แต่ม้ามืดตัวนี้มาทีเดียวก็วิ่งเข้าวิน เล่นเอาหลายคนช็อก จนวารสารดังอย่าง Nature, Science และ MIT Technology Review ต่างก็เอาไปพาดหัวทำนองว่าเอไอมาแล้ว

และนี่จะพลิกวงการชีววิทยาไปอย่างกู่ไม่กลับ

ภาพโครงสร้างสามมิติของโปรตีนอินเตอร์ลิวคิน-12 กำลังจับกับโปรตีนตัวรับของมัน ทำนายโดยโรเซ็ตต้าโฟลด์ (ภาพโดย Ian Haydon, UW Medicine Institue for Protein Design)

ถ้ามองลึกเข้าไปในมุมของชีวเคมี ทุกกระบวนการภายในร่างกายของเราขับเคลื่อนด้วยปฏิกิริยาเคมีทั้งสิ้น ซึ่งโปรตีนก็เป็นเหมือนจักรกลจิ๋วระดับนาโน (หนึ่งนาโนเมตร คือ หนึ่งในพันล้านเมตร) ที่ควบคุมปฏิกิริยาเคมีแทบทุกสิ่งอย่างภายในเซลล์ทำให้เซลล์สามารถดำรงอยู่และดำเนินชีวิตต่อไปได้

โครงสร้างของโปรตีนหลักๆ ประกอบไปด้วยกรดอะมิโนนับร้อย (บางทีก็เป็นพัน) ตัวมาเรียงต่อกันเป็นสายยาว และถ้าจะให้สามารถทำงานได้ สายโปรตีนจะต้องม้วนพับตัวเป็นโครงสร้างสามมิติที่จำเพาะเท่านั้น และเนื่องจากโปรตีนแต่ละชนิดก็จะมีลำดับของกรดอะมิโนไม่เหมือนกัน แบบแผนในการม้วนพับจึงมักไม่เหมือนกันไปด้วย ทำให้ปัญหานี้ซับซ้อนมากยิ่งขึ้นไปอีก

แม้ว่านักวิจัยจะเข้าใจแล้วว่าลำดับพันธุกรรมที่เข้ารหัสอยู่ในสายดีเอ็นเอนั้นเป็นเช่นไร และถ้าถูกถอดออกมาเป็นลำดับของเอ็มอาร์เอ็นเอแล้วจะมีรหัสแบบไหน แล้วถูกแปลรหัสต่อไปจนเป็นลำดับของกรดอะมิโนในโปรตีน แต่แค่ลำดับนั้นไม่สามารถบอกได้ว่าโปรตีนนั้นทำงานอะไรหรืออย่างไร ถ้าอยากรู้คือต้องเข้าใจโครงสร้างที่ม้วนพับกันเป็นสามมิติให้ได้

และนั่นคือสิ่งที่ท้าทาย

 

นั่นคือสาเหตุที่นักชีวเคมีหลายๆ คนคาดหวังที่จะหาและเข้าใจโครงสร้างสามมิติของโปรตีนภายในเซลล์ได้ทุกตัวที่ความละเอียดพอที่จะเห็นแต่ละอะตอมในโมเลกุลของโปรตีนได้อย่างชัดเจน

ซึ่งนั่นจะทำให้พวกเขาสามารถเข้าใจกลไกของโปรตีนโดยละเอียดจนสามารถออกแบบโปรตีนชนิดใหม่เพื่อให้มีการม้วนพับและคุณสมบัติที่เหมาะสมในการเร่งปฏิกิริยาใหม่ๆ ตามที่ออกแบบไว้ได้ ซึ่งจะมีคุณูปการใหญ่หลวงทั้งในวงการยา วงการเภสัช และเทคโนโลยีชีวภาพ

ความรู้ความเข้าใจในเรื่องโครงสร้างสามมิติของโปรตีนจึงเป็นสิ่งที่นักวิจัยหลายคนคิดว่าคือ “คำตอบสุดท้าย” ของการเข้าใจชีวิต

นักวิจัยหลายคนเชื่อว่าถ้ามนุษย์เราสามารถเข้าใจโครงสร้างสามมิติที่บ่งชี้ถึงการม้วนพับของโปรตีนได้ เราก็จะสามารถออกแบบและควบคุมการทำงานของโปรตีนได้ ทำให้เราสามารถควบคุมปฏิกิริยาเคมีต่างๆ ภายในเซลล์ได้ หรือแม้แต่เปลี่ยนแปลงชะตาชีวิตของเซลล์ไปเลยก็ได้

ถ้าคุณเข้าใจโครงสร้างของโปรตีนหนาม (spike) ของโควิด และโครงสร้างของ ACE-2 ที่เป็นโปรตีนตัวรับบนผิวเซลล์ของมนุษย์ คุณก็จะบอกได้ว่าโควิดยึดติดกับเซลล์แล้วเข้าติดเชื้อภายในเซลล์ได้อย่างไร

และถ้าคุณเข้าใจโครงสร้างของเชื้อโควิดกลายพันธุ์ว่ามีการเปลี่ยนกรดอะมิโนตัวไหนบ้างแล้วมันไปเกี่ยวข้องกับการยึดจับกับ ACE-2 หรือเปล่า ก็จะทำนายได้ว่าโควิดพันธุ์กลายตัวไหนที่น่าจะจับกับ ACE-2 ได้แน่นกว่าและน่าจะส่งผลแพร่กระจายได้เก่งกว่า

และถ้ารู้โครงสร้างของแอนติบอดี และทราบตำแหน่งที่จับของแอนติบอดี้บนโปรตีนหนาม ก็จะทำนายได้ว่าแอนติบอดี้ดังกล่าวจะสามารถยับยั้งเชื้อโควิดได้หรือไม่ โดยเฉพาะอย่างยิ่งในสายพันธุ์ที่กลายไปแล้ว

นักวิจัยจึงตื่นเต้นและรอวันที่ฟังไอเดียเบื้องหลังอัลฟ่าโฟลด์ 2

นี่คือความหวังที่หลายๆ คนอยากรอฟังและอยากทำความเข้าใจ พวกเขาคาดหวังว่าเทคโนโลยีนี้ของดีปมายด์อาจจะเป็นกุญแจสำคัญที่จะนำไปสู่การไขปริศนาแห่งการม้วนพับของโปรตีน และจะช่วยให้ความฝันที่จะเข้าใจโครงสร้างโปรตีนทุกตัวภายในเซลล์ของสิ่งมีชีวิตนั้นเป็นจริงขึ้นมาได้

 

แม้ว่านักวิจัยจากดีปมายด์จะได้ขึ้นบรรยายเกี่ยวกับอัลกอริธึ่มของเอไอ อัลฟ่าโฟลด์ 2 ของพวกเขาไปตั้งแต่วันที่ 1 ธันวาคม 2020 ที่งานประชุมประจำปีของการแข่งขัน CASP แต่นักวิจัยหลายคนต่างก็รู้สึกว่าทางทีมดีปมายด์บรรยายแบบระแวดระวังแบบสุดๆ เรียกว่าข้อมูลแทบจะไม่มีหลุดอะไรออกมาเลยแม้แต่น้อย

คาดหวังเอาไว้มาก แต่การบรรยายแบบไม่ค่อยจะยอมเปิดเผยข้อมูลอะไรเลยแบบนี้สร้างความหงุดหงิดใจระคนโกรธเกรี้ยวให้กับนักวิจัยมากมายในวงการวิจัยโปรตีน

“น่าตื่นเต้นอย่างที่สุด แต่ก็น่าผิดหวังมากๆ” เดวิด เอการ์ด (David Agard) นักชีวฟิสิกส์ชื่อดังจากมหาวิทยาลัยแคลิฟอร์เนีย ซานฟรานซิสโก ให้ความเห็นหลังการบรรยายของทีมดีปมายด์

เดวิด เบเกอร์ (David Baker) ผู้อำนวยการสถาบันเพื่อการออกแบบโปรตีน (Institute of Protein Design) มหาวิทยาลัยวอชิงตันในซีแอตเติล (University of Washington Seattle) เสริม “ในวงการวิชาการ นี่คือหายนะและความน่าเศร้าใจ” ก่อนที่จะเปรยต่อว่า

“ถ้าใครสักคนแก้ปัญหาที่คุณพยายามจะแก้อยู่ได้แล้ว แต่อมพะนำไม่ยอมบอกว่าแก้ได้ยังไง แล้วคุณจะยังทำงานนี้ต่อไปได้ยังไง”

 

แต่ถึงจะบรรยายแบบกั๊ก แต่สำหรับนักวิจัยตัวจริง ชำนาญงาน ประสบการณ์เยอะ แค่เข้าฟังแบบแป๊บๆ ก็จุดประกายไอเดียใหม่ๆ ได้แล้ว

มินคยุงเบก (Minkyung Baek) นักวิจัยจากห้องปฏิบัติการของเดวิดที่ซีแอตเติล บอกว่า เธอแทบจะรอไม่ไหวที่จะทดสอบไอเดียต่างๆ ที่เธอปิ๊งปั๊งขึ้นมาหลังจากที่ฟังเล็กเชอร์ เธอ เดวิด และทีมพันธมิตรเริ่มคุยและระดมสมอง แม้ดีปมายด์จะไม่ยอมบอก แต่จะแกะให้ออกและจะก๊อบ (replicate) ให้ได้ดีเทียบเท่ากับของอัลฟ่าโฟลด์ 2

หลังจากนั้นไม่ช้าไม่นาน เบกและทีมได้พัฒนาโรเซ็ตต้าโฟลด์ (RoseTTaFold) ขึ้นมา ซึ่งทำงานได้ดีชนะคู่แข่งอื่นๆ ใน CASP ได้อย่างฉลุยแทบจะไม่ต่างจากอัลฟ่าโฟลด์ 2

จะแพ้ก็มีอยู่ตัวเดียวก็คือ อัลฟ่าโฟลด์ 2 เวอร์ชั่นออริจินอลของกูเกิลนั่นแหละ

 

“ยังมีอะไรอีกหลายอย่างที่เราอยากจะทำในวงการนี้” พุชมีต โคห์ลี (Pushmeet Kohli) หัวหน้าทีมเอไอเพื่อวิทยาศาสตร์ที่ดีปมายด์กล่าว พวกเขาร่วมงานกับนักวิจัยและองค์กรที่เขาอยากร่วมด้วย เช่น องค์กรไม่แสวงผลกำไร “ยาเพื่อโรคที่ถูกมองข้าม (Drugs for Neglected Diseases Initiative)” ในเจนีวา สวิตเซอร์แลนด์ เพื่อช่วยดูว่าจะใช้อัลฟ่าโฟลด์ 2 ในการช่วยหาโครงสร้างของเป้าหมายยาและช่วยเร่งสปีดการพัฒนายาสำหรับโรคที่บริษัทยาอาจจะไม่สนใจ

“ผมคิดว่านี่คือสิ่งที่สำคัญที่สุดแล้วที่เราเคยทำมา ในแง่ของผลกระทบในโลกของความเป็นจริง” เดมิส ฮัสซาบิส ผู้บริหารดีปมายด์ กล่าว

แต่เดวิด เบเกอร์มองต่างมุม เขาอยากให้การพัฒนานี้ เป็นงานแบบโอเพ่นซอร์ส ไม่ใช่ปกปิด เพื่อทดสอบระบบ เบกและเดวิดได้เชื้อเชิญให้นักวิจัยทั่วโลกส่งลำดับโปรตีนที่ยากที่สุดที่ยังแก้ไม่ตกในเรื่องโครงสร้างมาให้โรเซ็ตต้าโฟลด์ได้ลองทำนายดู เมื่อวันที่ 1 มิถุนายน 2021 แค่ในเดือนแรก พวกเขาได้โจทย์เป็นโปรตีนมา 56 ตัว ที่ในตอนนี้ทำนายได้สำเร็จเป็นโครงสร้างแล้ว

ไม่กี่ชั่วโมงหลังจากที่ส่งข้อมูลลำดับกรดอะมิโนไปซีแอตเติล เอการ์ดก็ได้ชื่นชมโครงสร้างของโปรตีนของเขาในออฟฟิศซานฟรานซิสโก “นี่น่าจะเซฟเวลาพวกเราได้หลายปี” เอการ์ดชื่นชม ตอนนี้เขาก็พร้อมที่จะออกแบบงานวิจัยเพื่อพิสูจน์บทบาทหน้าที่ของโปรตีนที่เขาสนใจต่อได้แล้ว

 

1กรกฎาคม 2021 ทีมวิจัยของเดวิดก็เลยปล่อยซอร์สโค้ดของโรเซ็ตต้าโฟลด์ให้คนโหลดได้จากเน็ต

ซึ่งเพียงแค่แป๊บเดียวก็มีคนคนโหลดไปแล้วกว่า 250 ครั้ง

แถมยังสร้างเซิร์ฟเวอร์ทำนายโครงสร้างโดยใช้อัลกอริธึ่มของโรเซ็ตต้าโฟลด์ไว้ให้นักวิจัยสามารถไปลองใช้ได้อีกในเว็บ

เดวิดเผยว่า ตอนนี้เซิร์ฟเวอร์ของเขาเริ่มมีผู้ใช้แล้วราวๆ 500 คน และได้ทำนายโครงสร้างโปรตีนใหม่ๆ ไปแล้วมากกว่า 5,000 ตัว

และที่เด็ดกว่าคือดีปมายด์อัลฟ่าโฟลด์ 2 ทำได้แค่ทำนายโครงสร้างโปรตีนตัวเดียว แต่โรเซ็ตต้าโฟลด์สามารถทำนายโครงสร้างเชิงซ้อนที่ประกอบกันขึ้นมาจากโปรตีนหลายตัว (protein complex) ได้ด้วย แต่ยังไงก็ต้องยอมรับว่าถ้าเทียบความแม่นยำถูกต้อง โรเซ็ตต้าโฟลด์ก็ยังสู้ดีปมายด์ไม่ได้

การปล่อยซอร์สโค้ดแบบไม่มีปี่มีขลุ่ยและเผยชัดๆ ว่าพร้อมจะตีพิมพ์เปเปอร์โรเซ็ตต้าโฟลด์ของทีมซีแอตเติลและพันธมิตร ทำให้ทีมดีปมายด์ถึงกับร้อนอาสน์ต้องเร่งรีบเผยแพร่แนวคิดของพวกเขา

และในที่สุด เปเปอร์ของดีปมายด์ก็ออกมาพร้อมกันเป๊ะ เรียกว่าปกต่อปกกับของทีมซิแอตเติลเลย

และที่สำคัญก็บีบให้กูเกิลดีปมายด์ยอมปล่อยซอร์สโค้ดของอัลฟ่าโฟลด์ 2 ออกมาให้นักวิจัยสามารถทยอยไปโหลดมาทดลองใช้กันดูด้วย แม้ว่าตัวซอฟต์แวร์ของอัลฟ่าโฟลด์นั้นจะยังไม่ได้เป็นมิตรนักกับผู้ใช้ แต่ก็เริ่มพอมีคนสนใจไปโหลดมาทดลองใช้บ้างแล้ว

บางทีผมก็คิดถึงบรรยากาศการแข่งขันในเกมแห่งงานวิจัยแบบถึงลูกถึงคนแบบนี้นะ ตอนสมัยทำงานอยู่ต่างประเทศ การแข่งขันทำให้เรารู้ว่าเราหยุดไม่ได้ กระเสือกกระสนยังไงก็ต้องก้าวไปข้างหน้า เพราะเมื่อไรที่คุณหยุด คุณจะถูกทิ้งเอาไว้ข้างหลังทันที

แต่ในท้ายที่สุด ทุกการแข่งขันก็ “ควร” มีเป้าหมายเดียวกันคือ เพื่อสร้างคุณประโยชน์ให้แก่มวลมนุษยชาติ…