เอไอ ‘มโน’ โปรตีน | ป๋วย อุ่นใจ

ดร. ป๋วย อุ่นใจ

หลายคนเคยตั้งคำถามว่า อาชีพอะไร “เอไอ” จะมาแทนไม่ได้?

และหนึ่งในอาชีพที่หลายคนคิดว่าเอไอไม่น่าจะมามีผลกระทบได้ก็คืออาชีพที่ต้องใช้ความคิดสร้างสรรค์และทักษะแห่งปลายพู่กันอันวิจิตรตระการตาอย่างอาชีพ “ศิลปิน”

ตอนนี้หลายคนเริ่มไม่ค่อยมั่นใจแล้วว่าคำทำนายนั้นจะเป็นจริงอยู่หรือเปล่า เพราะในเวลานี้ เอไอสามารถจินตนาการและรังสรรค์ออกมาเป็นงานศิลป์แบบจับต้องได้อย่างน่าอัศจรรย์ “แค่ต้องพิมพ์ให้ถูกว่า อยากได้รูปแบบไหน สไตล์ใด แค่นั้น”

แม้จะเปิดตัวกันแบบค่อยๆ เป็นข่าวเบาๆ กรุบกริบ ไม่ได้ยิ่งใหญ่จนเป็นที่โจษขานกันไปทั่วหรือเป็นทอล์กออฟเดอะทาวน์ในคราวเดียวเหมือนหลายๆ นวัตกรรม

แต่ด้วยความสามารถที่ล้นเหลือของเอไอสร้างภาพสุดล้ำอย่าง ดัลลี 2 (DALL?E 2) และมิดเจอร์นีย์ (midjourney) ก็ได้สร้างแรงกระเพื่อมครั้งใหญ่ให้วงการศิลปะ เพราะพวกมันทำให้การสร้างภาพจากจินตนาการนั่นทำได้ง่ายดาย แค่เพียงจรดปลายนิ้วลงบนคีย์บอร์ดแล้วพิมพ์คำสั่งแค่ไม่กี่คำ!

แค่เพียงพริบตา ภาพแห่งฝัน มโนโดยศิลปินเอไอก็จะปรากฏขึ้นมา ให้เอาไปเลือกใช้ได้ตามอัธยาศัย ไม่ต้องไปตามหาว่าจ้างนักวาดอาชีพ

ดีสำหรับวงการบิสซิเนส เพราะจะเอาภาพแบบไหนอย่างไรก็ทำได้ง่าย ไว สวย แก้แบบได้เรื่อยๆ จนกว่าจะได้ดั่งใจ ได้ความรู้สึกของความเป็นเจ้าของ และที่สำคัญราคาถูกจนเหมือนได้เปล่า

การพัฒนาของศิลปินเอไอที่ชาญฉลาดเช่นนี้อาจเป็นเหมือนดาบสองคม ในมุมของวงการศิลปะ กระแสตื่นเอไอจะทำให้งานศิลป์จำนวนมากมายมหาศาลถูกสร้างขึ้นมาในเวลาอันสั้นโดยเอไอและศิลปินผู้ใช้คีย์บอร์ด

แต่ก็อาจจะเป็นอุปสรรคที่ทำให้ศิลปินที่มีผลงานโดดเด่นเป็นเอกลักษณ์ ฉีกกรอบและนำเทรนด์แห่งวงการศิลปะ อย่างปิกัสโซ่ (Pablo Picasso) แวนโก๊ะ (Vincent van Gogh) หรือพอลล็อก (Jackson Pollock) นั้น มีโอกาสฉายแววได้ยากขึ้นกว่าเดิม

ในช่วงเดียวกับที่ในวงการศิลปะเริ่มมีกระแสตื่นเอไอ นักวิจัยในวงการเทคโนโลยีชีวภาพก็เริ่มพัฒนาเอไอแบบเดียวกันกับ “มิดเจอร์นีย์” และ “ดัลลี 2” ขึ้นมาเหมือนกัน แต่ไม่ใช่เพื่อการสร้างภาพมโนจากความฝัน แต่เพื่อรังสรรค์โครงสร้างโปรตีนแบบใหม่ๆ!

“ในธรรมชาติ โปรตีนสามารถแก้ปัญหาในสิ่งมีชีวิตได้แทบทุกอย่าง ตั้งแต่เก็บเกี่ยวพลังงานจากแสงอาทิตย์ ไปจนถึงการสร้างโมเลกุลใหม่ๆ” เดวิด เบเกอร์ (David Baker) หนึ่งในนักวิจัยโครงสร้างโปรตีนที่โด่งดังที่สุดในยุคจากมหาวิทยาลัยวอชิงตัน ซีแอตเติล (University of Washington Seattle) เปรย “ทุกสิ่งในชีววิทยานั้นเกิดขึ้นได้จากโปรตีน”

โปรตีนเป็นสายโซ่ที่ประกอบขึ้นมาจากกรดอะมิโน (จำนวน 20 ชนิด) มาเรียงต่อกันเป็นสายยาวนับร้อยนับพันตัว

ลำดับของกรดอะมิโนที่เรียงกันในสายโซ่จะแตกต่างกันไปตามชนิดโปรตีน ซึ่งสายโซ่ของโปรตีนนี้จะม้วนพับเป็นโครงสร้างสามมิติที่ซับซ้อนที่จะช่วยให้พวกมันสามารถทำหน้าที่ต่างๆ เพื่อช่วยเกื้อหนุนสิ่งมีชีวิตให้สามารถดำรงอยู่ได้

อาทิ เร่งปฏิกิริยาทางชีวเคมีจำเป็น เป็นตัวรับส่งสัญญาณระหว่างเซลล์ หรือแม้แต่เป็นโครงสร้างค้ำจุนภายในเซลล์

การเข้าใจโครงสร้างโปรตีนอย่างถ่องแท้ จนถึงขนาดสามารถออกแบบโครงสร้างโปรตีนใหม่ๆ ขึ้นมาเองนั้น คือหนึ่งในความฝันที่เดวิดอยากจะผลักดันมาตั้งแต่เริ่มก่อตั้งห้องทดลองของเขาที่ซีแอตเติล

เขาและทีมได้พัฒนาซอฟต์แวร์โรเซตตา (Rosetta) ขึ้นมาตั้งแต่ปี 1998 เพื่อทำนายโครงสร้างของโปรตีนด้วยคุณสมบัติทางเคมี (ab initio prediction) และสร้างซอฟต์แวร์โรเซตตาดีไซน์เพื่อช่วยในการออกแบบการม้วนพับของโปรตีนแบบใหม่ๆ ตั้งแต่ปี 2000

 

แม้ว่าโรเซตตาจะสร้างชื่อให้เขาอย่างมหาศาล แต่เดวิดก็ตระหนักดีว่าองค์ความรู้ที่มีทางชีวเคมีเกี่ยวกับโครงสร้างของโปรตีนในเวลานั้นมีอยู่น้อยมากๆ น้อยเกินกว่าที่จะสามารถเอามาใช้พัฒนาอัลกอริธึ่มให้สามารถทำนายโครงสร้างอันซับซ้อนของโปรตีนได้จริง หนทางที่จะต้องเดินต่อไปเพื่อให้เข้าใจหนึ่งในปัญหาระดับ holy grail ในทางชีววิทยานี้ได้นั้นยังอีกยาวไกล

ในปี 2008 เดวิดก็ได้เริ่มชิมลางเส้นทางใหม่ เขาและทีมวิจัยเปิดตัวเกมคอมพิวเตอร์ “โฟลด์อิต (foldit)” ซึ่งเป็นเกม puzzle ที่ให้เหล่าเกมเมอร์จากทั่วโลกมาช่วยกันคราวด์ซอร์ซ (crowdsource) ระดมไอเดียในความพยายามเพื่อไขปริศนาโครงสร้างและการม้วนพับอันซับซ้อนของโปรตีน

การลงทุนลงแรงไปกับการพัฒนาเกมโฟลด์อิตของเดวิด ถือเป็นการเดินหมากแบบถูกตา เพราะเกมนี้นอกจากจะสร้างชื่อเสียงให้กับเดวิดแบบถล่มทลายแล้ว เขายังได้ไอเดียใหม่ๆ เกี่ยวกับการม้วนพับของโปรตีนจากเกมนี้อีกมากโข

ในช่วงปลายทศวรรษที่ 2019s เดวิดได้เริ่มเปิดตัวซีรีส์ของโปรตีนที่มีการม้วนพับเป็นเอกลักษณ์สามารถนำไปประยุกต์ใช้ได้ในหลากหลายอุตสาหกรรมที่ออกแบบโดยทีมวิจัยของเขา

ทว่า แม้เดวิดจะออกแบบจะโปรตีนแบบใหม่ๆ ได้สำเร็จ สัมฤทธิผลสมประสงค์ แต่เปอร์เซ็นต์ที่พิมพ์เขียวของโปรตีนที่เขาสร้างขึ้นมานั้นจะเอามาใช้ได้จริงนั้นยังต่ำเตี้ยเรี่ยดิน

ออกแบบในคอมพ์มาเป็นร้อย พอเอามาสร้างขึ้นมาจริงๆ กลับใช้ได้ไม่กี่ตัว…

“พิมพ์เขียวของโปรตีนนั้นหายากที่จะม้วนพับเป็นรูปร่างตามต้องการเมื่อสร้างขึ้นมาในแลบ และมักจะไปกระจุกอยู่ในโครงสร้างแบบอื่นๆ (ที่ไม่พึงประสงค์) เซอร์เกย์ อัฟชินนิคอฟ (Sergey Ovchinnikov) นักชีววิทยาจากมหาวิทยาลัยฮาร์วาร์ด (Harvard University) อดีตนักวิจัยจากทีมเดวิดเผย

“มันต้องมีอีกขั้นตอนหนึ่งที่จะไปกระทุ้งลำดับโปรตีนให้มันม้วนพับได้แค่รูปแบบเดียว คือรูปแบบที่เราอยากได้ ซึ่งคุณอาจจะต้องใช้คอมเป็นหมื่นตัว รันจ๊อบพร้อมกันเป็นสัปดาห์ๆ เพื่อการนี้”

 

แต่แล้ว โอกาสที่ความฝันจะเป็นจริงก็แว้บขึ้นมา ในช่วงปลายปี 2020 เมื่ออัลฟาโฟลด์ 2 เปิดตัวอย่างอลังการในการแข่งขันทำนายโครงสร้างโปรตีน “CASP” หรือ “Critical Assessment of Protein Structure Prediction” ที่จัดขึ้นจนเป็นธรรมเนียม ทุก 2 ปี

ความแม่นยำของการทำนายโครงสร้างและการม้วนพับโปรตีนของเอไออัลฟาโฟลด์ 2 นั้นน่าประทับใจ จนนักวิจัยหลายคนถึงกับยกนิ้วให้แล้วบอกว่า “เชื่อแล้วว่าเอไอเอาอยู่ ในเรื่องการม้วนพับของโปรตีน” สำหรับเดวิด นี่คือฝันที่เขาเคยฝัน ที่ไม่กล้าฝัน ที่คนธรรมดาคนหนึ่งไม่กล้าฝัน แต่อัลฟาโฟลด์ก็จัดมาให้

เดวิด (และนักวิจัยชีววิทยาเชิงโครงสร้างอีกมากมาย) จึงตั้งตารอเปเปอร์ตีพิมพ์เผยแพร่ผลงานของทีมดีปมายด์ (DeepMind) ทีมสตาร์ตอัพพัฒนาเอไอระดับเทพที่อยู่เบื้องหลังซอฟต์แวร์อัลฟาโฟลด์ 2 กันอย่างใจจดใจจ่อ

ทว่า หลังการเปิดตัวสุดอลังการจนเป็นข่าวระดับทอล์กออฟเดอะทาวน์ไปทั่ว พาดหัวในแทบทุกสื่อ (แม้แต่ CNN หรือ BBC ก็ยังกล่าวถึง) ทีมดีปมายด์กลับนิ่งราวกับใช้กลยุทธ์นิ่งสงบสยบทุกความเคลื่อนไหว ใครถามอะไรก็ตอบแบบอมพะนำ จนเวลาล่วงเลยไปหลายเดือน ก็ยังไม่ยอมเปิดเผยอัลกอริธึ่มของอัลฟาโฟลด์

แถมจอห์น จัมเปอร์ (John Jumper) หัวหน้าทีมอัลฟาโฟลด์ของดีปมายด์ก็ไม่ยอมออกมาบอกด้วยว่าจะเปิดอัลฟาโฟลด์ให้ใช้สาธารณะเมื่อไร แล้วจะเขียนเปเปอร์เปิดเผยอัลกอริธึ่มออกมาให้อ่านกันหรือไม่

ทำแบบนี้ เหมือนหลอกให้อยากแล้วจากไป จากความหวังก็กลายเป็นกริ้วโกรธโกรธา

เดวิดและทีมจึงเริ่มรวบรวมข้อมูลทั้งหมดที่จอห์นและทีมอัลฟาโฟลด์เคยบรรยายในที่ต่างๆ ปะติดปะต่อจนเริ่มเข้าใจกระบวนการ แล้วพัฒนาเอไอของตัวเองขึ้นมาสู้ซะเลย ทีมเดวิดเรียกเอไอของพวกเขาว่าโรเซตตาโฟลด์ (RoseTTAFold)

เขาเร่งเขียนเปเปอร์และรีบส่งไปตีพิมพ์ในวารสาร Science ซึ่งก็ออกมาชนกันพอดีกับเปเปอร์อัลฟาโฟลด์ของจอห์นที่ลงใน Nature เหมือนเดินหมากถูกตาอีกครั้ง การพัฒนาโรเซตตาโฟลด์ของเดวิด ทำให้เขาได้รางวัล 2021 Breakthrough of the Year

 

เมื่อทำนายได้แม่นยำ ก็ต้องออกแบบได้เหมือนกัน เดวิดมั่นใจ และกระตุ้นให้ทีมช่วยกันดันไอเดียเรื่องการออกแบบโปรตีนต่อ

“สิ่งที่เรารู้ก็คือโปรตีนที่พบทั้งหมดในพืช สัตว์และจุลินทรีย์นั้นเป็นแค่ส่วนน้อยที่น้อยกว่าหนึ่งเปอร์เซ็นต์ของโปรตีนที่เป็นไปได้ทั้งหมด ด้วยซอฟต์แวร์ใหม่ๆ พวกนี้เราน่าที่จะหาทางออกให้กับความท้าทายที่ยังแก้ไม่ได้ทั้งทางการแพทย์ พลังงานและเทคโนโลยี” เดวิดกล่าว แน่นอนด้วยการออกแบบโปรตีนใหม่ๆ มาแก้ปัญหา

แม้จะเป็นนักชีววิทยา แต่เซอร์เกย์ก็มีแนวคิดเป็นแฮ็กเกอร์ ถ้าต้องการมโนลำดับโปรตีนให้มันม้วนพับได้แค่รูปแบบเดียว คือรูปแบบที่อยากให้เป็น จะต้องทำอย่างไร

เขาเริ่มยัดเยียดลำดับกรดอะมิโนแปลกๆ ที่ไม่มีอยู่จริงมากมายมหาศาลให้เอไอทั้งสอง (อัลฟาโฟลด์และโรเซตตาโฟลด์) ทำนายโครงสร้างออกมา ซึ่งบางทีก็ให้ผลออกมาดูดี บางทีก็ออกมาเละๆ เทะๆ และบางทีก็ดีบ้าง เละบ้างแบบเป็นท่อนๆ

เซอร์เกย์เริ่มได้ไอเดีย เขาโยนลำดับโปรตีนแบบสุ่มลงไปให้เอไอทำนายโครงสร้าง และค่อยๆ ปรับแต่งลำดับไปเรื่อยๆ จนได้โปรตีนที่ม้วนพับตามต้องการทั้งตัว เขาเรียกเทคนิคนี้ของเขาว่า “การมโน” หรือ “Hallucination”

เดวิดตั้งชื่อซอฟต์แวร์ตัวใหม่เน้นมโนนี้ว่า ProteinMPNN

หลังจากที่ลองมโนโปรตีนตัวเล็กๆ ไปราวๆ ร้อยกว่าตัว เซอร์เกย์พบว่าราวๆ หนึ่งในห้าของโปรตีนที่ได้จากเทคนิคการมโนโดย ProteinMPNN จะม้วนพับออกมาถูกต้องตามที่ออกแบบ พวกเขาเริ่มได้ใจและเริ่มมโนอะไรที่ใหญ่กว่านั้น พวกเขาเริ่มมโนโปรตีนที่จะมารวมตัวกันเองแล้วประกอบเป็นโครงสร้างโปรตีนขนาดต่างๆ กันได้ตามที่ต้องการ ซึ่งอาจจะเป็นประโยชน์ในการพัฒนาจักรกลโปรตีนที่ซับซ้อนหรือแม้แต่พัฒนาวัคซีนโปรตีนเจเนอเรชั่นใหม่ๆ ได้

ก็แค่ใส่ข้อมูลสิ่งที่ต้องการเข้าไป ไม่ต่างอะไรกับมิดเจอร์นีย์ หรือดัลลี 2…