ที่มา | มติชนสุดสัปดาห์ ฉบับวันที่ 21 - 27 มีนาคม 2568 |
---|---|
คอลัมน์ | Biology Beyond Nature |
ผู้เขียน | ภาคภูมิ ทรัพย์สุนทร |
เผยแพร่ |
Biology Beyond Nature | ภาคภูมิ ทรัพย์สุนทร
EVO เมื่อเอไอปลดล็อกภาษาจีโนม (1)
(ประวัติศาสตร์อุตสาหกรรมไบโอเทค)
“เมื่อโครงข่ายประสาทเทียมฝึกเดาคำถัดไปในข้อความหลากหลายจากอินเตอร์เน็ตอย่างแม่นยำ มันกำลังเรียนรู้แบบจำลองของโลก แม้ผิวเผินอาจดูเหมือนแค่การจับความสัมพันธ์ทางสถิติในข้อความ แต่ความสัมพันธ์เหล่านั้นคือตัวแทนกระบวนการสร้างข้อความ คือภาพฉายของความเป็นจริง มุมสะท้อนของโลก ประสบการณ์ของผู้คน ภาวะของมนุษย์ ความหวัง ความฝัน แรงบันดาลใจ และปฏิสัมพันธ์ในสถานการณ์ต่างๆ ที่เราเผชิญ”
– Ilya Sutskever อดีตหัวหน้าทีมวิจัยและผู้ร่วมก่อตั้ง OpenAI

ปลายปีที่แล้วถึงต้นปีนี้มีงานวิจัยสำคัญสองชิ้นจาก Arc Institute นำโดยทีมนักวิจัยของ Stanford งานวิจัยว่าด้วยเอไอไขภาษาจีโนมตัวใหม่ที่ชื่อ EVO ซีรีย์บทความหลายตอนจากนี้จะพาทัวร์เนื้อหาสำคัญจากสองงานนี้
ตลอดประวัติศาสตร์ มนุษย์ทึ่งในความหลากหลายสุดอัศจรรย์ของสิ่งมีชีวิต จากไวรัสขนาดจิ๋วระดับนาโนที่แฝงตัวในเซลล์ ถึงแบคทีเรียรูปร่างพิลึกที่อยู่รอดแม้ในสภาพแวดล้อมสุดประหลาด ต้นไม้ยักษ์สูงเสียดฟ้า เห็ดรา สัตว์และมนุษย์ที่มีสัณฐาน และพฤติกรรมแตกต่างกันราวกับเป็นเอเลี่ยนจากคนละขอบจักรวาล
แต่ช่วงสองสามศตวรรษที่ผ่านมาวิทยาศาสตร์ได้ค้นพบว่าสิ่งมีชีวิตทั้งหลายล้วนมีองค์ประกอบปลีกย่อยที่คล้ายคลึงกันตั้งแต่เซลล์ลงไปถึงชีวโมเลกุลต่างๆ จนกระทั่งเมื่อราวหนึ่งศตวรรษก่อน เราก็ได้เรียนรู้ว่า “ดีเอ็นเอ” (DNA) คือสารพันธุกรรมที่บรรจุรายการคำสั่งสำหรับการสร้างและดำรงอยู่ของแต่ละชีวิต
ไม่ว่าสิ่งมีชีวิตสองชนิดจะดูต่างกันเพียงใด รหัสพันธุกรรมบนดีเอ็นเอของพวกมันก็ล้วนใช้ตัวอักษรเป็นลำดับเบสสี่ตัว-A, T, G และ C ซึ่งอาจจัดเรียงลำดับได้หลากหลายไม่จำกัด
นอกจากนี้ กลไกที่สิ่งมีชีวิตใช้ถ่ายทอดและนำข้อมูลลำดับเบสมาใช้งานก็ยังคล้ายคลึงกันจนเหลือเชื่อ
การค้นพบนี้ได้เปลี่ยนโฉมทั้งวงการชีววิทยาและเทคโนโลยีชีวภาพอย่างสิ้นเชิง ด้วย “ภาษาดีเอ็นเอ” ที่เป็นสากล การรู้ว่าชุดลำดับเบสทำงานอย่างไรในสิ่งมีชีวิตชนิดหนึ่งบอกใบ้ให้เรารู้ว่ามันทำงานเช่นไรในอีกสิ่งมีชีวิตหนึ่ง
องค์ความรู้ด้านพันธุศาสตร์โมเลกุลที่เคยกระจัดกระจายระหว่างต่างสิ่งมีชีวิตจึงอาจถูกนำมาร้อยเรียงเป็นเรื่องเดียว
องค์ความรู้พวกนี้ช่วยเราคาดการณ์ลักษณะทางพันธุกรรม วินิจฉัยโรคต่างๆ หรือแม้แต่ปรับแต่งออกแบบสิ่งมีชีวิตใหม่ให้มีคุณสมบัติที่ต้องการ

Cr.ณฤภรณ์ โสดา
ลองนึกภาพเด็กคนหนึ่งที่เพิ่งเรียนภาษาอังกฤษเป็นครั้งแรก สำหรับเขา “A” ถึง “Z” บนหน้ากระดาษเป็นเพียงอักขระที่ดูจะเรียงต่อกันมั่วๆ เอามาใช้อะไรไม่ได้จนกว่าเขาจะเรียนรู้คำ ไวยากรณ์ และโครงสร้างประโยค
การเรียงอักษรแต่ละชุดจึงค่อยๆ เผยความหมายเฉพาะตัว
อักษร A, P, P, L, E เรียงต่อกันตามลำดับนี้สื่อความหมายถึง “แอปเปิล” ผลไม้ชนิดหนึ่งลูกเท่ากำปั้นเปลือกแดงหรือเขียว เนื้อในสีขาวรสหวานอมเปรี้ยวมีเมล็ดเล็กๆ แข็งๆ ตรงกลาง
ส่วนเครื่องหมายวรรคตอนอย่าง “.” หรือ “!” ก็กำหนดรูปแบบการเชื่อมโยงประโยคที่ประกอบจากชุดคำที่มาเรียงกัน
เมื่อเขาเรียนรู้สิ่งเหล่านี้มากขึ้นเรื่อยๆ เขาก็จะเริ่ม “รู้หนังสือ” เขาจะสามารถอ่านตำราที่สอนเขาทำอาหาร อ่านคู่มือที่บอกวิธีซ่อมรถยนต์ หรือแต่งนิยายเขียนเรื่องสั้น ประพันธ์บทกวีของเขาเองได้
เช่นกัน ข้อมูลลำดับของเบส A, T, G, C จากสิ่งมีชีวิตก็ไม่มีความหมายใด ๆ จนกว่าเราจะเรียนรู้ว่าลำดับใดบ้างที่ประกอบกันเป็น “ยีน” ซึ่งเปรียบเสมือน “คำศัพท์” ในภาษาดีเอ็นเอ เราจะต้องเรียนรู้อีกว่ายีนแต่ละตัวนั้นทำหน้าที่อะไร และยีนหลายๆ ตัวจะทำงานประสานกันอย่างไร
เหมือนการประกอบคำเป็นประโยคเป็นย่อหน้าเพื่อสื่อความหมายซับซ้อน ความรู้พวกนี้ช่วยให้เราคาดการณ์ลักษณะของสิ่งมีชีวิต หรือปรับแต่งจีโนมให้เกิดคุณสมบัติตามต้องการ-ไม่ต่างอะไรจากเด็กที่เชี่ยวชาญภาษาอังกฤษจนสามารถอ่านและเขียนได้รู้เรื่อง
เส้นทางจากการเห็นแค่ตัวอักษรดิบๆไปสู่การเข้าใจความหมาย จึงเป็นกระบวนการคล้ายกันทั้งในการเรียนรู้ภาษาและการทำความเข้าใจพันธุกรรม
นักชีววิทยาเรียกลำดับตัวอักษรบนดีเอ็นเอว่า “จีโนไทป์” (genotype) และผลลัพธ์ที่มองเห็นหรือใช้งานได้จริงว่า “ฟีโนไทป์” (phenotype)
การพยายามหาความสัมพันธ์ระหว่างจีโนไทป์กับฟีโนไทป์-หรือเปลี่ยน “ตัวอักษร” ของบนดีเอ็นเอให้กลายเป็นความรู้ชีววิทยา-นับเป็นหัวใจของชีววิทยาและเทคโนโลยีชีวภาพยุคใหม่

Cr.ณฤภรณ์ โสดา
กลับมาที่การเปรียบเทียบเรื่องการเรียนภาษา หนึ่งในวิธีที่ง่ายที่สุดที่เด็กจะเข้าใจความหมายของ “apple” ก็คือการได้เห็น สัมผัส ดมกลิ่น และลิ้มรสแอปเปิลของจริง ขณะที่มีคนชี้ให้เขารู้จักคำว่า “apple” ไปพร้อมกัน
ในลักษณะเดียวกัน เด็กจะเข้าใจความหมายของประโยค “Mom eats an apple” หากเขาได้เห็นแม่กินแอปเปิลจริงๆ ขณะเรียนประโยคนี้ วิธีนี้ช่วยให้เด็กเชื่อมโยงตัวอักษร คำ และประโยคเข้ากับสิ่งที่เกิดขึ้นจริงในโลก
นักชีววิทยาสมัยก่อนก็ใช้หลักการศึกษาดีเอ็นเออย่างตรงไปตรงมาในแบบเดียวกัน เช่น เราอาจกำจัดหรือดัดแปลงยีน เพื่อสังเกตว่ามันจะเปลี่ยนแปลงลักษณะของสิ่งมีชีวิตอย่างไร เราอาจศึกษาคุณสมบัติทางชีวเคมีของอาร์เอ็นเอหรือโปรตีนที่ได้จากกระบวนการถอดรหัสดีเอ็นเอในหลอดทดลอง ฯลฯ
วิธีการเหล่านี้มอบหลักฐานตรงให้เห็นบทบาทเฉพาะของส่วนต่างๆ ในดีเอ็นเอ บอกเราว่าลำดับเบส (คำและประโยค) เชื่องโยงกับฟีโนไทป์ (ความหมาย) อย่างไร แต่การทดลองในห้องปฏิบัติการเช่นนี้อาจมีค่าใช้จ่ายสูง กินเวลานาน และหรือแม้แต่เป็นไปไม่ได้ในทางปฏิบัติ
เราไม่อาจเรียนรู้ทุกคำและทุกประโยคจากประสบการณ์ตรงในโลกความเป็นจริง เฉกเช่นเดียวกันเราก็ไม่อาจทำเรียนหน้าที่ของทุกชิ้นส่วนลำดับเบสดีเอ็นเอผ่านการทดลอง
โชคดีที่เด็กไม่ต้องมีประสบการณ์ตรงกับทุกสถานการณ์เพื่อจะเข้าใจภาษา สมมุติว่าเด็กคนหนึ่งรู้จักคำว่า “mom” พร้อมกับการเห็นแม่ตัวเป็นๆ แต่เมื่อเขาได้พบคำใหม่ๆ เช่น “mama” “mommy” หรือ “mother” ที่คล้ายกันในบริบทใกล้เคียง เด็กอาจเดาได้ว่าคำเหล่านี้สื่อถึงความหมายเดียวกัน
เขาอาจรู้จักแค่ “Mom eats an apple” ด้วยการเห็นแม่กินแอปเปิลจริงๆ แต่ก็ยังสามารถเข้าใจ “Dad eats an apple” หรือ “Mom eats a banana” หรือ “Mom throw a banana” แม้ไม่เคยเห็นเหตุการณ์ นั่นก็เพราะเขาได้เรียนรู้โครงสร้างของประโยคพื้นฐาน-ประธาน ตามด้วยกริยา ตามด้วยกรรม-รวมถึงความหมายของคำต่างๆ อย่าง “dad” “banana” และ “throw”
ในทางชีววิทยานักวิทยาศาสตร์ก็สามารถนำส่วนของ DNA ที่ยังไม่รู้หน้าที่มาเปรียบเทียบกับส่วนที่รู้จักอยู่แล้ว หากลำดับสองส่วนนี้มีความคล้ายกันมากและมาจากสิ่งมีชีวิตที่ใกล้เคียงกัน ก็มีโอกาสสูงที่มันจะทำหน้าที่คล้ายคลึงกัน
ด้วยเหตุที่ “ภาษาสี่ตัวอักษร” ของ DNA (A, T, G, C) เป็นสากลสำหรับสิ่งมีชีวิตทั้งหมดบนโลก การเดาผ่านการเปรียบเทียบแบบนี้กลายเป็นทางลัดที่ทรงคุณค่า เช่น หากพบยีนสำคัญในแบคทีเรีย ก็อาจใช้เป็นแนวทางในการตามหายีนที่มีบทบาทเดียวกันในพืชหรือสัตว์อื่นๆ ช่วยให้เราคาดการณ์หน้าที่ของยีนนั้นได้ โดยไม่จำเป็นต้องทดลองในสิ่งมีชีวิตทุกชนิด

Cr.ณฤภรณ์ โสดา
สะดวก ฉับไว คุ้มค่า สมัครสมาชิกนิตยสารมติชนสุดสัปดาห์ได้ที่นี่https://t.co/KYFMEpsHWj
— MatichonWeekly มติชนสุดสัปดาห์ (@matichonweekly) July 27, 2022