ที่มา | มติชนสุดสัปดาห์ ฉบับวันที่ 8 - 14 กันยายน 2566 |
---|---|
คอลัมน์ | Biology Beyond Nature |
ผู้เขียน | ภาคภูมิ ทรัพย์สุนทร |
เผยแพร่ |
ข้อมูลพันธุกรรมมนุษย์ถูกบันทึกในเกลียวดีเอ็นเอ 46 เส้น
แต่ละเส้นขดแน่นเป็นชิ้นปาท่องโก๋ที่เรียกว่าโครโมโซม โครโมโซมพวกนี้เราได้จากพ่อและแม่อย่างละครึ่งมาเข้าคู่กันได้รวม 23 คู่
ในจำนวนนี้ 22 คู่เป็นโครโมโซมร่างกาย (autosome) อีกคู่สุดท้ายเป็นโครโมโซมเพศ (sex chromosome)
คู่สุดท้ายนี้ในผู้หญิงเป็นโครโมโซม X ทั้งสองแท่ง ส่วนในผู้ชายเป็นโครโมโซม X หนึ่งแท่ง Y อีกหนึ่งแท่ง
X กับ Y มีขนาด รูปร่าง และส่วนประกอบที่เป็นข้อมูลพันธุกรรมข้างในแทบจะต่างกันโดยสิ้นเชิง
ดีเอ็นเอของ X ยาวกว่าของ Y ถึงสามเท่า และมีจำนวนยีนที่ผลิตโปรตีนมากกว่าเกือบเก้าเท่า มีแค่ส่วนตรงปลายสองด้านนิดเดียวของ X และ Y เท่านั้นที่มีโครงสร้างและชุดยีนแบบเดียวกัน
สัตว์เลี้ยงลูกด้วยนมที่ออกลูกเป็นตัวทั้งหลายใช้ระบบโครโมโซม X และ Y เป็นตัวกำหนดเพศ
หลักฐานจากการวิเคราะห์เปรียบเทียบพันธุกรรมบ่งชี้ว่าสองโครโมโซมนี้ มีต้นกำเนิดเดียวกันเป็นคู่โครโมโซมร่างกายทั่วๆ ไปเมื่อกว่า 180 ล้านปีที่แล้ว จากนั้นก็ได้วิวัฒนาการแยกจากกัน
ขณะที่ X ยังคงรักษาความสมบูรณ์ไว้และยังอยู่เป็นคู่ (XX) ในเพศหญิง Y กลับถูกโดดเดี่ยวและค่อยๆ เสื่อมสลายไปเรื่อยๆ บางยีนถูกโยกย้ายไปโครโมโซมอื่น บางยีนก็สูญหายไปตลอดกาล
รวมๆ แล้วโครโมโซม Y เสียยีนออกไปแล้วกว่า 97%
คาดกันว่าเป็นไปได้ที่โครโมโซม Y จะสลายหายไปหมดในอีกหลายล้านปีข้างหน้า ถึงตอนนั้นเราอาจจะต้องวิวัฒนาการไปใช้ระบบกำหนดเพศแบบอื่นแทน
แม้ว่าขนาดจะเล็กและอนาคตจะดูค่อนข้างมืดมน แต่โครโมโซม Y ที่เราใช้กันอยู่ในปัจจุบันก็ยังมียีนอีกหลายตัวที่จำเป็นต่อพัฒนาการของเพศชาย และเกี่ยวข้องกับการเกิดโรคพันธุกรรมบางชนิด นอกจากนี้ การที่โครโมโซม Y ถ่ายทอดมาเป็นสายตรงผ่านทางเพศชายเท่านั้น ทำให้มันง่ายต่อการเอาไปใช้เป็นเครื่องมือแกะรอยศึกษาประวัติศาสตร์เผ่าพันธุ์มนุษย์
กระนั้นการถอดรหัสศึกษาพันธุกรรมโครโมโซม Y ถือว่าโหดหินที่สุดในบรรดาโครโมโซมทั้งหมด
โครงการถอดรหัสจีโนมมนุษย์ (Human Genome Project, HGP) ครั้งแรกเมื่อปี 1990 เป็นเมกะโปรเจ็กต์ที่ใช้งบประมาณวิจัยกว่าสามพันล้านดอลลาร์สหรัฐ ระยะเวลาสิบสามปี และการลงขันของกว่ายี่สิบทีมวิจัยทั่วโลก
แต่ข้อมูลจีโนมที่ถูกถอดรหัส “สำเร็จ” ตามที่ประกาศข่าวใหญ่โตในปี 2003 ยังเป็นโครงร่างที่ไม่สมบูรณ์ เหลืออีกประมาณ 8% ที่ยังเป็นปริศนาดำมืดอยู่
เทคโนโลยีการอ่านลำดับเบสดีเอ็นเอ (DNA sequencing) ที่เราใช้กันจนถึงทุกวันนี้ไม่มีเทคโนโลยีไหนสามารถอ่านลำดับเบสของทั้งจีโนมมนุษย์ (ที่มีอยู่กว่าสามพันล้านเบส) ออกมาได้หมดในคราวเดียว
เราทำได้แค่อ่านลำดับเบสจากดีเอ็นเอออกมาเป็นชิ้นย่อยๆ จากนั้นก็เอาข้อมูลที่ได้มาปะติดปะต่อกันเหมือนการต่อจิ๊กซอว์ให้ได้เป็นข้อมูลทั้งจีโนมที่ครบสมบูรณ์
เทคโนโลยีรุ่นแรก (Sanger’s sequencing) อ่านลำดับเบสออกมาได้ทีละ 500-1,000 เบส ดังนั้น การประกอบข้อมูลจีโนมมนุษย์ที่สมบูรณ์ก็เหมือนกับการต่อจิ๊กซอว์หลายล้านชิ้น
ระดับความยากง่ายในการต่อประกอบข้อมูลแต่ละส่วนในจีโนมแตกต่างกันออกไป
บริเวณไหนที่มีลำดับเบสซ้ำซ้อนกันยิ่งมากก็ยิ่งต่อยาก
ถ้าเปรียบเทียบกับการต่อจิ๊กซอว์ก็คือการต่อบริเวณที่มีลวดลายซ้ำๆ (เช่น รูปนักโทษใส่เสื้อลายต้อนฝูงม้าลายข้ามทางม้าลาย) ดูแล้วสับสนว่าตรงไหนต้องไปต่อกับตรงไหน
จีโนมของสิ่งมีชีวิตชั้นสูงรวมทั้งมนุษย์มีส่วนที่ลำดับเบสซ้ำๆ แบบนี้แทรกอยู่เยอะ
บ้างก็เป็นปรสิตระดับจีโนมที่ก๊อบปี้ตัวเองได้เรื่อยๆ บ้างก็เป็นข้อผิดพลาดที่เกิดระหว่างการสังเคราะห์ดีเอ็นเอของเซลล์
นอกจากนี้ ยังมีส่วนหัว/ท้าย (telomere) และส่วนกลาง (centromere) ของโครโมโซมที่ลำดับเบสซ้ำๆ พวกนี้มีหน้าที่เฉพาะในการรักษาสภาพและการเคลื่อนย้ายโครโมโซม
คนสองคนอาจจะมีชุดยีนแบบเดียวกันแต่จำนวนก๊อบปี้ของยีนไม่เท่ากัน ลำดับการเรียงของยีนต่างกัน หรือทิศการวางตัวของยีนคนละทิศกัน ความหลากหลายระดับโครงสร้าง (structural variation) แบบนี้มีอิทธิพลต่อลักษณะปรากฏและการเกิดโรคพันธุกรรมไม่น้อยไปกว่าความแตกต่างภายในยีนเอง
ส่วน 8% ของจีโนมที่ว่ายังถอดรหัสไม่ได้ก็คือตำแหน่งที่มีลำดับเบสซ้ำๆ แบบนี้หนาแน่น ตำแหน่งพวกนี้กระจายอยู่ทั่วในจีโนมกลายเป็นช่องว่างปริศนา (gap) ที่เรายังแทบไม่รู้อะไรเกี่ยวกับข้อมูลพันธุกรรมตรงนั้น โครโมโซม Y มีส่วนลำดับเบสซ้ำๆ อยู่ถึง 66% ของดีเอ็นเอทั้งหมด
นั่นทำให้ราวๆ ครึ่งหนึ่งของข้อมูลพันธุกรรมในโครโมโซมนี้ยังถูกถอดรหัสออกมาได้ไม่สำเร็จใน HGP รอบแรก
เทคโนโลยีการถอดรหัสพันธุกรรมก้าวหน้าขึ้นเรื่อยๆ ตลอดหลายสิบปีที่ผ่านมา ราคาถูกลง แม่นยำขึ้นและอ่านได้ลำดับเบสยาวขึ้น อัลกอริธึ่มที่นักชีวสารสนเทศใช้ประกอบชิ้นจิ๊กซอว์นี้ก็ดีขึ้นเรื่อยๆ ด้วยเช่นกัน
เทคโนโลยีถอดรหัสพันธุกรรมยุคหลังๆ (อย่าง PacBio Hifi และ Oxford Nanopore) ที่อ่านลำดับเบสได้ทีละหลักหมื่นถึงหลักแสนเบสช่วยลดปัญหาการถอดรหัสพันธุกรรมบริเวณที่ลำดับเบสซ้ำลงได้มาก ถ้าเปรียบเป็นการต่อจิ๊กซอว์การอ่านลำดับเบสชิ้นยาวๆ ก็เหมือนการที่เราได้จิ๊กซอว์ชิ้นใหญ่ๆ จำนวนน้อยชิ้นแทนที่จะต้องต่อจิ๊กซอว์ชิ้นเล็กๆ จำนวนมากชิ้นเหมือนแต่ก่อน
ด้วยความก้าวหน้าของเทคโนโลยีพวกนี้ทำให้เกิดโครงการอย่าง Telomere-to-Telomere (T2T) Consortium ที่มุ่งหน้าจะถอดรหัสพันธุกรรมมนุษย์ส่วนที่เหลือทั้งหมดในทุกโครโมโซมจากสุดปลายด้านหนึ่งถึงสุดปลายอีกด้าน
T2T ไม่ได้เริ่มต้นเป็นเมกกะโปรเจ็กต์ใหญ่โตอลังการเหมือน HGP แต่ว่ามาจากการรวมตัวกันเองของกลุ่มนักวิจัยทีมเล็กๆ จากสถาบันสุขภาพแห่งสหรัฐ (NIH) และมหาวิทยาลัยแคลิฟอร์เนียซานตาครูซ (UCSC) ช่วงปี 2020 ก่อนจะค่อยๆ ขยายทีมเป็นสมาคมใหญ่หลายสิบสถาบัน
ปี 2020 T2T รายงานการถอดรหัสพันธุกรรมของโครโมโซม X สำเร็จทั้งหมด ปิดช่องว่างปริศนาที่ยังหลงเหลือทั้งหมด 29 แห่งบนโครโมโซมนี้ได้สำเร็จ ปีถัดมา (2021) ก็รายงานการถอดรหัสโครโมโซมที่ 8 ทั้งชิ้น ส่วนปีที่แล้ว (2022) ก็ได้แถลงข่าวใหญ่ว่าได้ถอดรหัสโครโมโซมที่เหลือครบหมดแล้ว
แต่จีโนมที่ T2T ใช้ไม่ใช่จีโนมจากเซลล์มนุษย์ปกติแต่เป็นเซลล์จากก้อนเนื้อที่เรียกว่า hydatiform mole (รหัสเซลล์ CHM13) เซลล์พวกนี้เกิดจากการปฏิสนธิที่ผิดปกติจนทำให้โครโมโซมฝั่งแม่หายไปหมดแต่โครโมโซมฝั่งพ่อก๊อบปี้มาเป็นสองเท่า CHM13 จึงมีโครโมโซม 46 เหมือนเซลล์มนุษย์ปกติแต่ว่าโครโมโซมแต่ละคู่ทั้ง 23 คู่เหมือนกันเป๊ะ (เพราะว่ามาจากพ่อทั้งคู่ แทนที่จะมาจากพ่อและแม่อย่างคนปกติ)
ลักษณะพิเศษนี้ทำให้เราศึกษา CHM13 ได้ง่ายกว่าเซลล์มนุษย์ธรรมดาเพราะว่าข้อมูลพันธุกรรมเหลือแค่ครึ่งเดียว
ส่วนโครโมโซมเพศของ CHM13 เป็นโครโมโซม X (ที่ได้จากพ่อ) ดังนั้น รายงาน “การถอดรหัสจีโนมมนุษย์ที่สมบูรณ์” ของทีม T2T เมื่อปีที่แล้วจึงยังไม่มีข้อมูลของโครโมโซม Y อยู่
ล่าสุด (2023) ทีม T2T เพิ่งรายงานการถอดรหัสโครโมโซม Y ที่ครบสมบูรณ์ครั้งแรก เมื่อรวมกับข้อมูลจาก CHM13 ก็เติมเต็มจิ๊กซอว์ชิ้นสุดท้ายที่ยังขาดหายไปของจีโนมมนุษย์
โครโมโซม Y นี้ได้มาจากอาสาสมัครที่เป็นมนุษย์เชื้อสายยิว (รหัส H002) ที่เคยเข้าร่วมในโครงการถอดรหัสพันธุกรรมส่วนบุคคล (Personal Genome Project, PGP)
ข้อมูลส่วนใหญ่ที่ได้เพิ่มเติมมามากกว่าการถอดรหัสโครโมโซม Y ใน HGP รอบแรกอีกกว่า 30 ล้านเบสอยู่ในส่วนที่ไม่พบการแสดงออกยีน (heterochromatin) และเต็มไปด้วยลำดับเบสซ้ำๆ ที่เทคโนโลยียุคก่อนถอดรหัสไม่ได้
ข้อมูลใหม่ที่ได้ยังเน้นย้ำถึงความแปลกพิสดารของโครงสร้างและการจัดเรียงยีนบนโครโมโซม Y เทียบกับโครโมโซมอื่น
ยกตัวอย่างเช่น ยีน TSPY ที่แสดงออกเฉพาะในอัณฑะและเกี่ยวข้องกับกระบวนการสร้างตัวอสุจิ มีจำนวนก๊อบปี้ซ้ำๆ กันมากถึง 45 ก๊อบปี้ (ค้นพบใหม่ในงานวิจัยนี้ 38 ก๊อบปี้) เรียงรายกันเป็นแถวยาว จากงานวิจัยก่อนหน้าพบว่าผู้ชายแต่ละคนมีจำนวนยีนนี้ไม่เท่ากันและระดับการแสดงออกยีนขึ้นอยู่กับจำนวนก๊อบปี้ที่มีอยู่
ในงานวิจัยล่าสุดนี้ทีมวิจัยเอาข้อมูลไปเทียบกับฐานข้อมูลจีโนมประชากร และพบว่าจำนวนก๊อบปี้ของ TSPY ในผู้ชายแต่ละคนมีตั้งแต่ 10-40 ก๊อบปี้ แม้ว่ารหัสพันธุกรรมในแต่ละก๊อบปี้จะแทบเหมือนกันหมด
งานวิจัยอีกชิ้นที่เพิ่งตีพิมพ์ออกมาพร้อมกันนำทีมโดยนักวิจัยจาก Jackson Laboratory ถอดรหัสโครโมโซม Y ของตัวอย่างอาสาสมัครชาย 43 คน มีทั้งเชื้อชาติแอฟริกัน อเมริกันพื้นเมือง ยุโรป เอเชียใต้ และเอเชียตะวันออก ด้วยความหลากหลายของเผ่าพันธุ์กำเนิดทำให้โครโมโซม Y เหล่านี้ผ่านเส้นทางวิวัฒนาการแยกจากกันมาแล้วเกือบสองแสนปี
โครโมโซม Y เหล่านี้แตกต่างกันอย่างยิ่งทั้งด้านขนาดและโครงสร้าง ขนาดเล็กสุดอยู่ที่ประมาณ 45 ล้านเบส ใหญ่สุดอยู่ที่เกือบ 85 ล้านเบสหรือต่างกันเกือบเท่าตัว ส่วนด้านโครงสร้างก็เต็มไปด้วยความหลากหลายของจำนวนก๊อบปี้ การจัดเรียง ตำแหน่งและทิศทางของยีนยิ่งกว่าโครโมโซมอื่นๆ ที่มีเคยมีการศึกษามา
ข้อมูลนี้สอดคล้องกับรายงานก่อนหน้าที่คาดคะเนว่าอัตราวิวัฒนาการของโครโมโซม Y เร็วกว่าโครโมโซมอื่นๆ ทั้งหมด มีหลายทฤษฎีพยายามอธิบายปรากฏการณ์นี้ไม่ว่าจะเป็นการที่เซลล์สืบพันธุ์เพศผู้ที่ส่งต่อโครโมโซม Y เกิดขึ้นผ่านกระบวนการแบ่งเซลล์หลายครั้ง (กว่าเซลล์ไข่)
กระบวนการนี้เกิดในลูกอัณฑะนอกร่างกายมีโอกาสได้รับสารเหนี่ยวนำการกลายมากกว่า ไปจนถึงการที่จำนวนประชากรของโครโมโซม Y มีน้อยและไม่มีโครโมโซมคู่เหมือนให้แลกเปลี่ยนซ่อมแซมชิ้นส่วนดีเอ็นเอจึงง่ายต่อสูญเสียยีนดีๆ และเก็บยีนแย่ๆ พังๆ ไว้โดยบังเอิญ
ข้อมูลโครโมโซม Y ที่สมบูรณ์นี้ไม่เพียงแต่จะถูกใช้เป็นจุดอ้างอิง (reference sequence) สำหรับการศึกษาจีโนมมนุษย์อื่นๆ ในอนาคต
แต่ยังชวนให้เราไปรื้อดูข้อผิดพลาดในฐานข้อมูลจีโนมเก่าๆ ที่ผ่านมา
ตัวอย่างหนึ่งที่งานวิจัยใหม่นี้พูดถึงคือฐานข้อมูลจีโนมแบคทีเรียบนร่างกายมนุษย์ที่มักจะมีปัญหาถูกปนเปื้อนด้วยจีโนมเซลล์มนุษย์เอง
ข้อมูลจีโนมปนเปื้อนจากมนุษย์นี้ปกติแล้วจะต้องถูกคัดกรองออกโดยอาศัยข้อมูลจีโนมอ้างอิงของมนุษย์ที่เรามีอยู่
ที่ผ่านมีชิ้นส่วนจากข้อมูลพันธุกรรมจากโครโมโซม Y ไปปนเปื้อนอยู่แต่ว่าไม่ถูกคัดกรองออกเพราะเรายังไม่รู้จักโครโมโซม Y ส่วนนั้น
ประมาณกันว่ามีข้อมูลจีโนมแบคทีเรียกว่า 5,000 ตัวอย่างที่อาจจะถูกปนเปื้อนด้วยข้อมูลจากโครโมโซม Y แบบนี้และควรจะต้องถูกแก้ไขอัพเดตใหม่
การถอดรหัสโครโมโซม Y จิ๊กซอว์ชิ้นสุดท้ายของจีโนมมนุษย์ถือเป็นความสำเร็จก้าวใหญ่ แต่มันก็เป็นเพียงก้าวแรกๆ ของการศึกษาและนำไปใช้ประโยชน์
เรายังต้องตอบคำถามว่าความหลายหลายมหาศาลที่ปรากฏบนโครโมโซม Y นี้เกี่ยวข้องกับคุณลักษณะ การเกิดโรค และวิวัฒนาการของเหล่าบุรุษเพศชายอย่างไร
เทคโนโลยีที่พัฒนาขึ้นในงานนี้และที่จะต่อยอดไปต่อข้างหน้าจะต้องถูกเอามาใช้ถอดรหัสโครโมโซม Y (และโครโมโซมอื่น) ของมนุษย์อีกหลายหมื่นหลายแสนคนกว่าปริศนาซ่อนเร้นในจีโนมของเราจะค่อยๆ คลี่คลายลงในอนาคต
ใต้ภาพ
ภาพปก
Cr : ณฤภรณ์ โสดา
รูปที่ 1 โครโมโซม Y วิวัฒนาการลดรูปจนแคระแกร็นเมื่อเทียบกับโครโมโซม X
Cr : ณฤภรณ์ โสดา
รูปที่ 2 ดีเอ็นเอที่มีลำดับเบสซ้ำเหมือนกับชิ้นจิ๊กซอว์ที่ต่อยาก
Cr : ณฤภรณ์ โสดา
รูปที่ 3 โครโมโซม Y วิวัฒนาการอย่างรวดเร็วจนมีขนาดและโครงสร้างแตกต่างกันมาก
Cr : ณฤภรณ์ โสดา
สะดวก ฉับไว คุ้มค่า สมัครสมาชิกนิตยสารมติชนสุดสัปดาห์ได้ที่นี่https://t.co/KYFMEpsHWj
— MatichonWeekly มติชนสุดสัปดาห์ (@matichonweekly) July 27, 2022