ถอดรหัสโครโมโซมวาย… จิ๊กซอว์ชิ้นสุดท้ายของจีโนมมนุษย์ | ภาคภูมิ ทรัพย์สุนทร

ภาคภูมิ ทรัพย์สุนทร
Cr : ณฤภรณ์ โสดา

ข้อมูลพันธุกรรมมนุษย์ถูกบันทึกในเกลียวดีเอ็นเอ 46 เส้น

แต่ละเส้นขดแน่นเป็นชิ้นปาท่องโก๋ที่เรียกว่าโครโมโซม โครโมโซมพวกนี้เราได้จากพ่อและแม่อย่างละครึ่งมาเข้าคู่กันได้รวม 23 คู่

ในจำนวนนี้ 22 คู่เป็นโครโมโซมร่างกาย (autosome) อีกคู่สุดท้ายเป็นโครโมโซมเพศ (sex chromosome)

คู่สุดท้ายนี้ในผู้หญิงเป็นโครโมโซม X ทั้งสองแท่ง ส่วนในผู้ชายเป็นโครโมโซม X หนึ่งแท่ง Y อีกหนึ่งแท่ง

X กับ Y มีขนาด รูปร่าง และส่วนประกอบที่เป็นข้อมูลพันธุกรรมข้างในแทบจะต่างกันโดยสิ้นเชิง

ดีเอ็นเอของ X ยาวกว่าของ Y ถึงสามเท่า และมีจำนวนยีนที่ผลิตโปรตีนมากกว่าเกือบเก้าเท่า มีแค่ส่วนตรงปลายสองด้านนิดเดียวของ X และ Y เท่านั้นที่มีโครงสร้างและชุดยีนแบบเดียวกัน

สัตว์เลี้ยงลูกด้วยนมที่ออกลูกเป็นตัวทั้งหลายใช้ระบบโครโมโซม X และ Y เป็นตัวกำหนดเพศ

หลักฐานจากการวิเคราะห์เปรียบเทียบพันธุกรรมบ่งชี้ว่าสองโครโมโซมนี้ มีต้นกำเนิดเดียวกันเป็นคู่โครโมโซมร่างกายทั่วๆ ไปเมื่อกว่า 180 ล้านปีที่แล้ว จากนั้นก็ได้วิวัฒนาการแยกจากกัน

ขณะที่ X ยังคงรักษาความสมบูรณ์ไว้และยังอยู่เป็นคู่ (XX) ในเพศหญิง Y กลับถูกโดดเดี่ยวและค่อยๆ เสื่อมสลายไปเรื่อยๆ บางยีนถูกโยกย้ายไปโครโมโซมอื่น บางยีนก็สูญหายไปตลอดกาล

รวมๆ แล้วโครโมโซม Y เสียยีนออกไปแล้วกว่า 97%

คาดกันว่าเป็นไปได้ที่โครโมโซม Y จะสลายหายไปหมดในอีกหลายล้านปีข้างหน้า ถึงตอนนั้นเราอาจจะต้องวิวัฒนาการไปใช้ระบบกำหนดเพศแบบอื่นแทน

 

แม้ว่าขนาดจะเล็กและอนาคตจะดูค่อนข้างมืดมน แต่โครโมโซม Y ที่เราใช้กันอยู่ในปัจจุบันก็ยังมียีนอีกหลายตัวที่จำเป็นต่อพัฒนาการของเพศชาย และเกี่ยวข้องกับการเกิดโรคพันธุกรรมบางชนิด นอกจากนี้ การที่โครโมโซม Y ถ่ายทอดมาเป็นสายตรงผ่านทางเพศชายเท่านั้น ทำให้มันง่ายต่อการเอาไปใช้เป็นเครื่องมือแกะรอยศึกษาประวัติศาสตร์เผ่าพันธุ์มนุษย์

กระนั้นการถอดรหัสศึกษาพันธุกรรมโครโมโซม Y ถือว่าโหดหินที่สุดในบรรดาโครโมโซมทั้งหมด

โครงการถอดรหัสจีโนมมนุษย์ (Human Genome Project, HGP) ครั้งแรกเมื่อปี 1990 เป็นเมกะโปรเจ็กต์ที่ใช้งบประมาณวิจัยกว่าสามพันล้านดอลลาร์สหรัฐ ระยะเวลาสิบสามปี และการลงขันของกว่ายี่สิบทีมวิจัยทั่วโลก

แต่ข้อมูลจีโนมที่ถูกถอดรหัส “สำเร็จ” ตามที่ประกาศข่าวใหญ่โตในปี 2003 ยังเป็นโครงร่างที่ไม่สมบูรณ์ เหลืออีกประมาณ 8% ที่ยังเป็นปริศนาดำมืดอยู่

เทคโนโลยีการอ่านลำดับเบสดีเอ็นเอ (DNA sequencing) ที่เราใช้กันจนถึงทุกวันนี้ไม่มีเทคโนโลยีไหนสามารถอ่านลำดับเบสของทั้งจีโนมมนุษย์ (ที่มีอยู่กว่าสามพันล้านเบส) ออกมาได้หมดในคราวเดียว

เราทำได้แค่อ่านลำดับเบสจากดีเอ็นเอออกมาเป็นชิ้นย่อยๆ จากนั้นก็เอาข้อมูลที่ได้มาปะติดปะต่อกันเหมือนการต่อจิ๊กซอว์ให้ได้เป็นข้อมูลทั้งจีโนมที่ครบสมบูรณ์

โครโมโซม Y วิวัฒนาการลดรูปจนแคระแกร็นเมื่อเทียบกับโครโมโซม X
Cr : ณฤภรณ์ โสดา

เทคโนโลยีรุ่นแรก (Sanger’s sequencing) อ่านลำดับเบสออกมาได้ทีละ 500-1,000 เบส ดังนั้น การประกอบข้อมูลจีโนมมนุษย์ที่สมบูรณ์ก็เหมือนกับการต่อจิ๊กซอว์หลายล้านชิ้น

ระดับความยากง่ายในการต่อประกอบข้อมูลแต่ละส่วนในจีโนมแตกต่างกันออกไป

บริเวณไหนที่มีลำดับเบสซ้ำซ้อนกันยิ่งมากก็ยิ่งต่อยาก

ถ้าเปรียบเทียบกับการต่อจิ๊กซอว์ก็คือการต่อบริเวณที่มีลวดลายซ้ำๆ (เช่น รูปนักโทษใส่เสื้อลายต้อนฝูงม้าลายข้ามทางม้าลาย) ดูแล้วสับสนว่าตรงไหนต้องไปต่อกับตรงไหน

จีโนมของสิ่งมีชีวิตชั้นสูงรวมทั้งมนุษย์มีส่วนที่ลำดับเบสซ้ำๆ แบบนี้แทรกอยู่เยอะ

บ้างก็เป็นปรสิตระดับจีโนมที่ก๊อบปี้ตัวเองได้เรื่อยๆ บ้างก็เป็นข้อผิดพลาดที่เกิดระหว่างการสังเคราะห์ดีเอ็นเอของเซลล์

นอกจากนี้ ยังมีส่วนหัว/ท้าย (telomere) และส่วนกลาง (centromere) ของโครโมโซมที่ลำดับเบสซ้ำๆ พวกนี้มีหน้าที่เฉพาะในการรักษาสภาพและการเคลื่อนย้ายโครโมโซม

คนสองคนอาจจะมีชุดยีนแบบเดียวกันแต่จำนวนก๊อบปี้ของยีนไม่เท่ากัน ลำดับการเรียงของยีนต่างกัน หรือทิศการวางตัวของยีนคนละทิศกัน ความหลากหลายระดับโครงสร้าง (structural variation) แบบนี้มีอิทธิพลต่อลักษณะปรากฏและการเกิดโรคพันธุกรรมไม่น้อยไปกว่าความแตกต่างภายในยีนเอง

ส่วน 8% ของจีโนมที่ว่ายังถอดรหัสไม่ได้ก็คือตำแหน่งที่มีลำดับเบสซ้ำๆ แบบนี้หนาแน่น ตำแหน่งพวกนี้กระจายอยู่ทั่วในจีโนมกลายเป็นช่องว่างปริศนา (gap) ที่เรายังแทบไม่รู้อะไรเกี่ยวกับข้อมูลพันธุกรรมตรงนั้น โครโมโซม Y มีส่วนลำดับเบสซ้ำๆ อยู่ถึง 66% ของดีเอ็นเอทั้งหมด

นั่นทำให้ราวๆ ครึ่งหนึ่งของข้อมูลพันธุกรรมในโครโมโซมนี้ยังถูกถอดรหัสออกมาได้ไม่สำเร็จใน HGP รอบแรก

ดีเอ็นเอที่มีลำดับเบสซ้ำเหมือนกับชิ้นจิ๊กซอว์ที่ต่อยาก
Cr : ณฤภรณ์ โสดา

เทคโนโลยีการถอดรหัสพันธุกรรมก้าวหน้าขึ้นเรื่อยๆ ตลอดหลายสิบปีที่ผ่านมา ราคาถูกลง แม่นยำขึ้นและอ่านได้ลำดับเบสยาวขึ้น อัลกอริธึ่มที่นักชีวสารสนเทศใช้ประกอบชิ้นจิ๊กซอว์นี้ก็ดีขึ้นเรื่อยๆ ด้วยเช่นกัน

เทคโนโลยีถอดรหัสพันธุกรรมยุคหลังๆ (อย่าง PacBio Hifi และ Oxford Nanopore) ที่อ่านลำดับเบสได้ทีละหลักหมื่นถึงหลักแสนเบสช่วยลดปัญหาการถอดรหัสพันธุกรรมบริเวณที่ลำดับเบสซ้ำลงได้มาก ถ้าเปรียบเป็นการต่อจิ๊กซอว์การอ่านลำดับเบสชิ้นยาวๆ ก็เหมือนการที่เราได้จิ๊กซอว์ชิ้นใหญ่ๆ จำนวนน้อยชิ้นแทนที่จะต้องต่อจิ๊กซอว์ชิ้นเล็กๆ จำนวนมากชิ้นเหมือนแต่ก่อน

ด้วยความก้าวหน้าของเทคโนโลยีพวกนี้ทำให้เกิดโครงการอย่าง Telomere-to-Telomere (T2T) Consortium ที่มุ่งหน้าจะถอดรหัสพันธุกรรมมนุษย์ส่วนที่เหลือทั้งหมดในทุกโครโมโซมจากสุดปลายด้านหนึ่งถึงสุดปลายอีกด้าน

T2T ไม่ได้เริ่มต้นเป็นเมกกะโปรเจ็กต์ใหญ่โตอลังการเหมือน HGP แต่ว่ามาจากการรวมตัวกันเองของกลุ่มนักวิจัยทีมเล็กๆ จากสถาบันสุขภาพแห่งสหรัฐ (NIH) และมหาวิทยาลัยแคลิฟอร์เนียซานตาครูซ (UCSC) ช่วงปี 2020 ก่อนจะค่อยๆ ขยายทีมเป็นสมาคมใหญ่หลายสิบสถาบัน

ปี 2020 T2T รายงานการถอดรหัสพันธุกรรมของโครโมโซม X สำเร็จทั้งหมด ปิดช่องว่างปริศนาที่ยังหลงเหลือทั้งหมด 29 แห่งบนโครโมโซมนี้ได้สำเร็จ ปีถัดมา (2021) ก็รายงานการถอดรหัสโครโมโซมที่ 8 ทั้งชิ้น ส่วนปีที่แล้ว (2022) ก็ได้แถลงข่าวใหญ่ว่าได้ถอดรหัสโครโมโซมที่เหลือครบหมดแล้ว

โครโมโซม Y วิวัฒนาการอย่างรวดเร็วจนมีขนาดและโครงสร้างแตกต่างกันมาก
Cr : ณฤภรณ์ โสดา

แต่จีโนมที่ T2T ใช้ไม่ใช่จีโนมจากเซลล์มนุษย์ปกติแต่เป็นเซลล์จากก้อนเนื้อที่เรียกว่า hydatiform mole (รหัสเซลล์ CHM13) เซลล์พวกนี้เกิดจากการปฏิสนธิที่ผิดปกติจนทำให้โครโมโซมฝั่งแม่หายไปหมดแต่โครโมโซมฝั่งพ่อก๊อบปี้มาเป็นสองเท่า CHM13 จึงมีโครโมโซม 46 เหมือนเซลล์มนุษย์ปกติแต่ว่าโครโมโซมแต่ละคู่ทั้ง 23 คู่เหมือนกันเป๊ะ (เพราะว่ามาจากพ่อทั้งคู่ แทนที่จะมาจากพ่อและแม่อย่างคนปกติ)

ลักษณะพิเศษนี้ทำให้เราศึกษา CHM13 ได้ง่ายกว่าเซลล์มนุษย์ธรรมดาเพราะว่าข้อมูลพันธุกรรมเหลือแค่ครึ่งเดียว

ส่วนโครโมโซมเพศของ CHM13 เป็นโครโมโซม X (ที่ได้จากพ่อ) ดังนั้น รายงาน “การถอดรหัสจีโนมมนุษย์ที่สมบูรณ์” ของทีม T2T เมื่อปีที่แล้วจึงยังไม่มีข้อมูลของโครโมโซม Y อยู่

ล่าสุด (2023) ทีม T2T เพิ่งรายงานการถอดรหัสโครโมโซม Y ที่ครบสมบูรณ์ครั้งแรก เมื่อรวมกับข้อมูลจาก CHM13 ก็เติมเต็มจิ๊กซอว์ชิ้นสุดท้ายที่ยังขาดหายไปของจีโนมมนุษย์

โครโมโซม Y นี้ได้มาจากอาสาสมัครที่เป็นมนุษย์เชื้อสายยิว (รหัส H002) ที่เคยเข้าร่วมในโครงการถอดรหัสพันธุกรรมส่วนบุคคล (Personal Genome Project, PGP)

ข้อมูลส่วนใหญ่ที่ได้เพิ่มเติมมามากกว่าการถอดรหัสโครโมโซม Y ใน HGP รอบแรกอีกกว่า 30 ล้านเบสอยู่ในส่วนที่ไม่พบการแสดงออกยีน (heterochromatin) และเต็มไปด้วยลำดับเบสซ้ำๆ ที่เทคโนโลยียุคก่อนถอดรหัสไม่ได้

 

ข้อมูลใหม่ที่ได้ยังเน้นย้ำถึงความแปลกพิสดารของโครงสร้างและการจัดเรียงยีนบนโครโมโซม Y เทียบกับโครโมโซมอื่น

ยกตัวอย่างเช่น ยีน TSPY ที่แสดงออกเฉพาะในอัณฑะและเกี่ยวข้องกับกระบวนการสร้างตัวอสุจิ มีจำนวนก๊อบปี้ซ้ำๆ กันมากถึง 45 ก๊อบปี้ (ค้นพบใหม่ในงานวิจัยนี้ 38 ก๊อบปี้) เรียงรายกันเป็นแถวยาว จากงานวิจัยก่อนหน้าพบว่าผู้ชายแต่ละคนมีจำนวนยีนนี้ไม่เท่ากันและระดับการแสดงออกยีนขึ้นอยู่กับจำนวนก๊อบปี้ที่มีอยู่

ในงานวิจัยล่าสุดนี้ทีมวิจัยเอาข้อมูลไปเทียบกับฐานข้อมูลจีโนมประชากร และพบว่าจำนวนก๊อบปี้ของ TSPY ในผู้ชายแต่ละคนมีตั้งแต่ 10-40 ก๊อบปี้ แม้ว่ารหัสพันธุกรรมในแต่ละก๊อบปี้จะแทบเหมือนกันหมด

งานวิจัยอีกชิ้นที่เพิ่งตีพิมพ์ออกมาพร้อมกันนำทีมโดยนักวิจัยจาก Jackson Laboratory ถอดรหัสโครโมโซม Y ของตัวอย่างอาสาสมัครชาย 43 คน มีทั้งเชื้อชาติแอฟริกัน อเมริกันพื้นเมือง ยุโรป เอเชียใต้ และเอเชียตะวันออก ด้วยความหลากหลายของเผ่าพันธุ์กำเนิดทำให้โครโมโซม Y เหล่านี้ผ่านเส้นทางวิวัฒนาการแยกจากกันมาแล้วเกือบสองแสนปี

โครโมโซม Y เหล่านี้แตกต่างกันอย่างยิ่งทั้งด้านขนาดและโครงสร้าง ขนาดเล็กสุดอยู่ที่ประมาณ 45 ล้านเบส ใหญ่สุดอยู่ที่เกือบ 85 ล้านเบสหรือต่างกันเกือบเท่าตัว ส่วนด้านโครงสร้างก็เต็มไปด้วยความหลากหลายของจำนวนก๊อบปี้ การจัดเรียง ตำแหน่งและทิศทางของยีนยิ่งกว่าโครโมโซมอื่นๆ ที่มีเคยมีการศึกษามา

ข้อมูลนี้สอดคล้องกับรายงานก่อนหน้าที่คาดคะเนว่าอัตราวิวัฒนาการของโครโมโซม Y เร็วกว่าโครโมโซมอื่นๆ ทั้งหมด มีหลายทฤษฎีพยายามอธิบายปรากฏการณ์นี้ไม่ว่าจะเป็นการที่เซลล์สืบพันธุ์เพศผู้ที่ส่งต่อโครโมโซม Y เกิดขึ้นผ่านกระบวนการแบ่งเซลล์หลายครั้ง (กว่าเซลล์ไข่)

กระบวนการนี้เกิดในลูกอัณฑะนอกร่างกายมีโอกาสได้รับสารเหนี่ยวนำการกลายมากกว่า ไปจนถึงการที่จำนวนประชากรของโครโมโซม Y มีน้อยและไม่มีโครโมโซมคู่เหมือนให้แลกเปลี่ยนซ่อมแซมชิ้นส่วนดีเอ็นเอจึงง่ายต่อสูญเสียยีนดีๆ และเก็บยีนแย่ๆ พังๆ ไว้โดยบังเอิญ

 

ข้อมูลโครโมโซม Y ที่สมบูรณ์นี้ไม่เพียงแต่จะถูกใช้เป็นจุดอ้างอิง (reference sequence) สำหรับการศึกษาจีโนมมนุษย์อื่นๆ ในอนาคต

แต่ยังชวนให้เราไปรื้อดูข้อผิดพลาดในฐานข้อมูลจีโนมเก่าๆ ที่ผ่านมา

ตัวอย่างหนึ่งที่งานวิจัยใหม่นี้พูดถึงคือฐานข้อมูลจีโนมแบคทีเรียบนร่างกายมนุษย์ที่มักจะมีปัญหาถูกปนเปื้อนด้วยจีโนมเซลล์มนุษย์เอง

ข้อมูลจีโนมปนเปื้อนจากมนุษย์นี้ปกติแล้วจะต้องถูกคัดกรองออกโดยอาศัยข้อมูลจีโนมอ้างอิงของมนุษย์ที่เรามีอยู่

ที่ผ่านมีชิ้นส่วนจากข้อมูลพันธุกรรมจากโครโมโซม Y ไปปนเปื้อนอยู่แต่ว่าไม่ถูกคัดกรองออกเพราะเรายังไม่รู้จักโครโมโซม Y ส่วนนั้น

ประมาณกันว่ามีข้อมูลจีโนมแบคทีเรียกว่า 5,000 ตัวอย่างที่อาจจะถูกปนเปื้อนด้วยข้อมูลจากโครโมโซม Y แบบนี้และควรจะต้องถูกแก้ไขอัพเดตใหม่

การถอดรหัสโครโมโซม Y จิ๊กซอว์ชิ้นสุดท้ายของจีโนมมนุษย์ถือเป็นความสำเร็จก้าวใหญ่ แต่มันก็เป็นเพียงก้าวแรกๆ ของการศึกษาและนำไปใช้ประโยชน์

เรายังต้องตอบคำถามว่าความหลายหลายมหาศาลที่ปรากฏบนโครโมโซม Y นี้เกี่ยวข้องกับคุณลักษณะ การเกิดโรค และวิวัฒนาการของเหล่าบุรุษเพศชายอย่างไร

เทคโนโลยีที่พัฒนาขึ้นในงานนี้และที่จะต่อยอดไปต่อข้างหน้าจะต้องถูกเอามาใช้ถอดรหัสโครโมโซม Y (และโครโมโซมอื่น) ของมนุษย์อีกหลายหมื่นหลายแสนคนกว่าปริศนาซ่อนเร้นในจีโนมของเราจะค่อยๆ คลี่คลายลงในอนาคต

ใต้ภาพ

ภาพปก

Cr : ณฤภรณ์ โสดา

รูปที่ 1 โครโมโซม Y วิวัฒนาการลดรูปจนแคระแกร็นเมื่อเทียบกับโครโมโซม X

Cr : ณฤภรณ์ โสดา

รูปที่ 2 ดีเอ็นเอที่มีลำดับเบสซ้ำเหมือนกับชิ้นจิ๊กซอว์ที่ต่อยาก

Cr : ณฤภรณ์ โสดา

รูปที่ 3 โครโมโซม Y วิวัฒนาการอย่างรวดเร็วจนมีขนาดและโครงสร้างแตกต่างกันมาก

Cr : ณฤภรณ์ โสดา