แปลง ‘คำ’ เป็น ‘คลิป’ ด้วย AI

ที่มา	มติชนสุดสัปดาห์ ฉบับวันที่ 23 - 29 กุมภาพันธ์ 2567
คอลัมน์	Cool Tech
ผู้เขียน	จิตต์สุภา ฉิน
เผยแพร่	วันพุธที่ 28 กุมภาพันธ์ พ.ศ.2567

Cool Tech | จิตต์สุภา ฉิน

Instagram : @sueching

Facebook.com/JitsupaChin

แปลง ‘คำ’ เป็น ‘คลิป’ ด้วย AI

การสั่งให้ AI วาดภาพนิ่งที่เราต้องการโดยที่เราแค่ป้อนคำสั่งเข้าไปว่าอยากได้ภาพอะไร เช่น ภาพสุนัขพันธุ์พุดเดิลที่กำลังวิ่งอย่างเริงร่าอยู่ในทุ่งหญ้าเขียวขจีโดยมีพระอาทิตย์ตกอยู่ฉากหลัง หรือผู้หญิงวัยสามสิบกว่าที่กำลังเดินซื้อของอยู่ในซูเปอร์มาร์เก็ต ได้กลายเป็นเรื่องที่เราค่อยๆ คุ้นชินกันและใช้ประโยชน์จากเทคโนโลยีนี้ได้มากขึ้นเรื่อยๆ

แต่หากลองเปลี่ยนผลลัพธ์ที่ได้จากภาพนิ่งให้กลายเป็นวิดีโอที่เราไม่ต้องถ่ายเองหรือตัดต่อเองดูบ้าง คุณผู้อ่านก็คงจะคิดว่ามันเป็นไปไม่ได้แน่ๆ ใช่ไหมคะ

ตอนนี้เป็นไปได้แล้วค่ะ

OpenAI ผู้อยู่เบื้องหลัง ChatGPT อันเลื่องชื่อได้เปิดตัว AI model ใหม่ชื่อ ‘Sora’ (โซระ) ที่สามารถสร้างวิดีโอขึ้นมาได้จากการพิมพ์ข้อความล้วนๆ!

โซระสามารถสร้างวิดีโอความยาวไม่เกินหนึ่งนาทีโดยที่วิดีโอประกอบไปด้วยฉากที่ลงรายละเอียดได้ขั้นสุด กล้องที่ขยับเคลื่อนไหวได้ด้วยโมชั่นที่สลับซับซ้อน และแคแร็กเตอร์ต่างๆ ที่เราต้องการให้อยู่ในวิดีโอ

สมมุติว่าเราอยากได้วิดีโอสักคลิป เราอาจจะพิมพ์พรอมต์หรือคำสั่งลงไปว่า “ผู้หญิงแต่งตัวเก๋เดินไปตามถนนในกรุงโตเกียวที่สาดส่องไปด้วยป้ายไฟนีออนที่ส่องแสงระยิบระยับสองข้างทาง เธอสวมแจ๊กเก็ตหนังสีดำ เดรสยาวสีแดง รองเท้าบู๊ตสีดำ ถือกระเป๋าสีดำ สวมแว่นกันแดดและทาลิปสติกสีแดง เธอก้าวเท้าเดินด้วยความมั่นใจไปแบบสบายๆ พื้นถนนชื้นและมีแอ่งน้ำที่สะท้อนแสงไฟหลากสีคล้ายกระจก และมีคนเดินถนนคนอื่นๆ อยู่ด้วย”

แล้วก็รอให้มันเนรมิตวิดีโอออกมาให้

คำสั่งที่ยกตัวอย่างไปนั้นเป็นคำสั่งที่ OpenAI ใช้จริงเพื่อสร้างวิดีโอตัวอย่างและนำมาโชว์เคสเอาไว้บนเว็บไซต์

คลิปวิดีโอที่สร้างมาจากคำสั่งชุดนี้ออกมาสวยงาม สมจริง ถ้าดูผิวเผินแบบไม่ได้จับจ้องลงไปที่รายละเอียดจุดต่อจุดก็คงจะไม่สามารถบอกได้เลยว่าคลิปนี้ไม่ได้เกิดขึ้นจากการถ่ายทำของช่างภาพมืออาชีพ

อีกหนึ่งตัวอย่างของวิดีโอที่โซระทำได้ดีคือวิดีโอของฝูงแมมมอธยักษ์ที่เดินฝ่าทุ่งหญ้าที่ปกคลุมไปด้วยหิมะ

ความสมจริงของฉากเทือกเขาที่ปกคลุมไปด้วยหิมะและรายละเอียดของงา ขน และรอยย่นบนงวง รวมไปถึงหิมะที่ฟุ้งขึ้นจากการลากเท้าของแมมมอธก็ทำให้แทบจะลืมไปเลยว่าไม่มีแมมมอธหลงเหลืออยู่บนโลกใบนี้อีกแล้ว

นอกจากฉาก คน และวัตถุต่างๆ ที่ต้องการให้อยู่ในวิดีโอ เรายังสามารถกำหนดมู้ดและโทนได้ด้วยว่าต้องการแบบไหน เช่น อยากได้สไตล์แบบโหมดถ่ายหนังด้วยฟิล์ม 35 ม.ม. สีสด หรือจะให้ปรับแสง สี มุมกล้อง ตามชอบก็ได้

และสามารถเลือกประเภทหรือธีมของวิดีโอได้ด้วย เช่น อยากได้แบบไซ-ไฟ สยองขวัญ หรือสดใสเบาสมอง

ตามปกติการจะถ่ายทำวิดีโอขึ้นมาสักชิ้นถ้าไม่ใช่วิดีโอที่เรายกมือถือขึ้นถ่ายเองแบบง่ายๆ ก็อาจจะมีต้นทุนที่ค่อนข้างสูงเลยทีเดียว โดยเฉพาะวิดีโอที่ต้องการการเล่าเรื่องแบบมีที่มาที่ไปหรือมีเทคนิคในการถ่ายทำที่สลับซับซ้อน ต้นทุนอาจจะอยู่ในหลักหมื่นไปจนถึงหลายแสน

เครื่องมือ AI ที่สร้างวิดีโอได้อย่างโซระจึงนำมาซึ่งความเป็นไปได้ใหม่ๆ มากมาย อย่างเช่น การใช้เพื่อสร้างเทรเลอร์ภาพยนตร์ หนังสั้น แอนิเมชั่นสั้น

หรือช่วยให้คนทำวิดีโอสามารถสื่อสารไอเดียหรือคอนเส็ปต์เบื้องต้นออกมาเป็นภาพเคลื่อนไหวที่เข้าใจง่ายโดยใช้ต้นทุนต่ำ

นอกจากนี้ มันก็ยังสามารถช่วยปรับให้วิดีโอที่มีอยู่แล้วสวยและโดดเด่นขึ้น หรือทำได้แม้กระทั่งการเปลี่ยนองค์ประกอบบางอย่างในคลิปวิดีโอที่ถ่ายมาแล้ว อย่างเช่น เปลี่ยนฉากหลัง หรือใส่ตัวละครใหม่ๆ เข้าไป ไปจนถึงแก้ไขรายละเอียดบางอย่างที่อยู่ในวิดีโอได้

และยังช่วยให้คนทั่วๆ ไปสื่อสารกันได้อย่างมีสีสันมากขึ้น เช่น แทนที่เราจะเขียนคำอวยพรวันเกิดธรรมดาๆ เราก็สามารถใส่ไอเดียสร้างวิดีโออวยพรวันเกิดให้คนที่เรารักได้โดยวิดีโอก็จะถูกสร้างขึ้นเพื่อคนคนนั้นโดยเฉพาะ ทำให้พิเศษขึ้นกว่าเดิม

อย่างไรก็ตาม โซระเองก็ยังมีข้อจำกัดอยู่ไม่น้อย และ OpenAI เองก็โอบรับข้อจำกัดเหล่านั้นโดยบริษัทได้เขียนเอาไว้บนเว็บไซต์เลยว่าโซระมีข้อด้อยหลายประการ อย่างเช่น ความไม่แม่นยำเรื่องฟิสิกส์ หรือความไม่เข้าใจเหตุและผล

OpenAI ยกตัวอย่างว่าหากโซระสร้างวิดีโอของคนที่กำลังกัดคุกกี้ หลังจากกัดเสร็จแล้วคุกกี้อาจจะไม่มีรอยแหว่งเลยก็ได้ วิดีโอของคนที่กำลังวิ่งออกกำลังกายบนลู่วิ่งอาจจะวิ่งผิดทิศทาง คนเป่าเทียนเค้กวันเกิดอาจจะเป่ายังไงเทียนก็ไม่ดับ คนหรือสัตว์อาจจะโผล่ขึ้นมาและหายไปเฉยๆ หรือของที่ควรจะเป็นของแข็งอย่างเก้าอี้กลับสามารถพับย่นยู่ยี่เข้าหากันได้เฉยๆ โดยไม่ได้ถูกแรงกระทำอะไรเลย

นอกจากปัญหาเรื่องความไม่แม่นยำและสมเหตุสมผลแล้ว โซระยังมีแนวโน้มที่จะสร้างคอนเทนต์ที่มีข้อมูลเท็จ ลำเอียง หรือแสดงออกถึงความเกลียดชัง ซึ่งอาจจะถูกนำมาใช้ทำสิ่งที่อันตรายได้ ซึ่งทาง OpenAI ก็บอกว่าจะสร้างเครื่องมือขึ้นมาช่วยตรวจจับด้วย

ส่วนข้อจำกัดที่เกิดขึ้นกับการใช้ AI ช่วยสร้างภาพ อย่างการสร้างมือของมนุษย์ออกมาอย่างผิดรูปผิดร่างก็ยังคงเป็นจุดบอดที่เกิดขึ้นกับวิดีโอที่ AI สร้างด้วยเหมือนกัน แม้กระทั่งแมวที่อยู่ในวิดีโอก็ยังมีขาที่ห้างอกขึ้นมาได้เฉยๆ

ในตอนนี้ OpenAI ยังไม่ได้เปิดให้คนทั่วไปใช้งานโซระได้และยังไม่รู้ว่าจะเปิดให้ใช้เมื่อไหร่ หรือถ้าเปิดให้ใช้แล้วจะคิดเงินค่าใช้อย่างไร

แต่ฉันก็เชื่อว่าน่าจะอีกไม่นานเกินรอแน่นอน

กว่า OpenAI จะเปิดให้ใช้งานได้ทั่วไป โซระก็คงเก่งขึ้นกว่านี้ และสร้างวิดีโอที่สมจริงได้มากกว่านี้

คงไม่ใช่เรื่องที่ยากเกินกว่าจะคาดเดาว่าเมื่อใครก็ได้สามารถสั่ง AI ให้สร้างวิดีโอได้ง่ายๆ เพียงแค่พิมพ์คำสั่งลงไปจะส่งเสริมให้ภัยจากดีพเฟกน่ากลัวยิ่งขึ้น วิดีโอปลอมจะสมจริงมากขึ้นและจะหลอกคนได้มากกว่าเดิม

แต่ก็ต้องไม่ลืมว่าเทคโนโลยีเดียวกันนี้ก็จะสร้างความเปลี่ยนแปลงให้กับอุตสาหกรรมที่หลากหลายและนำมาซึ่งสิ่งใหม่ๆ ที่น่าตื่นเต้นได้เหมือนกัน

สะดวก ฉับไว คุ้มค่า สมัครสมาชิกนิตยสารมติชนสุดสัปดาห์ได้ที่นี่https://t.co/KYFMEpsHWj

— MatichonWeekly มติชนสุดสัปดาห์ (@matichonweekly) July 27, 2022

มติชนสุดสัปดาห์

มติชนสุดสัปดาห์

แปลง ‘คำ’ เป็น ‘คลิป’ ด้วย AI

ติดตามเรา

บทความยอดนิยม

จับตาผลรัฐกระตุ้นอสังหาฯ

ภูมิทัศน์ใหม่เหนือสาละวิน! | สุรชาติ บำรุงสุข

เกาะติดปม ‘รัฐบาล VS แบงก์ชาติ’ คำถามเมื่อไหร่จะลดดอกเบี้ย? ปรับ ครม. เปลี่ยนเกม-เปลี่ยนตัว ‘ขุนคลัง’

รับมือ ‘สังคมสูงอายุ’ ง่ายนิดเดียว