“Deepfake” เทคโนโลยี AI กับการนำไปใช้งานในหลากหลายวงการ
ท่ามกลางพัฒนาการของแชตบอตปัญญาประดิษฐ์ (AI) ที่เก่งขึ้นอย่างก้าวกระโดดหลังจากทั้งโลกเข้าสู่ยุคอินเทอร์เน็ตที่เต็มไปด้วยข้อมูล ทว่านอกจากความชาญฉลาดในด้านการใช้ภาษาตอบโต้ราวกับเป็นมนุษย์แล้ว อีกหนึ่งศักยภาพของเอไอที่น่าจับตาคือพัฒนาการด้านภาพวิดีโอและเสียง ที่พัฒนาไปถึงขนาดที่ว่าปัจจุบันเอไอสามารถสร้างวิดีโอลอกเลียนแบบการกระทำของบุคคลที่ตรงข้ามกับความเป็นจริงหรือ “Deepfake” (หรืออีกชื่อคือ Digital Humans, AI Avatar และ AI Clones) ได้แล้ว
นิยามของเทคโนโลยีดังกล่าวค่อนข้างตรงไปตรงมาคือการที่เอไอจำลองวิดีโอของบุคคลใดบุคคลหนึ่งขึ้นให้กระทำหรือพูดอะไรบางอย่างออกมาตามคำสั่ง (Prompt) ที่ผู้ใช้งานต้องการซึ่งโดยที่ในความเป็นจริงบุคคลดังกล่าวไม่ต้องกระทำการดังกล่าวจริงๆ
ยกตัวอย่างเช่นกรณีที่ “บี้ เดอะสกา” โพสต์วิดีโอของตัวเองที่ผสมเข้ากับใบหน้าของ “พิมรี่พาย” เพื่อไลฟ์ขายของผ่านเทคโนโลยี Deepfake ของวิลสัน ซอฟท์แวร์ซึ่งก็สร้างกระแสตอบรับในเชิงบวกเกี่ยวกับพัฒนาการของเอไออย่างน่าประหลาดใจ
หรือในภาคธุรกิจ บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) ใช้ Generative AI เตรียมเนื้อหาและวิดีโอเพื่อนำเสนอต่อผู้ถือหุ้นโดยบริษัทฯ ใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อเทรนข้อมูลลำดับการประชุมในอดีตแล้ว แล้วจึงสั่งให้เอไอเขียนสคริปต์การประชุมครั้งล่าสุด
ประกอบกับใช้ Generative Video เพื่อสอนให้เอไอเข้าใจรูปแบบการนำเสนอด้วยวิดีโอของการประชุมผู้ถือหุ้นครั้งก่อนแล้วจึงให้ระบบสร้างวิดีโอแถลงผลการประกอบกิจการครั้งล่าสุดขึ้นมา
ขั้นตอนการสร้าง Deepfake
ทั้งนี้ ผู้ใช้งานสามารถสร้าง Deepfake ได้ด้วยหลายวิธีแต่ที่พบบ่อยที่สุดคือการใช้โครงข่ายประสาทเทียมเชิงลึก (Deep Neural Networks) ที่ใช้เทคนิคการสลับใบหน้า (Face-swapping Technique) หรือพูดง่ายๆ ก็คือขั้นตอนแรกผู้ใช้งานต้องมี “วิดีโอเป้าหมาย” เพื่อใช้เป็นพื้นฐานของ Deepfake จากนั้นจึงรวบรวมคลิปวิดีโอของบุคคลที่คุณต้องการแทรกในวิดีโอเป้าหมาย ซึ่งวิดีโอของบุคคลเหล่านั้นอาจไม่เกี่ยวข้องกันโดยสิ้นเชิง
ในขณะที่วิดีโอเป้าหมายอาจเป็นคลิปจากภาพยนตร์ฮอลลีวูดหรือวิดีโอของบุคคลที่คุณต้องการแทรกใบหน้าลงไปในภาพยนตร์ หรืออาจเป็นคลิปแบบสุ่มที่ดาวน์โหลดจากแพลตฟอร์มวิดีโอใดๆ ก็ได้
ต่อมาเอไอในแต่ละโปรแกรมจะคาดเดาว่าบุคคลนั้นมีลักษณะอย่างไรจากหลายมุมและเงื่อนไขที่มีทั้งหมด จากนั้นระบบจะจับคู่บุคคลดังกล่าวเข้ากับบุคคลอื่นในวิดีโอเป้าหมายโดยค้นหาคุณสมบัติที่เหมือนกันและสร้างวิดีโอ Deepfake ที่ผู้ใช้งานต้องการออกมา
นอกจากนี้ที่ผ่านมาผู้พัฒนาพยายามเพิ่ม Machine Learning* อีกประเภทหนึ่งคือ Generative Adversarial Networks (GAN)* ซึ่งจะตรวจจับและปรับปรุงข้อบกพร่องที่เกิดขึ้นในวิดีโอ Deepfake อย่างรอบคอบ ทําให้เครื่องตรวจจับการปลอมแปลงวิดีโอถอดรหัสได้ยากขึ้น
โดยแม้กระบวนการสร้างทั้งหมดจะฟังดูซับซ้อน แต่ซอฟต์แวร์ปัจจุบันก็ค่อนข้างใช้งานง่ายและแอปพลิเคชันปัจจุบันหลายตัวสามารถสร้าง Deepfake ได้เพียงไม่กี่คลิก เช่น แอปพลิเคชันจากจีน Zao, DeepFace Lab, FakeApp, Face Swap, Heygen, D-ID, StableDiffusion, Deepfake-as-a-Service ของ Tencent และสามารถค้นหาซอฟต์แวร์ Deepfake อีกจํานวนมากได้ใน GitHub ซึ่งเป็นชุมชนสำหรับนักพัฒนาแบบโอเพนซอร์ส
ประโยชน์ของเทคโนโลยี Deepfake
1. วงการการพากษ์เสียงและแปลภาษา
เทคโนโลยี Deepfake ยังสามารถนำไปใช้ให้เกิดประโยชน์ต่ออุตสาหกรรมอื่นๆ จำนวนมาก ยกตัวอย่างเช่น ผู้ใช้งานใช้เทคโนโลยี Deepfake สร้างวิดีโอ ของเดวิด แบ็คแฮม พูดข้อความรณรงค์คําร้องเพื่อยุติโรคมาลาเรียในโครงการ “Malaria Must Die” ซึ่งในวิดีโอแบ็คแฮมพูดสคริปต์ของแคมเปญได้ถึงเก้าภาษาด้วยรูปปากที่ขยับสอดคล้องกับแต่ละภาษาที่พูดอย่างสมบูรณ์
วิดีโอของแบ็คแฮมแสดงให้เห็นถึงศักยภาพในการใช้เทคโนโลยี Deepfake เพื่อการพากย์เสียงภาพยนตร์ การจัดการการเคลื่อนไหวของใบหน้าของนักแสดงที่สามารถทําให้ดูเหมือนว่าพวกเขากําลังพูดประโยคที่พวกเขาไม่ได้กล่าวในชีวิตจริง
ที่สำคัญแนวคิดนี้อาจนําไปต่อยอดได้โดยใช้เอไอเพื่อควบคุมเสียงของนักแสดงในหลายภาษาแทนการพากษ์เสียงแบบปกติซึ่งก็จะทำให้ได้อรรถรสมากกว่าเพราะได้เนื้อเสียงของบุคคลนั้นๆ มาเป็นต้นฉบับ
ที่สำคัญปัจจุบันมีเทคโนโลยีเพื่อจัดการด้านเสียงแล้วตัวอย่างเช่น Lyrebird AI ที่ใช้เอไอเพื่อโคลนเสียงพูดของมนุษย์เพียงผู้ใช้งานบันทึกเสียงบุคคลที่ต้องการหนึ่งนาที จับคู่กับเทคโนโลยีของ Deepfake และสิ่งที่ได้คือ “เครื่องมือพากย์เสียง” ที่มีศักยภาพมหาศาลตามแต่ภาษาที่ผู้ใช้งานต้องการ
2. วงการภาพยนตร์
การผลิตวิดีโอแบบดั้งเดิมมักต้องทำงานยุ่งเกี่ยวกับการสร้างฉากเสมือจริงซึ่งมีค่าใช้จ่ายสําหรับวัสดุ แรงงาน และความยุ่งยากในการขอใบอนุญาต แต่ด้วยการใช้เทคโนโลยี Deepfake สําหรับวิชวลเอฟเฟกต์ผู้สร้างภาพยนตร์สามารถสร้างฉากและพื้นหลังเสมือนจริงได้อย่างง่ายดาย โดยเทคโนโลยีดังกล่าวจะเข้ามาช่วยให้ผู้สร้างภาพยนตร์เปลี่ยนพื้นหลังและปรับให้เข้ากับบทภาพยนตร์ที่แตกต่างกันโดยไม่มีความท้าทายด้านการขนส่ง แรงงานหรือค่าใช้จ่ายเพิ่มเติม
นอกจากนี้ เทคโนโลยี Deepfake ยังช่วยให้ผู้สร้างภาพยนตร์สามารถจินตนาการถึงสถานการณ์ใหม่ๆ กับนักแสดงที่ไม่สามารถกลับมาแสดงหนังได้อีกแล้ว ตัวอย่างเช่น การปรากฏตัวอย่างน่าประหลาดใจของ ลุค สกายวอล์คเกอร์ ในตอนจบของ The Mandalorian ซีซันสองซึ่งทำให้กลุ่มแฟนคลับท่วมท้นไปตามกัน
ที่สำคัญปัจจุบันเทคโนโลยีปัญญาประดิษฐ์สามารถสร้างร่างโคลนของนักแสดงฮอลลีวูดชื่อดังหรือแม้กระทั่งร่างโคลนดิจิทัลของบุคคลทั่วไปได้อย่างแนบเนียบโดยผ่านการเก็บต้นฉบับบุคคลนั้นในสี่ขั้นตอนคือ บันทึกเสียง การเคลื่อนไหว ใบหน้าทุกมุม และสัดส่วนรูปร่าง ด้วยเครื่องมือสแกนแบบดิจิทัลอย่าง “Dorothy” เพื่อนำต้นฉบับเหล่านั้นไปประกอบกับวิดีโอเป้าหมายและสร้างเป็นคาแรกเตอร์ต่างๆ
ที่สำคัญอุปกรณ์ถ่ายภาพ 360 องศานี้จะเก็บรูปภาพใบหน้าของบุคคลในเกือบทุกอิริยาบถไม่ว่าจะเป็น ยิ้ม อ้าปาก แลบลิ้น หรือกลอกตาไปมาเพื่อทำให้วิดีโอ Deepfake ที่สร้างขึ้นเสมือนจริงให้มากที่สุดและทุกคำที่ร่างโคลนกล่าวจะขยับด้วยรูปปากที่ถูกต้อง
3. กลุ่มผู้นำทางความคิด (KOL)
กลุ่มผู้นำทางความคิดจากเทคโนโลยี Deepfake มีประโยชน์อย่างมากโดยเฉพาะอย่างยิ่งในเรื่องของการสื่อสารตรงตามสคริปต์ที่ผู้พัฒนาออกแบบไว้รวมทั้งลดต้นทุนด้านบุคลากรและพวกเขาสามารถทำงานได้ตลอด 24 ชั่วโมง
หนึ่งตัวอย่างที่น่าสนใจคือเทคโนโลยี Deepfake ของ Xiaoice บริษัทซอฟต์แวร์สัญชาติจีนที่สร้างอวตารของ KOL ขึ้นมาไลฟ์ขายของผ่านการป้อนสคริปต์ และออกแบบท่าทางและสีหน้าที่คล้ายมนุษย์อย่างมาก ซึ่ง KOL จาก Deepfake เหล่านี้ล้วนมีส่วนช่วยให้การทำงานในภาคธุรกิจมีประสิทธิภาพมากขึ้น ผ่านการลดต้นทุนของบริษัทฯ และสามารถสร้างการจดจำแบรนด์ผ่านกลุ่มผู้นำทางความคิดซึ่งไม่มีโอกาสที่จะเปลี่ยนงานหรือถูกซื้อตัวเหมือนบุคคลในชีวิตจริง
4. วงการการศึกษา
ในปี 1963 ประธานาธิบดีจอห์น เอฟ เคนเนดีกําลังเดินทางไปกล่าวสุนทรพจน์ในเมืองดัลลัส ในสหรัฐ ขณะที่เขาถูกลอบสังหาร ท้ายที่สุดเคนเนดีไม่ได้กล่าวสุนทรพจน์ที่เขาเตรียมมาทว่าด้วยเทคโนโลยีที่ทันสมัยและพัฒนาการของเอไอปัจจุบันทําให้เราได้ยินถ้อยแถลงจากเคนเนดีได้ในปัจจุบัน โดยทีมงานของ CereProc ได้วิเคราะห์การบันทึกสุนทรพจน์ของเขา 831 รายการเพื่อ "สร้างเสียงเคนเนดี"
โดยแยกเสียงออกเป็นหน่วยการออกเสียง 116,177 หน่วย ที่สำคัญภารกิจครั้งนี้ค่อนข้างท้าทายเพราะเสียงที่บันทึกถูกสร้างขึ้นบนอุปกรณ์ประเภทต่างๆในเวลาที่ต่างกัน แต่ท้ายที่สุด CereProc ก็สามารถใช้เอไอเพื่อสร้างเสียงพูดที่สมจริงของเคนเนดีออกมาได้อย่างสมบูรณ์
ความสำเร็จครั้งนั้นพิสูจน์ให้เห็นถึงความเป็นไปได้มากมายสําหรับการใช้เทคโนโลยี Deepfake โดยเฉพาะอย่างยิ่งในการศึกษา เช่น ผู้พัฒนาสามารถสร้างวิดีโอใหม่ของบุคคลในประวัติศาสตร์เพื่อออกมาเล่าเรื่องราวของตัวเอง เช่นเมื่อปีที่แล้ว พิพิธภัณฑ์และศูนย์การศึกษาการฆ่าล้างเผ่าพันธุ์แห่งรัฐอิลลินอยส์จัดแสดงภาพโฮโลแกรมของผู้รอดชีวิตจากการฆ่าล้างเผ่าพันธุ์ 15 คนหมุนเวียนกัน ผู้เข้าชมมีโอกาสถามคําถามกับโฮโลแกรมของผู้รอดชีวิต จากวิดีโอต้นฉบับจากกล้องทรงกลมที่บันทึกการสัมภาษณ์ผู้รอดชีวิตซึ่งการสัมภาษณ์แต่ละครั้งใช้เวลาถ่ายทํา 5 วัน
5. วงการธุรกิจ
ภาคธุรกิจคือหนึ่งในกลุ่มที่ได้ผลประโยชน์จากเทคโนโลยี Deepfake มากที่สุดตัวอย่างที่เห็นได้ชัดคือการนำ Generative AI เข้ามาใช้ในการประชุมผู้ถือหุ้นครั้งล่าสุดของเอสซีบีเอ็กซ์อย่างที่เล่าไปตอนต้น
ทว่ายังมีตัวอย่างการใช้เทคโนโลยี Deepfake อีกจำนวนมากในภาคธุรกิจ โดยตัวอย่างการใช้งานผ่าน Heygen แพลตฟอร์มสร้างอวตารเอไอ เช่น การใช้อวตารเอไอรายงานผลประกอบการของธุรกิจ, ใช้เทคโนโลยีอวตารเทรนงานพนักงานใหม่, หรือใช้สร้างวิดีโอเพื่อขายงานให้ลูกค้าเป็นต้น ซึ่งข้อดีของเทคโนโลยีดังกล่าวคือการสร้างวิดีโอให้ลูกค้าทีละหลายร้อยหลายพันวิดีโอด้วยเครื่องมือเพียงไม่กี่คลิกเท่านั้น
หนึ่งตัวอย่างการใช้เอไอกับภาคธุรกิจที่น่าสนใจในปัจจุบันคือ ท่ามกลางสังคมที่แยกตัว (Isolated Society) มากขึ้น ดังนั้นช่วงไม่กี่ปีที่ผ่านมาแอปพลิเคชันหาคู่จึงได้รับความนิยมมากขึ้น ซึ่งเมื่อนำแนวคิดเรื่องแอปพลิเคชันหาคู่ผนวกเข้ากับเทคโนโลยี Deepfakeจึงเกิด Candy.ai แพลตฟอร์มที่จำลองอวตารคู่สนทนาเพื่อให้ผู้ใช้งานพูดคุยกับเอไอราวกับพวกเขาเป็นเพื่อนหรือคู่รักกันอย่างสมจริง ซึ่งหากในอนาคตเทคโนโลยีพัฒนามากขึ้นผู้ใช้งานอาจสามารถโทรคุยโดยใช้เสียงหรือผ่านวิดีโอคอลกับอวตารเอไอเที่ผู้ใช้งานปราถนาและเสมือนจริงมากยิ่งขึ้นเช่นเดียวกัน
นอกจากนี้กลุ่มธุรกิจที่หารายได้ผ่านการสอนหรือการเทรนสามารถนำวิดีโอ Deepfake แล้วป้อนคำสั่งเข้าไปและสร้างวิดีโอการเรียนการสอนออกมาโดยเจ้าตัวไม่จำเป็นต้องเข้ามาอัดวิดีโอเองในสตูดิโอด้วย เช่นกรณีที่ผู้พัฒนาทดลองสร้างวิดีโอ Deepfake ของ “แชนซ์ เดอะ แร็ปเปอร์” ที่มาสอนผู้ชมเกี่ยวกับการทำงานของปัญญาประดิษฐ์เชิงลึก
ด้านมืดของ Deepfake
อย่างไรก็ตาม ถึงแม้เทคโนโลยีดังกล่าวจะสร้างคุณประโยชน์ต่ออุตสาหกรรมและธุรกิจต่างๆ จำนวนมากทว่าในอีกด้านหนึ่ง เทคโนโลยี Deepfake ก็ถูกนำมาใช้จนสร้างความเดือดร้อนมหาศาล เช่นกลุ่มมิจฉาชีพใช้เทคโนโลยีดังกล่าวสร้างวิดีโอหรือโคลนเสียงของบรรดาเซียนหุ้นในประเทศไทย หนึ่งในนั้นคือ “ดร.
นิเวศน์ เหมวชิรวรากร” แล้วนำมาหลอกให้ประชาชนทั่วไปลงทุน
นอกจากนี้ ใจช่วงไม่กี่ปีที่ผ่านมามิจฉาชีพจำนวนมากใช้เทคโนโลยี Deepfake เพื่อวัตถุประสงค์ที่ผิดกฎหมาย รวมถึงเพื่อสร้างภาพอนาจารแบบไม่ได้รับความยินยอม จนกระทั่งสำนักงานสอบสวนกลางของสหรัฐ ต้องออกประกาศต่อสาธารณะในเดือนมิถุนายน 2023 เพื่อเตือนประชาชนเกี่ยวกับอันตรายของ Generative AI และการใช้งานเครื่องมือเหล่านั้นในการสร้างเนื้อหาโป๊เปลือย ข่มขู่กรรโชกทางเพศบนโลกไซเบอร์ และการล่วงละเมิด
ในปี 2017 ผู้ใช้ Reddit ชื่อ "Deepfakes'' สร้างแอคเคานต์เพื่อเผยแพร่สื่อลามกที่ใช้ใบหน้าของดารานักแสดง ตั้งแต่นั้นเป็นต้นมาสื่อลามกโดยเฉพาะประเด็นการแก้แค้นผู้อื่นโดยใช้สื่อลามกอนาจาร (Revenge Porn) ก็เกิดขึ้นอย่างแพร่หลาย โดยรายงานของ Deeptrace พบว่า สื่อลามกคิดเป็น 96% ของวิดีโอ Deepfake ที่พบในโลกออนไลน์ในปี 2019
นอกจากนี้ Deepfake ยังถูกใช้สําหรับกิจกรรมทางอาญาที่ไม่ใช่ทางเพศ เช่นในปี 2023 ที่เกี่ยวข้องกับการใช้เทคโนโลยี Deepfake เพื่อเลียนแบบเสียงของลูกของสุภาพสตรีท่านหนึ่งเพื่อข่มขู่และรีดไถเธอ
รวมทั้งเทคโนโลยีดังกล่าวยังถูกนํามาใช้ในการเมือง ตัวอย่างเช่น ในปี 2018 พรรคการเมืองของเบลเยียมเผยแพร่วิดีโอของโดนัลด์ ทรัมป์ อดีตประธานาธิบดีสหรัฐ กล่าวสุนทรพจน์เรียกร้องให้เบลเยียมถอนตัวจากข้อตกลงด้านสภาพอากาศของปารีส อย่างไรก็ตาม ทรัมป์ไม่เคยกล่าวสุนทรพจน์นั้น และทั้งหมดเป็นการปลอมแปลง
เหตุการณ์คล้ายกันเกิดขึ้นโดนผู้ใช้งานสร้างวิดีโอของผู้นำประเทศอย่าง บารัค โอบามา โดนัลด์ ทรัมป์ โจ ไบเดน หรือวลาดีมีร์ ปูติน พูดในสิ่งที่พวกเขาไม่ได้พูด ซึ่งประเด็นข้างต้นทำให้นักวิเคราะห์จำนวนมากเชื่อว่าเทคโนโลยี Deepfake จะเข้ามาเปลี่ยนภูมิทัศน์ของการเมืองทั่วโลกเพราะประชาชนจะต้องตั้งคำถามมากขึ้นว่าเสียง ภาพ และวิดีโอที่พวกเขาเห็นหรือได้ยินนั้นเป็นเรื่องจริงหรือไม่
วิธีตรวจจับ Deepfake
1. รายละเอียดวิดีโอดูพร่ามัวหรือคลุมเครือหรือไม่? หนึ่งในเทคนิคการตรวจจับ Deepfake คือการสังเกตผิวหนัง เส้นผม หรือใบหน้าที่อาจจะดูพร่ามัวกว่าสภาพแวดล้อมในวิดีโอหรือให้พิจารณาผิวที่ดูนุ่มนวลผิดธรรมชาติ
2. แสงดูไม่เป็นธรรมชาติใช่ไหม? จากในตอนต้นที่อธิบายให้ฟังว่าวิดีโอ Deepfake จะสร้างขึ้นจากวิดีโอตั้งแต่ 2 ชิ้นขึ้นไป ดังนั้นแสงในแต่ละวิดีโอจะไม่เหมือนกัน ดังนั้นวิธีการตรวจสอบวิดีโอแบบดังกล่าวคือดูความผิดปกติของทิศทางแสง
3. คําหรือเสียงไม่ตรงกับภาพไหม? เสียงอาจไม่ตรงกับรูปปากของบุคคลในวิดีโอ โดยเฉพาะอย่างยิ่งหากวิดีโอถูกปลอมแปลงรูปปากและการออกเสียงมักจะไม่ตรงกัน
4. แหล่งที่มาดูน่าเชื่อถือหรือไม่? เทคนิคหนึ่งที่นักข่าวและนักวิจัยมักใช้เพื่อตรวจสอบแหล่งที่มาที่แท้จริงของภาพ ซึ่งสามารถทําได้ทันทีคือการค้นหาภาพย้อนกลับในเว็บอย่าง Google Lenses รวมทั้งตรวจสอบด้วยว่าใครโพสต์ภาพ โพสต์ที่ไหน และการโพสต์วิดีโอนั้นสมเหตุสมผลหรือไม่
อย่างไรก็ตามประเด็นเรื่องการตรวจจับวิดีโอ Deepfake ยังเป็นข้อถกเถียงระหว่างบุคลากรในวงการเทคโลยีเพราะพัฒนาการของเอไอนั้นขยับขึ้นอย่างต่อเนื่องถึงขนาดที่ว่า นักข่าวจากวอลล์ สตรีทเจอร์นัล สร้างร่างอวตารของตัวเองขึ้นมาแล้วนำร่างดังกล่าวไปทดสอบกับระบบยืนยันตัวตนด้วยเสียง (Voice Biometric) ของระบบธนาคารผ่านการพูดชื่อ นามสกุล และต่อด้วยอีเมลของนักข่าวคนดังกล่าวด้วยร่างอวตาร ท้ายที่สุดเสียงซึ่งสร้างจากเทคโนโลยี Deepfake ก็สามารถผ่านระบบยืนยันตัวตนด้วยเสียงได้
ในประเด็นนี้ทำให้นักวิเคราะห์จำนวนมากกังวลว่าหากในอนาคตระบบปัญญาประดิษฐ์สามารถสร้างร่างโคลนของบุคคลขึ้นมาและสามารถยืนยันตัวตนผ่านระบบจดจำใบหน้า (Facial Recognition) และเสียงไปพร้อมกันอาจเป็นเครื่องมือให้มิจฉาชีพใช้เพื่อทำเรื่องผิดกฎหมายได้ในอนาคต อย่างการหลอกลวงหรือปลอมตัวเป็นบุคคลดังผ่านการโคลนวิดีโอหรือเสียงแล้วหลอกเงินจากประชาชนบริสุทธิ์
มาตรการกำกับดูแล Deepfake
เพื่อป้องกันความเสียหายที่อาจเกิดขึ้นจากความล้ำหน้าของเทคโนโลยีปัญญาประดิษฐ์ปีที่ผ่านมารัฐบาลจีนออกกฎหมายควบคุมการใช้ Deepfake ประกอบด้วย ต้องได้รับการยินยอมจากบุคคลต้นแบบ, ไม่นำวิดีโอไปใช้เพื่อเผยแพร่ข่าวปลอม, ก่อนสร้างวิดีโอจำลองระบบต้องตรวจสอบยืนยันตัวตนอย่างแน่นหนา, ผู้ผลิตต้องใส่ลายน้ำในวิดีโออย่างชัดเจนว่าเป็นวิดีโอจำลอง,และห้ามสร้างเนื้อหาวิดีโอที่ขัดต่อกฎหมายด้านความมั่นคงของประเทศ
ในกรณีประเทศไทย นักวิชาการด้านกฎหมายให้ความเห็นว่า สามารถใช้พระราชบัญญัติการกระทำความผิดเกี่ยวกับความผิดทางคอมพิวเตอร์ ในมาตรา 14 และมาตรา 16 ที่บัญญัติไว้ว่า การนำภาพบุคคลอื่น ไม่ว่าภาพนั้นจะสร้างขึ้น หรือตัดต่อ หรือเติม หรือวิธีการใด หากนำไปเผยแพร่ต่อและสร้างความอับอายจะมีโทษจำคุกไม่เกิน 3 ปี ปรับไม่เกิน 200,000 บาท
ขณะที่สหภาพยุโรป (EU) เป็นกลุ่มประเทศแรกที่ออกกฎหมายเพื่อกำกับดูแลการใช้งานเอไอในภาพรวม ซึ่งก็เข้ามาควบคุมความกังวลที่จะนำเทคโนโลยี Deepfake มาใช้เพื่อยืนยันตัวตนและทำธุรกรรมต่างๆ แทนบุคคลจริง
โดยกฎหมาย AI ACT ของอียูออกกฎห้ามหลักๆ ทั้งหมด 6 ข้อคือ ห้ามจดจำลักษณะทางชีวภาพของบุคคล (Biometric Categorisation Systems) ห้ามคัดลอกใบหน้าของบุคคลเพื่อสร้างเป็นฐานข้อมูลในการยืนยันตัวตน (Untargeted Scraping of Facial Images) ห้ามใช้เซนเซอร์ตรวจจับอารมณ์และสีหน้าของบุคคล (Emotion recognition) ห้ามใช้ระบบหักคะแนนความประพฤติจากการจดจำใบหน้า (Social Scoring ) ห้ามใช้เอไอที่สร้างขึ้นมาเพื่อชี้นำการกระทำของมนุษย์และจำกัดเสรีภาพ และห้ามใช้เอไอที่มีจุดประสงค์เพื่อหาประโยชน์จากความไม่สมบูรณ์และความเปราะบางของบุคคล
คำศัพท์เบื้องต้น
- Deep Neural Networks = ลักษณะการเรียนรู้ของปัญญาประดิษฐ์ที่เลียนแบบการเรียนรู้ของมนุษย์ผ่านการจดจำข้อมูล ระบบ แบบแผนแบบซ้ำๆ ของชุดข้อมูลที่ได้รับการเทรนเพื่อทำนายข้อมูลที่มีแนวโน้มเกิดขึ้นในอนาคต
- Machine Learning = การทำให้เครื่องจักรซึ่งคือคอมพิวเตอร์หรืออุปกรณ์อิเล็กทรอนิกส์สามารถเรียนรู้ข้อมูลได้ด้วยตัวเองผ่านการเทรนด้วยข้อมูลมหาศาล
- Generative Adversarial Networks (GAN) คือลักษณะการเรียนรู้และสร้างสื่อของปัญญาประดิษฐ์ผ่านการผสมผสานระหว่างรูปภาพต้นฉบับประกอบเข้ากับการเรียนรู้เชิงลึกของสมองกลแล้วสร้างขึ้นมาเป็น รูปภาพ วิดีโอ หรือเพลงชุดใหม่ขึ้นมา