ผู้นำทางความคิด

วิธีการใช้เสียง AI ที่สร้างขึ้นอย่างมีจริยธรรมสำหรับธุรกิจในปี 2023

Published January 31, 2023

Updated April 28, 2026

Anna Bulakh

สิ้นปี 2022 มาถึงที่สุดของเทคโนโลยี AI ที่มีการนำไปใช้อย่างกว้างขวางเนื่องจากความนิยมที่น่าประทับใจของ OpenAI และ ChatGPT สำหรับครั้งแรก AI ได้พิสูจน์ความนิยมในตลาดมวลชนโดยการ chứng minhความสามารถและคุณค่าในการสร้างผลลัพธ์ทางธุรกิจที่ประสบความสำเร็จ

หลายเทคโนโลยี AI ที่ดูเหมือนจะเป็นปฏิวัติสำหรับคนธรรมดาในปี 2023 จริงๆ แล้วได้รับการนำไปใช้โดยธุรกิจขนาดใหญ่และสื่อมวลชนมานานหลายปี ร่วมมือกับฉันเพื่อสำรวจเทคโนโลยีที่ขับเคลื่อนโซลูชันเหล่านี้ โดยเฉพาะระบบ AI ที่สร้างเสียงแบบคลอนเสียง และวิธีการใช้ AI อย่างมีจริยธรรม

เสียงคลอนเสียงทำงานอย่างไร?

โดยสรุป เสียงคลอนเสียงช่วยให้บุคคลหนึ่งสามารถพูดด้วยเสียงของบุคคลอื่นได้

มันใช้เทคโนโลยี AI ที่สร้างขึ้นเพื่อสร้างการบันทึกเสียงของบุคคลและใช้เพื่อสร้างเนื้อหาออดิโอใหม่ด้วยเสียงของบุคคลนั้น โดยพื้นฐานแล้วมันช่วยให้คนได้ยินสิ่งที่ใครบางคนจะพูดแม้ว่าพวกเขาจะไม่ได้พูดมันเองก็ตาม

ในด้านเทคนิค สิ่งต่างๆ ดูไม่ยุ่งยากมาก แต่ถ้าคุณดูให้ลึกขึ้น มีข้อกำหนดขั้นต่ำบางอย่างเพื่อเริ่มต้น:

คุณต้องมีการบันทึกเสียงที่มีคุณภาพสูงอย่างน้อย 5 นาทีของเสียงต้นฉบับเพื่อคลอนเสียงเหล่านั้น การบันทึกเหล่านี้ควรชัดเจนและไม่มีเสียงพื้นหลังหรือการบิดเบือนอื่นๆ เนื่องจากข้อบกพร่องใดๆ อาจส่งผลต่อความแม่นยำของการผลิตของโมเดล
หลังจากนั้น ให้ใส่การบันทึกเหล่านี้เข้าไปในโมเดล AI ที่สร้างขึ้นเพื่อสร้าง “อวตารเสียง”
จากนั้นฝึกโมเดลเพื่อสร้างรูปแบบการพูดที่แม่นยำในระดับเสียงและเวลา
เมื่อเสร็จสิ้น โมเดลที่ได้รับการฝึกอบรมนี้สามารถสร้างเนื้อหาที่ไม่สิ้นสุดโดยใช้เสียงต้นฉบับของบุคคลอื่น ทำให้เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการสร้างเสียงที่เหมือนจริง

จุดนี้คือจุดที่หลายคนมีข้อกังวลด้านจริยธรรม เมื่อเราสามารถใส่ข้อความใดๆ เข้าไปในปากของใครก็ตามได้และเป็นไปไม่ได้ที่จะบอกว่าข้อความเหล่านั้นเป็นของจริงหรือปลอม?

ใช่ ความเป็นไปได้นี้ได้กลายเป็นความจริงแล้ว เช่นเดียวกับกรณีของ OpenAI และ ChatGPT เรากำลังเผชิญกับปัญหาด้านจริยธรรมหลายประการที่ไม่สามารถเพิกเฉยได้

มาตรฐานจริยธรรมใน AI

เช่นเดียวกับเทคโนโลยีใหม่ๆ อื่นๆ ในช่วงแรกของการนำไปใช้ อันตรายหลักคือการสร้างความไม่ดีให้กับเทคโนโลยีมากกว่าการยอมรับอันตรายเหล่านั้นเป็นแหล่งที่มาของการอภิปรายและความรู้ที่มีค่า สิ่งที่สำคัญคือการเปิดเผย方法ที่ผู้กระทำผิดใช้เพื่อใช้เทคโนโลยีและผลิตภัณฑ์ของมันในทางที่ผิด ใช้เครื่องมือบรรเทา และเรียนรู้ต่อไป

ปัจจุบันเรามีสามชั้นของกรอบการทำงานสำหรับมาตรฐานจริยธรรมที่เกี่ยวข้องกับการใช้ AI ที่สร้างขึ้น ชั้นการกำกับดูแลระดับชาติและระดับระหว่างประเทศอยู่ในช่วงแรกของการพัฒนา โลกนโยบายอาจไม่ตามทันความเร็วในการพัฒนาเทคโนโลยีที่เกิดขึ้นใหม่ แต่เราสามารถสังเกตเห็น EU นำหน้าด้วย ข้อเสนอของ EU เกี่ยวกับการกำกับดูแล AI และ 2022 Code of Practice on Disinformation ที่ระบุความคาดหวังสำหรับบริษัทเทคโนโลยีขนาดใหญ่ในการจัดการการเผยแพร่เนื้อหาที่ถูกบิดเบือนโดย AI ที่ชั่วร้าย ในระดับชาติ เราจะเห็นขั้นตอนการกำกับดูแลแรกโดยสหรัฐอเมริกาและสหราชอาณาจักรในการจัดการกับปัญหาด้วย National Deepfake and Digital Provenance Task Force ของสหรัฐฯ และ Online Safety Bill ของสหราชอาณาจักร

ชั้นของอุตสาหกรรมเทคโนโลยีกำลังเคลื่อนไหวเร็วขึ้น เนื่องจากบริษัทและนักเทคโนโลยีกำลับรับจริยธรรมใหม่นี้ซึ่งเกี่ยวข้องกับเทคโนโลยีที่เกิดขึ้นใหม่และผลกระทบต่อความมั่นคงและความเป็นส่วนตัวของสังคม การสนทนาที่มีเกี่ยวกับจริยธรรมของ AI ที่สร้างขึ้นเป็นเรื่องที่มีชีวิตชีวาและเป็นผู้นำในการพัฒนาโครงการริเริ่มของอุตสาหกรรมสำหรับประมวลหลักปฏิบัติเกี่ยวกับการใช้ AI ที่สร้างขึ้น (เช่น Partnership on AI Synthetic Media Code of Conduct) และคำสั่งจริยธรรมที่ออกโดยบริษัทต่างๆ คำถามคือวิธีการทำให้การดำเนินการเป็นไปอย่างเป็นรูปธรรม? และมันสามารถส่งผลกระทบต่อผลิตภัณฑ์ ฟีเจอร์เฉพาะ และขั้นตอนของทีมหรือไม่?

หลังจากทำงานในประเด็นนี้กับชุมชนสื่อและความบันเทิง ไซเบอร์ซีเคียวริตี้ และจริยธรรม AI หลายแห่ง ฉันจึงได้กำหนดหลักการปฏิบัติที่เป็นรูปธรรมบางประการสำหรับการจัดการเนื้อหาที่สร้างขึ้นและเสียงโดยเฉพาะ:

เจ้าของสิทธิ์ในทรัพย์สินทางปัญญาและบริษัทที่ใช้เสียงที่ถูกคลอนสามารถหลีกเลี่ยงปัญหาที่อาจเกิดขึ้นมากมายที่เกี่ยวข้องกับการใช้เสียงต้นฉบับโดยการลงนามในข้อตกลงทางกฎหมาย
เจ้าของโครงการควรเปิดเผยการใช้เสียงที่ถูกคลอนต่อสาธารณะเพื่อให้ผู้ฟังไม่ถูกหลอกลวง
บริษัทที่ทำงานเกี่ยวกับเทคโนโลยี AI สำหรับเสียงควรจัดสรรทรัพยากรบางส่วนเพื่อพัฒนาเทคโนโลยีที่สามารถตรวจจับและระบุเนื้อหาที่สร้างขึ้นโดย AI
การทำเครื่องหมายเนื้อหาที่สร้างขึ้นโดย AI ด้วยวอเตอร์มาร์กช่วยให้สามารถตรวจสอบเสียงได้
ผู้ให้บริการ AI แต่ละรายควรทบทวนโครงการที่มีผลกระทบ (ระดับสังคม ธุรกิจ และความเป็นส่วนตัว) ก่อนที่จะ 同意ที่จะทำงานในโครงการนั้น

แน่นอนว่าหลักการของจริยธรรมใน AI จะไม่ส่งผลกระทบต่อการแพร่กระจายของ deep fake ที่ทำเองที่บ้านออนไลน์ แต่มันจะผลักดันให้โครงการในพื้นที่สีเทาออกไปจากตลาดสาธารณะ

ในปี 2021-22 เสียง AI ถูกใช้ในโครงการหลักหลายโครงการที่มีผลกระทบทางจริยธรรมและสังคมอย่างมาก รวมถึง การคลอนเสียงของ Luke Skywalker ที่อายุน้อย สำหรับซีรีส์ The Mandalorian, เสียง AI สำหรับ God of War 2 และ เสียงของ Richard Nixon สำหรับ ‘In Event of Moon Disaster’

ความเชื่อมั่นในเทคโนโลยีกำลังเติบโตนอกเหนือจากสื่อและความบันเทิง ธุรกิจแบบดั้งเดิมในอุตสาหกรรมต่างๆ กำลังใช้เสียงที่ถูกคลอนในโครงการของตน ต่อไปนี้คือกรณีการใช้งานที่โดดเด่นที่สุด

กรณีการใช้งานในอุตสาหกรรม

ในปี 2023 การคลอนเสียงจะยังคงเพิ่มขึ้นพร้อมกับธุรกิจต่างๆ ที่จะเก็บเกี่ยวผลประโยชน์มากมาย ตั้งแต่สุขภาพและการตลาดไปจนถึงการบริการลูกค้าและอุตสาหกรรมโฆษณา การคลอนเสียงกำลังปฏิวัติวิธีการที่องค์กรสร้างความสัมพันธ์กับลูกค้าและปรับปรุงกระบวนการทำงานของตน

การคลอนเสียงมีประโยชน์ต่อผู้เชี่ยวชาญด้านสุขภาพและผู้ทำงานสังคมที่ทำงานในสภาพแวดล้อมออนไลน์ อวตารดิจิทัลที่มีเสียงเหมือนกับผู้เชี่ยวชาญด้านสุขภาพช่วยสร้างความสัมพันธ์ที่เข้มแข็งระหว่างพวกเขาและผู้ป่วยของตน ซึ่งช่วยเพิ่มความไว้วางใจและรักษาลูกค้า

การประยุกต์ใช้การคลอนเสียงในอุตสาหกรรมภาพยนตร์และความบันเทิงมีมากมาย ตั้งแต่การดับเสียงเนื้อหาลงในหลายภาษา การแทนที่เสียงพูดเพิ่มเติมสำหรับเด็กและผู้ใหญ่ ไปจนถึงตัวเลือกการปรับแต่งที่ไม่มีที่สิ้นสุด ซึ่งทั้งหมดนี้เป็นไปได้ด้วยเทคโนโลยีนี้

ในทำนองเดียวกัน ในภาคการดำเนินงาน ระบบเสียงที่ขับเคลื่อนโดย AI สามารถให้ผลลัพธ์ที่ดีเยี่ยมสำหรับแบรนด์ที่ต้องการโซลูชันที่คุ้มค่าสำหรับระบบตอบรับเสียงอัตโนมัติหรือวิดีโอการฝึกอบรมขององค์กร ด้วยเทคโนโลยีการสังเคราะห์เสียง นักแสดงสามารถขยายขอบเขตการทำงานของตนได้ ในขณะเดียวกันก็เพิ่มความสามารถในการสร้างรายได้จากการบันทึก

สุดท้าย ในสตูดิโอการผลิตโฆษณา การเกิดขึ้นของการคลอนเสียงช่วยลดต้นทุนและจำนวนชั่วโมงที่เกี่ยวข้องกับการผลิตโฆษณาได้อย่างมีนัยสำคัญ ตราบใดที่มีการบันทึกคุณภาพสูงสำหรับการคลอนเสียง (แม้แต่จากนักแสดงไม่มีอยู่) โฆษณาสามารถผลิตได้อย่างรวดเร็วและสร้างสรรค์มากกว่าเดิม

น่าสนใจที่จะทราบว่าธุรกิจขนาดใหญ่และขนาดกลางสามารถใช้การคลอนเสียงเพื่อสร้างสิ่งที่เป็นเอกลักษณ์สำหรับแบรนด์ของตน โครงการขนาดใหญ่สามารถทำให้แผนการใหญ่ที่สุดของตนเป็นจริง ในขณะที่ธุรกิจขนาดเล็กสามารถเข้าถึงแบบจำลองขนาดใหญ่ที่เคยเป็นเรื่องไม่คุ้มค่ามาก่อน นั่นคือสิ่งที่เรียกว่าการทำให้เป็นประชาธิปไตยที่แท้จริง

สรุป

การคลอนเสียง AI มอบผลประโยชน์ที่เปลี่ยนแปลงเกมให้กับธุรกิจ เช่น การสร้างประสบการณ์ลูกค้าที่ไม่เหมือนใคร การรวมความสามารถในการประมวลผลภาษาธรรมชาติเข้ากับผลิตภัณฑ์และบริการของตน และการสร้างเสียงที่เหมือนจริงที่แม่นยำ

ธุรกิจที่ต้องการรักษาความได้เปรียบในการแข่งขันในปี 2023 ควรพิจารณาการคลอนเสียง AI บริษัทสามารถใช้เทคโนโลยีนี้เพื่อปลดล็อกความเป็นไปได้ใหม่ๆ เพื่อชนะส่วนแบ่งการตลาดและรักษาลูกค้าได้ ในขณะเดียวกันก็ทำเช่นนั้นในลักษณะที่รับผิดชอบต่อจริยธรรม

Anna Bulakh

อันนาเป็นหัวหน้าด้านจริยธรรมและหุ้นส่วน tại Respeecher เทคโนโลยีการโคลนเสียงที่ได้รับรางวัล Emmy ซึ่งตั้งอยู่ในยูเครน อันนาเป็นอดีตที่ปรึกษานโยบายที่ Reface แอปสื่อสังเคราะห์ที่ใช้ AI และเป็นผู้ร่วมก่อตั้งด้านเทคนิคของเครื่องมือต่อต้านการเผยแพร่ข้อมูลที่ไม่ถูกต้อง Cappture ซึ่งได้รับการสนับสนุนจากโปรแกรมเร่งการเริ่มต้นธุรกิจ Startup Wise Guys อันนามีประสบการณ์ 11 ปี ในด้านนโยบายความมั่นคงและป้องกันประเทศ เทคโนโลยี และการสร้างความยืดหยุ่น เธอเป็นอดีตนักวิจัยที่ศูนย์ระหว่างประเทศด้านการป้องกันและความมั่นคง ในทาลลินน์ และสถาบัณฑ์ศึกษาด้านความมั่นคงแห่งปราก เธอยังได้ให้คำปรึกษากับบริษัทชั้นนำของยูเครนเกี่ยวกับการสร้างความยืดหยุ่นในฐานะทีมงานกองบัญชาการสงครามไฮบริดที่ Kyiv School of Economics

Unite.AI

วิธีการใช้เสียง AI ที่สร้างขึ้นอย่างมีจริยธรรมสำหรับธุรกิจในปี 2023

เสียงคลอนเสียงทำงานอย่างไร?

มาตรฐานจริยธรรมใน AI

กรณีการใช้งานในอุตสาหกรรม

สรุป

You may like