ผู้นำทางความคิด
วิธีการใช้เสียง AI ที่สร้างขึ้นอย่างมีจริยธรรมสำหรับธุรกิจในปี 2023

สิ้นปี 2022 มาถึงที่สุดของเทคโนโลยี AI ที่มีการนำไปใช้อย่างกว้างขวางเนื่องจากความนิยมที่น่าประทับใจของ OpenAI และ ChatGPT สำหรับครั้งแรก AI ได้พิสูจน์ความนิยมในตลาดมวลชนโดยการ chứng minhความสามารถและคุณค่าในการสร้างผลลัพธ์ทางธุรกิจที่ประสบความสำเร็จ
หลายเทคโนโลยี AI ที่ดูเหมือนจะเป็นปฏิวัติสำหรับคนธรรมดาในปี 2023 จริงๆ แล้วได้รับการนำไปใช้โดยธุรกิจขนาดใหญ่และสื่อมวลชนมานานหลายปี ร่วมมือกับฉันเพื่อสำรวจเทคโนโลยีที่ขับเคลื่อนโซลูชันเหล่านี้ โดยเฉพาะระบบ AI ที่สร้างเสียงแบบคลอนเสียง และวิธีการใช้ AI อย่างมีจริยธรรม
เสียงคลอนเสียงทำงานอย่างไร?
โดยสรุป เสียงคลอนเสียงช่วยให้บุคคลหนึ่งสามารถพูดด้วยเสียงของบุคคลอื่นได้
มันใช้เทคโนโลยี AI ที่สร้างขึ้นเพื่อสร้างการบันทึกเสียงของบุคคลและใช้เพื่อสร้างเนื้อหาออดิโอใหม่ด้วยเสียงของบุคคลนั้น โดยพื้นฐานแล้วมันช่วยให้คนได้ยินสิ่งที่ใครบางคนจะพูดแม้ว่าพวกเขาจะไม่ได้พูดมันเองก็ตาม
ในด้านเทคนิค สิ่งต่างๆ ดูไม่ยุ่งยากมาก แต่ถ้าคุณดูให้ลึกขึ้น มีข้อกำหนดขั้นต่ำบางอย่างเพื่อเริ่มต้น:
- คุณต้องมีการบันทึกเสียงที่มีคุณภาพสูงอย่างน้อย 5 นาทีของเสียงต้นฉบับเพื่อคลอนเสียงเหล่านั้น การบันทึกเหล่านี้ควรชัดเจนและไม่มีเสียงพื้นหลังหรือการบิดเบือนอื่นๆ เนื่องจากข้อบกพร่องใดๆ อาจส่งผลต่อความแม่นยำของการผลิตของโมเดล
- หลังจากนั้น ให้ใส่การบันทึกเหล่านี้เข้าไปในโมเดล AI ที่สร้างขึ้นเพื่อสร้าง “อวตารเสียง”
- จากนั้นฝึกโมเดลเพื่อสร้างรูปแบบการพูดที่แม่นยำในระดับเสียงและเวลา
- เมื่อเสร็จสิ้น โมเดลที่ได้รับการฝึกอบรมนี้สามารถสร้างเนื้อหาที่ไม่สิ้นสุดโดยใช้เสียงต้นฉบับของบุคคลอื่น ทำให้เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการสร้างเสียงที่เหมือนจริง
จุดนี้คือจุดที่หลายคนมีข้อกังวลด้านจริยธรรม เมื่อเราสามารถใส่ข้อความใดๆ เข้าไปในปากของใครก็ตามได้และเป็นไปไม่ได้ที่จะบอกว่าข้อความเหล่านั้นเป็นของจริงหรือปลอม?
ใช่ ความเป็นไปได้นี้ได้กลายเป็นความจริงแล้ว เช่นเดียวกับกรณีของ OpenAI และ ChatGPT เรากำลังเผชิญกับปัญหาด้านจริยธรรมหลายประการที่ไม่สามารถเพิกเฉยได้
มาตรฐานจริยธรรมใน AI
เช่นเดียวกับเทคโนโลยีใหม่ๆ อื่นๆ ในช่วงแรกของการนำไปใช้ อันตรายหลักคือการสร้างความไม่ดีให้กับเทคโนโลยีมากกว่าการยอมรับอันตรายเหล่านั้นเป็นแหล่งที่มาของการอภิปรายและความรู้ที่มีค่า สิ่งที่สำคัญคือการเปิดเผย方法ที่ผู้กระทำผิดใช้เพื่อใช้เทคโนโลยีและผลิตภัณฑ์ของมันในทางที่ผิด ใช้เครื่องมือบรรเทา และเรียนรู้ต่อไป
ปัจจุบันเรามีสามชั้นของกรอบการทำงานสำหรับมาตรฐานจริยธรรมที่เกี่ยวข้องกับการใช้ AI ที่สร้างขึ้น ชั้นการกำกับดูแลระดับชาติและระดับระหว่างประเทศอยู่ในช่วงแรกของการพัฒนา โลกนโยบายอาจไม่ตามทันความเร็วในการพัฒนาเทคโนโลยีที่เกิดขึ้นใหม่ แต่เราสามารถสังเกตเห็น EU นำหน้าด้วย ข้อเสนอของ EU เกี่ยวกับการกำกับดูแล AI และ 2022 Code of Practice on Disinformation ที่ระบุความคาดหวังสำหรับบริษัทเทคโนโลยีขนาดใหญ่ในการจัดการการเผยแพร่เนื้อหาที่ถูกบิดเบือนโดย AI ที่ชั่วร้าย ในระดับชาติ เราจะเห็นขั้นตอนการกำกับดูแลแรกโดยสหรัฐอเมริกาและสหราชอาณาจักรในการจัดการกับปัญหาด้วย National Deepfake and Digital Provenance Task Force ของสหรัฐฯ และ Online Safety Bill ของสหราชอาณาจักร
ชั้นของอุตสาหกรรมเทคโนโลยีกำลังเคลื่อนไหวเร็วขึ้น เนื่องจากบริษัทและนักเทคโนโลยีกำลับรับจริยธรรมใหม่นี้ซึ่งเกี่ยวข้องกับเทคโนโลยีที่เกิดขึ้นใหม่และผลกระทบต่อความมั่นคงและความเป็นส่วนตัวของสังคม การสนทนาที่มีเกี่ยวกับจริยธรรมของ AI ที่สร้างขึ้นเป็นเรื่องที่มีชีวิตชีวาและเป็นผู้นำในการพัฒนาโครงการริเริ่มของอุตสาหกรรมสำหรับประมวลหลักปฏิบัติเกี่ยวกับการใช้ AI ที่สร้างขึ้น (เช่น Partnership on AI Synthetic Media Code of Conduct) และคำสั่งจริยธรรมที่ออกโดยบริษัทต่างๆ คำถามคือวิธีการทำให้การดำเนินการเป็นไปอย่างเป็นรูปธรรม? และมันสามารถส่งผลกระทบต่อผลิตภัณฑ์ ฟีเจอร์เฉพาะ และขั้นตอนของทีมหรือไม่?
หลังจากทำงานในประเด็นนี้กับชุมชนสื่อและความบันเทิง ไซเบอร์ซีเคียวริตี้ และจริยธรรม AI หลายแห่ง ฉันจึงได้กำหนดหลักการปฏิบัติที่เป็นรูปธรรมบางประการสำหรับการจัดการเนื้อหาที่สร้างขึ้นและเสียงโดยเฉพาะ:
- เจ้าของสิทธิ์ในทรัพย์สินทางปัญญาและบริษัทที่ใช้เสียงที่ถูกคลอนสามารถหลีกเลี่ยงปัญหาที่อาจเกิดขึ้นมากมายที่เกี่ยวข้องกับการใช้เสียงต้นฉบับโดยการลงนามในข้อตกลงทางกฎหมาย
- เจ้าของโครงการควรเปิดเผยการใช้เสียงที่ถูกคลอนต่อสาธารณะเพื่อให้ผู้ฟังไม่ถูกหลอกลวง
- บริษัทที่ทำงานเกี่ยวกับเทคโนโลยี AI สำหรับเสียงควรจัดสรรทรัพยากรบางส่วนเพื่อพัฒนาเทคโนโลยีที่สามารถตรวจจับและระบุเนื้อหาที่สร้างขึ้นโดย AI
- การทำเครื่องหมายเนื้อหาที่สร้างขึ้นโดย AI ด้วยวอเตอร์มาร์กช่วยให้สามารถตรวจสอบเสียงได้
- ผู้ให้บริการ AI แต่ละรายควรทบทวนโครงการที่มีผลกระทบ (ระดับสังคม ธุรกิจ และความเป็นส่วนตัว) ก่อนที่จะ 同意ที่จะทำงานในโครงการนั้น
แน่นอนว่าหลักการของจริยธรรมใน AI จะไม่ส่งผลกระทบต่อการแพร่กระจายของ deep fake ที่ทำเองที่บ้านออนไลน์ แต่มันจะผลักดันให้โครงการในพื้นที่สีเทาออกไปจากตลาดสาธารณะ
ในปี 2021-22 เสียง AI ถูกใช้ในโครงการหลักหลายโครงการที่มีผลกระทบทางจริยธรรมและสังคมอย่างมาก รวมถึง การคลอนเสียงของ Luke Skywalker ที่อายุน้อย สำหรับซีรีส์ The Mandalorian, เสียง AI สำหรับ God of War 2 และ เสียงของ Richard Nixon สำหรับ ‘In Event of Moon Disaster’
ความเชื่อมั่นในเทคโนโลยีกำลังเติบโตนอกเหนือจากสื่อและความบันเทิง ธุรกิจแบบดั้งเดิมในอุตสาหกรรมต่างๆ กำลังใช้เสียงที่ถูกคลอนในโครงการของตน ต่อไปนี้คือกรณีการใช้งานที่โดดเด่นที่สุด
กรณีการใช้งานในอุตสาหกรรม
ในปี 2023 การคลอนเสียงจะยังคงเพิ่มขึ้นพร้อมกับธุรกิจต่างๆ ที่จะเก็บเกี่ยวผลประโยชน์มากมาย ตั้งแต่สุขภาพและการตลาดไปจนถึงการบริการลูกค้าและอุตสาหกรรมโฆษณา การคลอนเสียงกำลังปฏิวัติวิธีการที่องค์กรสร้างความสัมพันธ์กับลูกค้าและปรับปรุงกระบวนการทำงานของตน
การคลอนเสียงมีประโยชน์ต่อผู้เชี่ยวชาญด้านสุขภาพและผู้ทำงานสังคมที่ทำงานในสภาพแวดล้อมออนไลน์ อวตารดิจิทัลที่มีเสียงเหมือนกับผู้เชี่ยวชาญด้านสุขภาพช่วยสร้างความสัมพันธ์ที่เข้มแข็งระหว่างพวกเขาและผู้ป่วยของตน ซึ่งช่วยเพิ่มความไว้วางใจและรักษาลูกค้า
การประยุกต์ใช้การคลอนเสียงในอุตสาหกรรมภาพยนตร์และความบันเทิงมีมากมาย ตั้งแต่การดับเสียงเนื้อหาลงในหลายภาษา การแทนที่เสียงพูดเพิ่มเติมสำหรับเด็กและผู้ใหญ่ ไปจนถึงตัวเลือกการปรับแต่งที่ไม่มีที่สิ้นสุด ซึ่งทั้งหมดนี้เป็นไปได้ด้วยเทคโนโลยีนี้
ในทำนองเดียวกัน ในภาคการดำเนินงาน ระบบเสียงที่ขับเคลื่อนโดย AI สามารถให้ผลลัพธ์ที่ดีเยี่ยมสำหรับแบรนด์ที่ต้องการโซลูชันที่คุ้มค่าสำหรับระบบตอบรับเสียงอัตโนมัติหรือวิดีโอการฝึกอบรมขององค์กร ด้วยเทคโนโลยีการสังเคราะห์เสียง นักแสดงสามารถขยายขอบเขตการทำงานของตนได้ ในขณะเดียวกันก็เพิ่มความสามารถในการสร้างรายได้จากการบันทึก
สุดท้าย ในสตูดิโอการผลิตโฆษณา การเกิดขึ้นของการคลอนเสียงช่วยลดต้นทุนและจำนวนชั่วโมงที่เกี่ยวข้องกับการผลิตโฆษณาได้อย่างมีนัยสำคัญ ตราบใดที่มีการบันทึกคุณภาพสูงสำหรับการคลอนเสียง (แม้แต่จากนักแสดงไม่มีอยู่) โฆษณาสามารถผลิตได้อย่างรวดเร็วและสร้างสรรค์มากกว่าเดิม
น่าสนใจที่จะทราบว่าธุรกิจขนาดใหญ่และขนาดกลางสามารถใช้การคลอนเสียงเพื่อสร้างสิ่งที่เป็นเอกลักษณ์สำหรับแบรนด์ของตน โครงการขนาดใหญ่สามารถทำให้แผนการใหญ่ที่สุดของตนเป็นจริง ในขณะที่ธุรกิจขนาดเล็กสามารถเข้าถึงแบบจำลองขนาดใหญ่ที่เคยเป็นเรื่องไม่คุ้มค่ามาก่อน นั่นคือสิ่งที่เรียกว่าการทำให้เป็นประชาธิปไตยที่แท้จริง
สรุป
การคลอนเสียง AI มอบผลประโยชน์ที่เปลี่ยนแปลงเกมให้กับธุรกิจ เช่น การสร้างประสบการณ์ลูกค้าที่ไม่เหมือนใคร การรวมความสามารถในการประมวลผลภาษาธรรมชาติเข้ากับผลิตภัณฑ์และบริการของตน และการสร้างเสียงที่เหมือนจริงที่แม่นยำ
ธุรกิจที่ต้องการรักษาความได้เปรียบในการแข่งขันในปี 2023 ควรพิจารณาการคลอนเสียง AI บริษัทสามารถใช้เทคโนโลยีนี้เพื่อปลดล็อกความเป็นไปได้ใหม่ๆ เพื่อชนะส่วนแบ่งการตลาดและรักษาลูกค้าได้ ในขณะเดียวกันก็ทำเช่นนั้นในลักษณะที่รับผิดชอบต่อจริยธรรม












