ต้นขั้ว วิธีใช้ Generative AI Voices อย่างมีจริยธรรมสำหรับธุรกิจในปี 2023 - Unite.AI
เชื่อมต่อกับเรา

ผู้นำทางความคิด

วิธีใช้ Generative AI Voices อย่างมีจริยธรรมสำหรับธุรกิจในปี 2023

mm
วันที่อัพเดท on

ปลายปี 2022 เกิดขึ้นจากการที่เทคโนโลยี AI ได้รับการยอมรับอย่างแพร่หลายเนื่องจากความนิยมอย่างมากของ OpenAI และ ChatGPT เป็นครั้งแรกที่ AI ได้รับความสนใจจากตลาดมวลชนด้วยการพิสูจน์ประโยชน์และคุณค่าในการสร้างผลลัพธ์ทางธุรกิจที่ประสบความสำเร็จ

เทคโนโลยี AI จำนวนมากที่ดูเหมือนจะเป็นการปฏิวัติต่อผู้คนทั่วไปในปี 2023 นั้นใช้งานจริงโดยธุรกิจขนาดใหญ่และสื่อเป็นเวลาหลายปี เข้าร่วมกับฉันในขณะที่ฉันมองอย่างใกล้ชิดเกี่ยวกับเทคโนโลยีที่ขับเคลื่อนโซลูชันเหล่านี้ โดยเฉพาะอย่างยิ่ง ระบบ AI กำเนิดสำหรับการโคลนเสียง ประโยชน์ทางธุรกิจ และแนวทางด้านจริยธรรมในการใช้ AI

การโคลนเสียงทำงานอย่างไร

พูดสั้นๆ ก็คือ การโคลนเสียงทำให้คนหนึ่งพูดโดยใช้เสียงของอีกคนหนึ่งได้

ใช้เทคโนโลยี AI กำเนิดเพื่อสร้างการบันทึกเสียงของบุคคลและใช้เพื่อสร้างเนื้อหาเสียงใหม่ด้วยเสียงของบุคคลเดียวกัน โดยพื้นฐานแล้วทำให้ผู้คนสามารถได้ยินสิ่งที่ใครบางคนพูด แม้ว่าพวกเขาจะไม่ได้พูดด้วยตัวเองก็ตาม

ในด้านเทคนิค สิ่งต่าง ๆ ดูเหมือนจะไม่ซับซ้อนมากนัก แต่ถ้าคุณเจาะลึกลงไปอีกเล็กน้อย มีข้อกำหนดขั้นต่ำในการเริ่มต้น:

  1. คุณต้องการเสียงต้นฉบับที่บันทึกคุณภาพสูงอย่างน้อย 5 นาทีเพื่อโคลน การบันทึกเหล่านี้ควรมีความชัดเจนและปราศจากเสียงรบกวนหรือการบิดเบือนอื่นๆ เนื่องจากความไม่สมบูรณ์ใดๆ อาจส่งผลต่อความแม่นยำของเอาต์พุตของโมเดล
  2. หลังจากนั้น ให้ป้อนการบันทึกเหล่านี้ลงในโมเดล AI กำเนิดเพื่อสร้าง "อวาตาร์เสียง"
  3. จากนั้น ฝึกฝนโมเดลเพื่อสร้างรูปแบบการพูดที่ถูกต้องแม่นยำในระดับเสียงสูงต่ำและจังหวะเวลา
  4. เมื่อเสร็จแล้ว โมเดลที่ผ่านการฝึกอบรมนี้สามารถสร้างเนื้อหาได้ไม่จำกัดโดยใช้เสียงต้นฉบับของบุคคลอื่น กลายเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการสร้างเสียงจำลองที่ให้เสียงเหมือนจริง

นี่คือประเด็นที่หลายคนหยิบยกข้อกังวลด้านจริยธรรม จะเกิดอะไรขึ้นเมื่อเราใส่ข้อความใด ๆ เข้าไปในปากของคนอื่นและไม่สามารถบอกได้ว่าคำเหล่านั้นจริงหรือปลอม?

ใช่ ความเป็นไปได้นี้กลายเป็นความจริงมานานแล้ว เช่นเดียวกับในกรณีของ OpenAI และ ChatGPT เรากำลังเผชิญกับปัญหาด้านจริยธรรมหลายประการที่ไม่สามารถเพิกเฉยได้

มาตรฐานทางจริยธรรมใน AI

เช่นเดียวกับเทคโนโลยีใหม่อื่น ๆ ในระยะเริ่มต้นของการนำมาใช้ ภัยคุกคามหลักคือการสร้างมลทินเชิงลบเกี่ยวกับเทคโนโลยี แทนที่จะยอมรับว่าภัยคุกคามนั้นเป็นแหล่งข้อมูลสำหรับการสนทนาและความรู้ที่มีค่า สิ่งสำคัญคือการเปิดเผยวิธีการที่ผู้ไม่ประสงค์ดีใช้ในทางที่ผิดต่อเทคโนโลยีและผลิตภัณฑ์ ใช้เครื่องมือลดผลกระทบ และเรียนรู้ต่อไป 

วันนี้เรามีกรอบสามชั้นสำหรับมาตรฐานทางจริยธรรมที่เกี่ยวข้องกับการใช้ generative AI ชั้นการกำกับดูแลระดับชาติและระดับนานาชาติกำลังอยู่ในช่วงเริ่มต้นของการพัฒนา โลกของนโยบายอาจตามความเร็วของการพัฒนาเทคโนโลยีเกิดใหม่ไม่ทัน แต่เราสามารถสังเกตได้ว่าสหภาพยุโรปเป็นผู้นำด้วย ข้อเสนอของสหภาพยุโรปเกี่ยวกับกฎระเบียบ AI และ หลักปฏิบัติเกี่ยวกับการบิดเบือนข้อมูลปี 2022 ซึ่งสรุปความคาดหวังของบริษัทเทคโนโลยีขนาดใหญ่ในการจัดการกับการเผยแพร่เนื้อหาที่ดัดแปลงโดย AI ที่เป็นอันตราย ในระดับประเทศ เราได้เห็นขั้นตอนแรกด้านกฎระเบียบของสหรัฐฯ และสหราชอาณาจักรในการแก้ไขปัญหาที่เกิดขึ้นกับสหรัฐฯ หน่วยงาน Deepfake และ Digital Provenance แห่งชาติ และของสหราชอาณาจักร บิลความปลอดภัยออนไลน์

ชั้นของอุตสาหกรรมเทคโนโลยีกำลังเคลื่อนตัวเร็วขึ้น เนื่องจากบริษัทและนักเทคโนโลยีกำลังยอมรับความเป็นจริงใหม่นี้เนื่องจากเกี่ยวข้องกับเทคโนโลยีที่เกิดขึ้นใหม่และผลกระทบต่อความปลอดภัยทางสังคมและความเป็นส่วนตัว การโต้ตอบเกี่ยวกับจริยธรรมของเจเนอเรทีฟเอไอนั้นมีชีวิตชีวาและได้นำไปสู่แนวทางการพัฒนาความคิดริเริ่มในอุตสาหกรรมสำหรับหลักจรรยาบรรณเกี่ยวกับการใช้เอไอกำเนิด (เช่น ความร่วมมือในแนวทางปฏิบัติเกี่ยวกับสื่อสังเคราะห์ AI) และแถลงการณ์ด้านจริยธรรมที่ออกโดยบริษัทต่างๆ คำถามคือจะทำอย่างไรให้ประพฤติปฏิบัติได้? และสามารถส่งผลกระทบต่อผลิตภัณฑ์ คุณลักษณะเฉพาะ และขั้นตอนของทีมได้หรือไม่ 

หลังจากทำงานเกี่ยวกับปัญหานี้กับสื่อและความบันเทิงต่างๆ ชุมชนความปลอดภัยทางไซเบอร์ และจริยธรรม AI จำนวนมาก ฉันได้กำหนดหลักปฏิบัติสองสามข้อสำหรับการจัดการกับเนื้อหาและเสียงของ AI โดยเฉพาะ: 

  1. เจ้าของ IP และบริษัทที่ใช้เสียงจำลองสามารถหลีกเลี่ยงภาวะแทรกซ้อนที่อาจเกิดขึ้นได้หลายอย่างที่เกี่ยวข้องกับการใช้เสียงต้นฉบับโดยการลงนามในข้อตกลงทางกฎหมาย
  2. เจ้าของโครงการควรเปิดเผยต่อสาธารณะว่ามีการใช้เสียงเลียนแบบเพื่อที่ผู้ฟังจะไม่ถูกเข้าใจผิด
  3. บริษัทที่ทำงานเกี่ยวกับเทคโนโลยี AI สำหรับเสียงควรจัดสรรทรัพยากรเป็นเปอร์เซ็นต์เพื่อพัฒนาเทคโนโลยีที่สามารถตรวจจับและระบุเนื้อหาที่สร้างโดย AI
  4. การติดป้ายกำกับเนื้อหาที่สร้างโดย AI พร้อมลายน้ำทำให้สามารถยืนยันตัวตนด้วยเสียงได้
  5. ผู้ให้บริการ AI แต่ละรายควรตรวจสอบแต่ละโครงการเกี่ยวกับผลกระทบ (ระดับสังคม ธุรกิจ และความเป็นส่วนตัว) ก่อนที่จะตกลงดำเนินการ

แน่นอนว่าหลักการของจริยธรรมใน AI จะไม่ส่งผลกระทบต่อการแพร่กระจายของปลอมแบบโฮมเมดทางออนไลน์ อย่างไรก็ตามพวกเขาจะผลักดันโครงการใด ๆ ที่เป็นสีเทาให้พ้นมือตลาดสาธารณะ

ในปี 2021-22 มีการใช้เสียงของ AI ในโครงการกระแสหลักหลายโครงการ ซึ่งส่งผลอย่างมากต่อจริยธรรมและสังคม รวมสิ่งเหล่านี้ โคลนเสียงของลุค สกายวอล์คเกอร์ในวัยเยาว์ สำหรับซีรีส์ Mandalorian เสียง AI สำหรับ God of War 2และ เสียงของ Richard Nixon สำหรับประวัติศาสตร์ 'In Event of Moon Disaster'.

ความเชื่อมั่นในเทคโนโลยีเติบโตขึ้นนอกเหนือจากสื่อและความบันเทิง ธุรกิจดั้งเดิมในหลายอุตสาหกรรมกำลังใช้เสียงจำลองในโครงการของพวกเขา ต่อไปนี้คือกรณีการใช้งานที่โดดเด่นที่สุดบางส่วน

กรณีการใช้งานในอุตสาหกรรม

ในปี 2023 การโคลนเสียงจะเพิ่มขึ้นอย่างต่อเนื่องควบคู่ไปกับธุรกิจต่างๆ ที่จะได้รับประโยชน์มากมาย ตั้งแต่การดูแลสุขภาพและการตลาดไปจนถึงการบริการลูกค้าและอุตสาหกรรมโฆษณา การโคลนเสียงกำลังปฏิวัติวิธีการที่องค์กรต่างๆ สร้างความสัมพันธ์กับลูกค้าและปรับปรุงเวิร์กโฟลว์

การโคลนเสียงเป็นประโยชน์ต่อบุคลากรทางการแพทย์และนักสังคมสงเคราะห์ที่ทำงานในสภาพแวดล้อมออนไลน์ อวตารดิจิทัลที่มีเสียงเดียวกับผู้เชี่ยวชาญทางการแพทย์ช่วยส่งเสริมความสัมพันธ์ระหว่างพวกเขากับผู้ป่วยให้แน่นแฟ้นยิ่งขึ้น เพิ่มความไว้วางใจและรักษาลูกค้าไว้

การประยุกต์ใช้การโคลนเสียงที่เป็นไปได้ในอุตสาหกรรมภาพยนตร์และความบันเทิงนั้นมีมากมาย การคัดลอกเนื้อหาเป็นหลายภาษา การแทนที่กล่องโต้ตอบเพิ่มเติม (ADR) สำหรับเด็กและผู้ใหญ่ และตัวเลือกการปรับแต่งที่แทบไม่มีขีดจำกัดล้วนเกิดขึ้นได้ด้วยเทคโนโลยีนี้

ในทำนองเดียวกัน ในภาคการดำเนินงาน การโคลนเสียงที่ขับเคลื่อนด้วย AI สามารถให้ผลลัพธ์ที่ยอดเยี่ยมสำหรับแบรนด์ที่ต้องการโซลูชันที่คุ้มค่าสำหรับระบบตอบรับเสียงแบบโต้ตอบหรือวิดีโอการฝึกอบรมขององค์กร ด้วยเทคโนโลยีการสังเคราะห์เสียง นักแสดงสามารถขยายการเข้าถึงในขณะที่เพิ่มความสามารถในการรับส่วนที่เหลือจากการบันทึกเสียง

ประการสุดท้าย ในสตูดิโอผลิตโฆษณา การเกิดขึ้นของการโคลนเสียงได้ช่วยลดต้นทุนและจำนวนชั่วโมงที่เกี่ยวข้องกับการผลิตเชิงพาณิชย์ได้อย่างมาก ตราบใดที่มีการบันทึกคุณภาพสูงสำหรับการโคลนนิ่ง (แม้แต่จากนักแสดงที่ไม่พร้อมใช้งาน) โฆษณาก็สามารถสร้างได้อย่างรวดเร็วและสร้างสรรค์กว่าที่เคยเป็นมา

ที่น่าสนใจคือองค์กรและ SMB สามารถใช้ประโยชน์จากการโคลนเสียงเพื่อสร้างสิ่งที่เป็นเอกลักษณ์สำหรับแบรนด์ของตน โครงการขนาดใหญ่สามารถบรรลุแผนการที่ทะเยอทะยานที่สุดของพวกเขาได้ ในขณะที่ธุรกิจขนาดเล็กสามารถเข้าถึงโมเดลขนาดที่จำกัดต้นทุนก่อนหน้านี้ได้ นั่นคือความหมายของการเป็นประชาธิปไตยที่แท้จริง

ตัดขึ้น

การโคลนเสียงด้วย AI มอบคุณประโยชน์ที่เปลี่ยนแปลงเกมให้กับธุรกิจได้ เช่น การสร้างประสบการณ์ลูกค้าที่ไม่เหมือนใคร การผสานความสามารถในการประมวลผลภาษาธรรมชาติเข้ากับผลิตภัณฑ์และบริการของตน และสร้างเสียงเลียนแบบที่มีความแม่นยำสูงซึ่งฟังดูสมจริงโดยสมบูรณ์

ธุรกิจที่ต้องการรักษาความได้เปรียบในการแข่งขันในปี 2023 ควรพิจารณาการโคลนเสียงด้วย AI บริษัทต่างๆ สามารถใช้เทคโนโลยีนี้เพื่อปลดล็อกความเป็นไปได้ใหม่ๆ ที่หลากหลายเพื่อชิงส่วนแบ่งตลาดและรักษาลูกค้าไว้ได้ในขณะที่ทำเช่นนั้นด้วยวิธีการที่มีความรับผิดชอบทางจริยธรรม

แอนนาเป็นหัวหน้าฝ่ายจริยธรรมและหุ้นส่วนที่ ผู้กล่าวสุนทรพจน์ซึ่งเป็นเทคโนโลยีการโคลนเสียงที่ได้รับรางวัลเอมมี่จากยูเครน แอนนาเป็นอดีตที่ปรึกษาด้านนโยบายที่ Reface ซึ่งเป็นแอปสื่อสังเคราะห์ที่ขับเคลื่อนด้วย AI และเป็นผู้ร่วมก่อตั้งเทคโนโลยีของ Cappture เครื่องมือต่อต้านข้อมูลที่บิดเบือน ซึ่งได้รับทุนสนับสนุนจากโปรแกรมเร่งความเร็ว Startup Wise Guys แอนนามีประสบการณ์ 11 ปีในด้านนโยบายการรักษาความปลอดภัยและการป้องกัน เทคโนโลยี และการสร้างความยืดหยุ่น เธอเป็นอดีตนักวิจัยที่ศูนย์ระหว่างประเทศเพื่อการกลาโหมและความมั่นคงในทาลลินน์และสถาบันการศึกษาความมั่นคงแห่งปราก เธอยังได้ให้คำปรึกษาแก่บริษัทยักษ์ใหญ่ของยูเครนเกี่ยวกับการสร้างความยืดหยุ่นซึ่งเป็นส่วนหนึ่งของกองกำลังเฉพาะกิจสงครามลูกผสม (Hybrid warfare Task Force) ที่ Kyiv School of Economics