ผู้นำทางความคิด
วิธีใช้ Generative AI Voices อย่างมีจริยธรรมสำหรับธุรกิจในปี 2023
ปลายปี 2022 เกิดขึ้นจากการที่เทคโนโลยี AI ได้รับการยอมรับอย่างแพร่หลายเนื่องจากความนิยมอย่างมากของ OpenAI และ ChatGPT เป็นครั้งแรกที่ AI ได้รับความสนใจจากตลาดมวลชนด้วยการพิสูจน์ประโยชน์และคุณค่าในการสร้างผลลัพธ์ทางธุรกิจที่ประสบความสำเร็จ
เทคโนโลยี AI จำนวนมากที่ดูเหมือนจะเป็นการปฏิวัติต่อผู้คนทั่วไปในปี 2023 นั้นใช้งานจริงโดยธุรกิจขนาดใหญ่และสื่อเป็นเวลาหลายปี เข้าร่วมกับฉันในขณะที่ฉันมองอย่างใกล้ชิดเกี่ยวกับเทคโนโลยีที่ขับเคลื่อนโซลูชันเหล่านี้ โดยเฉพาะอย่างยิ่ง ระบบ AI กำเนิดสำหรับการโคลนเสียง ประโยชน์ทางธุรกิจ และแนวทางด้านจริยธรรมในการใช้ AI
การโคลนเสียงทำงานอย่างไร
พูดสั้นๆ ก็คือ การโคลนเสียงทำให้คนหนึ่งพูดโดยใช้เสียงของอีกคนหนึ่งได้
ใช้เทคโนโลยี AI กำเนิดเพื่อสร้างการบันทึกเสียงของบุคคลและใช้เพื่อสร้างเนื้อหาเสียงใหม่ด้วยเสียงของบุคคลเดียวกัน โดยพื้นฐานแล้วทำให้ผู้คนสามารถได้ยินสิ่งที่ใครบางคนพูด แม้ว่าพวกเขาจะไม่ได้พูดด้วยตัวเองก็ตาม
ในด้านเทคนิค สิ่งต่าง ๆ ดูเหมือนจะไม่ซับซ้อนมากนัก แต่ถ้าคุณเจาะลึกลงไปอีกเล็กน้อย มีข้อกำหนดขั้นต่ำในการเริ่มต้น:
- คุณต้องการเสียงต้นฉบับที่บันทึกคุณภาพสูงอย่างน้อย 5 นาทีเพื่อโคลน การบันทึกเหล่านี้ควรมีความชัดเจนและปราศจากเสียงรบกวนหรือการบิดเบือนอื่นๆ เนื่องจากความไม่สมบูรณ์ใดๆ อาจส่งผลต่อความแม่นยำของเอาต์พุตของโมเดล
- หลังจากนั้น ให้ป้อนการบันทึกเหล่านี้ลงในโมเดล AI กำเนิดเพื่อสร้าง "อวาตาร์เสียง"
- จากนั้น ฝึกฝนโมเดลเพื่อสร้างรูปแบบการพูดที่ถูกต้องแม่นยำในระดับเสียงสูงต่ำและจังหวะเวลา
- เมื่อเสร็จแล้ว โมเดลที่ผ่านการฝึกอบรมนี้สามารถสร้างเนื้อหาได้ไม่จำกัดโดยใช้เสียงต้นฉบับของบุคคลอื่น กลายเป็นเครื่องมือที่มีประสิทธิภาพสำหรับการสร้างเสียงจำลองที่ให้เสียงเหมือนจริง
นี่คือประเด็นที่หลายคนหยิบยกข้อกังวลด้านจริยธรรม จะเกิดอะไรขึ้นเมื่อเราใส่ข้อความใด ๆ เข้าไปในปากของคนอื่นและไม่สามารถบอกได้ว่าคำเหล่านั้นจริงหรือปลอม?
ใช่ ความเป็นไปได้นี้กลายเป็นความจริงมานานแล้ว เช่นเดียวกับในกรณีของ OpenAI และ ChatGPT เรากำลังเผชิญกับปัญหาด้านจริยธรรมหลายประการที่ไม่สามารถเพิกเฉยได้
มาตรฐานทางจริยธรรมใน AI
เช่นเดียวกับเทคโนโลยีใหม่อื่น ๆ ในระยะเริ่มต้นของการนำมาใช้ ภัยคุกคามหลักคือการสร้างมลทินเชิงลบเกี่ยวกับเทคโนโลยี แทนที่จะยอมรับว่าภัยคุกคามนั้นเป็นแหล่งข้อมูลสำหรับการสนทนาและความรู้ที่มีค่า สิ่งสำคัญคือการเปิดเผยวิธีการที่ผู้ไม่ประสงค์ดีใช้ในทางที่ผิดต่อเทคโนโลยีและผลิตภัณฑ์ ใช้เครื่องมือลดผลกระทบ และเรียนรู้ต่อไป
วันนี้เรามีกรอบสามชั้นสำหรับมาตรฐานทางจริยธรรมที่เกี่ยวข้องกับการใช้ generative AI ชั้นการกำกับดูแลระดับชาติและระดับนานาชาติกำลังอยู่ในช่วงเริ่มต้นของการพัฒนา โลกของนโยบายอาจตามความเร็วของการพัฒนาเทคโนโลยีเกิดใหม่ไม่ทัน แต่เราสามารถสังเกตได้ว่าสหภาพยุโรปเป็นผู้นำด้วย ข้อเสนอของสหภาพยุโรปเกี่ยวกับกฎระเบียบ AI และ หลักปฏิบัติเกี่ยวกับการบิดเบือนข้อมูลปี 2022 ซึ่งสรุปความคาดหวังของบริษัทเทคโนโลยีขนาดใหญ่ในการจัดการกับการเผยแพร่เนื้อหาที่ดัดแปลงโดย AI ที่เป็นอันตราย ในระดับประเทศ เราได้เห็นขั้นตอนแรกด้านกฎระเบียบของสหรัฐฯ และสหราชอาณาจักรในการแก้ไขปัญหาที่เกิดขึ้นกับสหรัฐฯ หน่วยงาน Deepfake และ Digital Provenance แห่งชาติ และของสหราชอาณาจักร บิลความปลอดภัยออนไลน์.
ชั้นของอุตสาหกรรมเทคโนโลยีกำลังเคลื่อนตัวเร็วขึ้น เนื่องจากบริษัทและนักเทคโนโลยีกำลังยอมรับความเป็นจริงใหม่นี้เนื่องจากเกี่ยวข้องกับเทคโนโลยีที่เกิดขึ้นใหม่และผลกระทบต่อความปลอดภัยทางสังคมและความเป็นส่วนตัว การโต้ตอบเกี่ยวกับจริยธรรมของเจเนอเรทีฟเอไอนั้นมีชีวิตชีวาและได้นำไปสู่แนวทางการพัฒนาความคิดริเริ่มในอุตสาหกรรมสำหรับหลักจรรยาบรรณเกี่ยวกับการใช้เอไอกำเนิด (เช่น ความร่วมมือในแนวทางปฏิบัติเกี่ยวกับสื่อสังเคราะห์ AI) และแถลงการณ์ด้านจริยธรรมที่ออกโดยบริษัทต่างๆ คำถามคือจะทำอย่างไรให้ประพฤติปฏิบัติได้? และสามารถส่งผลกระทบต่อผลิตภัณฑ์ คุณลักษณะเฉพาะ และขั้นตอนของทีมได้หรือไม่
หลังจากทำงานเกี่ยวกับปัญหานี้กับสื่อและความบันเทิงต่างๆ ชุมชนความปลอดภัยทางไซเบอร์ และจริยธรรม AI จำนวนมาก ฉันได้กำหนดหลักปฏิบัติสองสามข้อสำหรับการจัดการกับเนื้อหาและเสียงของ AI โดยเฉพาะ:
- เจ้าของ IP และบริษัทที่ใช้เสียงจำลองสามารถหลีกเลี่ยงภาวะแทรกซ้อนที่อาจเกิดขึ้นได้หลายอย่างที่เกี่ยวข้องกับการใช้เสียงต้นฉบับโดยการลงนามในข้อตกลงทางกฎหมาย
- เจ้าของโครงการควรเปิดเผยต่อสาธารณะว่ามีการใช้เสียงเลียนแบบเพื่อที่ผู้ฟังจะไม่ถูกเข้าใจผิด
- บริษัทที่ทำงานเกี่ยวกับเทคโนโลยี AI สำหรับเสียงควรจัดสรรทรัพยากรเป็นเปอร์เซ็นต์เพื่อพัฒนาเทคโนโลยีที่สามารถตรวจจับและระบุเนื้อหาที่สร้างโดย AI
- การติดป้ายกำกับเนื้อหาที่สร้างโดย AI พร้อมลายน้ำทำให้สามารถยืนยันตัวตนด้วยเสียงได้
- ผู้ให้บริการ AI แต่ละรายควรตรวจสอบแต่ละโครงการเกี่ยวกับผลกระทบ (ระดับสังคม ธุรกิจ และความเป็นส่วนตัว) ก่อนที่จะตกลงดำเนินการ
แน่นอนว่าหลักการของจริยธรรมใน AI จะไม่ส่งผลกระทบต่อการแพร่กระจายของปลอมแบบโฮมเมดทางออนไลน์ อย่างไรก็ตามพวกเขาจะผลักดันโครงการใด ๆ ที่เป็นสีเทาให้พ้นมือตลาดสาธารณะ
ในปี 2021-22 มีการใช้เสียงของ AI ในโครงการกระแสหลักหลายโครงการ ซึ่งส่งผลอย่างมากต่อจริยธรรมและสังคม รวมสิ่งเหล่านี้ โคลนเสียงของลุค สกายวอล์คเกอร์ในวัยเยาว์ สำหรับซีรีส์ Mandalorian เสียง AI สำหรับ God of War 2และ เสียงของ Richard Nixon สำหรับประวัติศาสตร์ 'In Event of Moon Disaster'.
ความเชื่อมั่นในเทคโนโลยีเติบโตขึ้นนอกเหนือจากสื่อและความบันเทิง ธุรกิจดั้งเดิมในหลายอุตสาหกรรมกำลังใช้เสียงจำลองในโครงการของพวกเขา ต่อไปนี้คือกรณีการใช้งานที่โดดเด่นที่สุดบางส่วน
กรณีการใช้งานในอุตสาหกรรม
ในปี 2023 การโคลนเสียงจะเพิ่มขึ้นอย่างต่อเนื่องควบคู่ไปกับธุรกิจต่างๆ ที่จะได้รับประโยชน์มากมาย ตั้งแต่การดูแลสุขภาพและการตลาดไปจนถึงการบริการลูกค้าและอุตสาหกรรมโฆษณา การโคลนเสียงกำลังปฏิวัติวิธีการที่องค์กรต่างๆ สร้างความสัมพันธ์กับลูกค้าและปรับปรุงเวิร์กโฟลว์
การโคลนเสียงเป็นประโยชน์ต่อบุคลากรทางการแพทย์และนักสังคมสงเคราะห์ที่ทำงานในสภาพแวดล้อมออนไลน์ อวตารดิจิทัลที่มีเสียงเดียวกับผู้เชี่ยวชาญทางการแพทย์ช่วยส่งเสริมความสัมพันธ์ระหว่างพวกเขากับผู้ป่วยให้แน่นแฟ้นยิ่งขึ้น เพิ่มความไว้วางใจและรักษาลูกค้าไว้
การประยุกต์ใช้การโคลนเสียงที่เป็นไปได้ในอุตสาหกรรมภาพยนตร์และความบันเทิงนั้นมีมากมาย การคัดลอกเนื้อหาเป็นหลายภาษา การแทนที่กล่องโต้ตอบเพิ่มเติม (ADR) สำหรับเด็กและผู้ใหญ่ และตัวเลือกการปรับแต่งที่แทบไม่มีขีดจำกัดล้วนเกิดขึ้นได้ด้วยเทคโนโลยีนี้
ในทำนองเดียวกัน ในภาคการดำเนินงาน การโคลนเสียงที่ขับเคลื่อนด้วย AI สามารถให้ผลลัพธ์ที่ยอดเยี่ยมสำหรับแบรนด์ที่ต้องการโซลูชันที่คุ้มค่าสำหรับระบบตอบรับเสียงแบบโต้ตอบหรือวิดีโอการฝึกอบรมขององค์กร ด้วยเทคโนโลยีการสังเคราะห์เสียง นักแสดงสามารถขยายการเข้าถึงในขณะที่เพิ่มความสามารถในการรับส่วนที่เหลือจากการบันทึกเสียง
ประการสุดท้าย ในสตูดิโอผลิตโฆษณา การเกิดขึ้นของการโคลนเสียงได้ช่วยลดต้นทุนและจำนวนชั่วโมงที่เกี่ยวข้องกับการผลิตเชิงพาณิชย์ได้อย่างมาก ตราบใดที่มีการบันทึกคุณภาพสูงสำหรับการโคลนนิ่ง (แม้แต่จากนักแสดงที่ไม่พร้อมใช้งาน) โฆษณาก็สามารถสร้างได้อย่างรวดเร็วและสร้างสรรค์กว่าที่เคยเป็นมา
ที่น่าสนใจคือองค์กรและ SMB สามารถใช้ประโยชน์จากการโคลนเสียงเพื่อสร้างสิ่งที่เป็นเอกลักษณ์สำหรับแบรนด์ของตน โครงการขนาดใหญ่สามารถบรรลุแผนการที่ทะเยอทะยานที่สุดของพวกเขาได้ ในขณะที่ธุรกิจขนาดเล็กสามารถเข้าถึงโมเดลขนาดที่จำกัดต้นทุนก่อนหน้านี้ได้ นั่นคือความหมายของการเป็นประชาธิปไตยที่แท้จริง
ตัดขึ้น
การโคลนเสียงด้วย AI มอบคุณประโยชน์ที่เปลี่ยนแปลงเกมให้กับธุรกิจได้ เช่น การสร้างประสบการณ์ลูกค้าที่ไม่เหมือนใคร การผสานความสามารถในการประมวลผลภาษาธรรมชาติเข้ากับผลิตภัณฑ์และบริการของตน และสร้างเสียงเลียนแบบที่มีความแม่นยำสูงซึ่งฟังดูสมจริงโดยสมบูรณ์
ธุรกิจที่ต้องการรักษาความได้เปรียบในการแข่งขันในปี 2023 ควรพิจารณาการโคลนเสียงด้วย AI บริษัทต่างๆ สามารถใช้เทคโนโลยีนี้เพื่อปลดล็อกความเป็นไปได้ใหม่ๆ ที่หลากหลายเพื่อชิงส่วนแบ่งตลาดและรักษาลูกค้าไว้ได้ในขณะที่ทำเช่นนั้นด้วยวิธีการที่มีความรับผิดชอบทางจริยธรรม