Connect with us

Matt Hocking, ผู้ร่วมก่อตั้ง WellSaid Labs – ซีรีส์สัมภาษณ์

สัมภาษณ์

Matt Hocking, ผู้ร่วมก่อตั้ง WellSaid Labs – ซีรีส์สัมภาษณ์

mm

Matt Hocking เป็นผู้ร่วมก่อตั้ง WellSaid Labs, ซึ่งเป็น AI Voice Generator ระดับองค์กรชั้นนำ เขามีประสบการณ์มากกว่า 15 ปีในการนำทีมและจัดส่งโซลูชั่นด้านเทคโนโลยีในระดับใหญ่

พื้นหลังของคุณค่อนข้างเป็นผู้ประกอบการ คุณเริ่มเกี่ยวข้องกับ AI อย่างไร?

ฉันคิดว่าฉันเองก็ถือว่าตัวเองเป็นผู้ประกอบการ ฉันเริ่มธุรกิจแรกของฉันหลังจากจบมหาวิทยาลัย และด้วยพื้นหลังด้านการออกแบบผลิตภัณฑ์ ฉันจึงพบว่าตัวเองมุ่งเน้นไปที่ช่วยเหลือผู้คนด้วยความคิดในระยะแรกตลอดอาชีพการงานของฉัน ฉันถือว่าตัวเองมีโชคที่ได้ทำงานกับหลายๆ สตาร์ทอัพซึ่งได้ไปสู่ความสำเร็จที่น่าเหลือเชื่อ ในระหว่างประสบการณ์เหล่านั้น ฉันได้พบกับหลายๆ ผู้ก่อตั้งที่น่าประทับใจ และได้รับแรงบันดาลใจให้พัฒนาความคิดของตัวเองในฐานะผู้ก่อตั้ง AI ยังเป็นเรื่องใหม่สำหรับฉันเมื่อฉันเข้าร่วม AI2 แต่ประสบการณ์นั้นให้โอกาสฉันในการนำมุมมองด้านผลิตภัณฑ์และสตาร์ทอัพมาประยุกต์ใช้กับการวิจัยที่น่าเหลือเชื่อ และจินตนาการว่าการพัฒนาด้านใหม่เหล่านี้จะช่วยให้หลายๆ คนในอนาคตได้อย่างไร เป้าหมายของฉันตั้งแต่เริ่มต้นคือการสร้างธุรกิจที่แท้จริงสำหรับคนจริงๆ และฉันเชื่อว่า AI มีศักยภาพในการสร้างโอกาสและประสิทธิภาพที่น่าตื่นเต้นในอนาคตหากนำไปใช้อย่างรอบคอบ

คุณสามารถแบ่งปันเรื่องราวของวิธีการที่ความคิดสำหรับ WellSaid Labs ถูกสร้างขึ้นเมื่อคุณเป็นผู้ประกอบการใน The Allen Institute for AI?

ฉันเข้าร่วม The Allen Institute for Artificial Intelligence (AI2) ในฐานะ Entrepreneur in Residence ในปี 2018 AI2 เป็นสถานที่ที่มีนวัตกรรมที่สุดในโลก โดยมีคนฉลาดที่สุดในด้าน AI ที่นำโซลูชั่นจากขอบของความเป็นไปได้ในปัจจุบันมาประยุกต์ใช้กับผลิตภัณฑ์ที่เป็นรูปธรรมเพื่อแก้ปัญหาในโลก พื้นหลังด้านการออกแบบและเทคโนโลยีของฉันทำให้ฉันมีความสนใจในด้านสื่อสร้างสรรค์มานาน และด้วยการเติบโตของ AI ที่เราเห็นอยู่ในปัจจุบัน ฉันอยากจะสำรวจวิธีการเชื่อมโยงระหว่างทั้งสองสิ่ง ฉันพบกับ Michael Petrochuk (ผู้ร่วมก่อตั้งและ CTO ของ WellSaid Labs) ในระหว่างการพัฒนาอプリเคชั่นสุขภาพแบบโต้ตอบที่ช่วยให้ผู้ป่วยผ่านสถานการณ์ที่ละเอียดอ่อนต่างๆ เมื่อฉันถูกนำเสนอให้รู้จักกับการพัฒนาที่ Michael ได้ทำระหว่างการวิจัยของเขา เราทั้งคู่เห็นคุณค่าของวิธีการที่ human-parity text-to-speech (TTS) สามารถเปลี่ยนแปลงไม่เพียงแต่ผลิตภัณฑ์ที่ฉันทำงานอยู่ แต่ยังรวมถึงการนำไปใช้ในหลายๆ อุตสาหกรรมด้วย เทคโนโลยีและเครื่องมือต่างๆ ต่อสู้ที่จะตามทันความต้องการของผู้ผลิตที่สร้างสรรค์งานด้วยเสียงเป็นหนึ่งในสื่อ เราเห็นเส้นทางในการนำเทคโนโลยีนี้ไปสู่มือของผู้สร้างทุกคน โดยให้เสียงเป็นส่วนหนึ่งของเรื่องราวทั้งหมด

WellSaid Labs เป็นหนึ่งในไม่กี่บริษัทที่ให้เสียงนักแสดงมีทางเลือกในการเข้าสู่พื้นที่ AI voiceover ทำไมคุณถึงเชื่อว่ามันสำคัญที่จะรวมเสียงจริงเข้ากับผลิตภัณฑ์?

คำตอบของเราคือสองส่วน: ประการแรก เราต้องการสร้างโซลูชั่นที่เสริมความสามารถของนักแสดงเสียงมืออาชีพ และขยายโอกาสสำหรับเสียง และประการที่สอง เราตั้งเป้าที่จะมีคุณภาพระดับมนุษย์สูงสุดในผลิตภัณฑ์ของเรา นักแสดงเสียงของเราคือพันธมิตรร่วมที่ร่วมงานกับเราในระยะยาวและได้รับค่าตอบแทนและแบ่งปันรายได้สำหรับทั้งการให้ข้อมูลเสียงและเนื้อหาที่ผลิตด้วยมัน ทุกๆ นักแสดงเสียงที่เรา雇用เพื่อสร้าง avatar เสียง AI ที่เหมือนกับเสียงของพวกเขาได้รับค่าตอบแทนตามจำนวนการใช้งานบนแพลตฟอร์มของเรา เราสนับสนุนให้คนมีพรสวรรค์ร่วมงานกับเรา การจ่ายค่าตอบแทนที่ยุติธรรมสำหรับการมีส่วนร่วมของพวกเขาเป็นสิ่งสำคัญสำหรับเรา

ในการให้ผลิตภัณฑ์ที่มีคุณภาพระดับมนุษย์สูงสุดในตลาด เราต้องเข้มงวดเกี่ยวกับแหล่งที่มาของข้อมูลของเรา กระบวนการนี้ทำให้เรามีควบคุมคุณภาพมากขึ้น เนื่องจากเราอบรมโมเดล deep learning ของเราให้พูดทั้งความเท่าเทียมกันของมนุษย์และรูปแบบที่เกี่ยวข้องในบริบทเฉพาะ เราไม่เพียงแต่สร้างเสียงที่อ่านข้อความที่ให้มาเท่านั้น แต่โมเดลของเรายังให้เสียงที่มีหลายรูปแบบที่สามารถแสดงสิ่งที่อยู่บนหน้าได้ ไม่ว่าผู้ใช้จะสร้างเสียงโดยใช้ avatar จากไลบรารีของเราหรือสร้างเสียงด้วยเสียงที่สร้างขึ้นเองสำหรับแบรนด์ของพวกเขา เราใช้ข้อมูลเสียงจริงเพื่อให้แน่ใจว่ามีการดำเนินการที่ราบรื่นและแพลตฟอร์มที่ใช้งานง่าย หากลูกค้าของเราต้องจัดการและแก้ไขเสียงของเราในหลังการผลิต กระบวนการในการได้รับเอาต์พุตที่ต้องการจะไม่สะดวกและใช้เวลานาน เสียงของเรารับบริบทของเนื้อหาที่เขียนและให้การอ่านที่ถูกต้องตามบริบท เรามีเสียงสำหรับการใช้งานทุกประเภท ไม่ว่าจะเป็นการอ่านข่าว การสร้างโฆษณาเสียง หรือการสนับสนุนศูนย์โทรศัพท์อัตโนมัติ ดังนั้นการร่วมมือกับเสียงมืออาชีพสำหรับการใช้งานแต่ละประเภทจึงให้ข้อมูลเสียงที่มีคุณภาพสูงและบริบทแก่เรา

เราอัปเดตและเพิ่มรูปแบบและเสียงใหม่ๆ ในไลบรารี avatar ของเราอย่างสม่ำเสมอเพื่อให้แน่ใจว่าเราจะแสดงเสียงของลูกค้าของเรา ใน WellSaid Labs’ Studio ลูกค้าและแบรนด์สามารถลองเสียงต่างๆ ตามภูมิภาค รูปแบบ และการใช้งาน ทำให้การผลิตเนื้อหาออดิโอที่เป็นส่วนตัวสำหรับผู้สร้างมีความราบรื่นและเป็นหนึ่งเดียว เมื่อบันทึกเริ่มต้นได้รับการตัวอย่าง ผู้ใช้สามารถให้สัญญาณคำเฉพาะ การสะกด และการออกเสียงเพื่อให้แน่ใจว่า AI พูดเฉพาะตามความต้องการของพวกเขา

WellSaid Labs กำลังยืนยันตัวเองว่าเป็นแพลตฟอร์ม AI เสียงที่มีจริยธรรมเป็นอันดับแรก ทำไมจริยธรรม AI จึงสำคัญสำหรับคุณ?

เมื่อการนำ AI ไปใช้เพิ่มขึ้นและกลายเป็นที่นิยมมากขึ้น ความกลัวการใช้งานที่เป็นอันตรายและผู้กระทำที่ไม่ดีเป็นจุดศูนย์กลางของทุกๆ การสนทนา และความกังวลเหล่านี้ได้รับการยืนยันจากเหตุการณ์จริงในโลก AI เสียงไม่ใช่例外เกือบทุกวัน มีรายงานใหม่ๆ เกี่ยวกับคนดัง บุคคลสาธารณะ หรือนักการเมืองที่ถูกสร้างเป็น deepfake สำหรับโฆษณาหรือวัตถุประสงค์ทางการเมือง ทำให้ข่าวหลัก เมื่อการควบคุมด้านกฎระเบียบของรัฐบาลกลางเกี่ยวกับเทคโนโลยีนี้ยังคงพัฒนา การตรวจจับและต่อสู้กับผู้กระทำที่ไม่ดีและการใช้งานที่ไม่เหมาะสมของเสียงสังเคราะห์จะยิ่งยากขึ้นเมื่อเทคโนโลยีนี้พัฒนาไป

มาจาก AI2 ซึ่งจริยธรรม AI เป็นหลักการสำคัญ Michael และฉันพูดคุยกันในเรื่องนี้ตั้งแต่วันแรก การพัฒนาเทคโนโลยีการพูด AI มาพร้อมกับความรับผิดชอบที่สำคัญเกี่ยวกับการยินยอม ความเป็นส่วนตัว และความปลอดภัยโดยรวม เรารู้ว่าในฐานะผู้พัฒนา เราต้องสร้างเทคโนโลยีของเราให้ปลอดภัย จัดการกับข้อกังวลด้านจริยธรรม และสร้างรากฐานสำหรับการพัฒนาออนเสียงสังเคราะห์ในอนาคต เรารับรู้ถึงศักยภาพของเทคโนโลยีการพูด AI สำหรับการใช้ในทางที่ผิดและยอมรับความรับผิดชอบในการลดการละเมิดผลิตภัณฑ์ของเรา เราต้องสร้างรากฐานนี้ตั้งแต่วันแรก มิฉะนั้นจะไม่ทำสิ่งที่ถูกต้องสำหรับลูกค้าองค์กรและนักแสดงเสียงของเรา ซึ่งพึ่งพาเราในการสร้างผลิตภัณฑ์ที่มีคุณภาพสูงและเชื่อถือได้

เราสนับสนุนการเรียกเก็บเงินในด้านนี้อย่างเต็มที่ แต่เราจะไม่รอการออกกฎหมายของรัฐบาลกลางเพื่อออกกฎหมาย เราได้ให้ความสำคัญและจะยังคงให้ความสำคัญกับแนวปฏิบัติที่สนับสนุนความเป็นส่วนตัว ความปลอดภัย ความโปร่งใส และความรับผิดชอบ

เราปฏิบัติตามรหัสจริยธรรมของบริษัทของเราอย่างเคร่งครัด ซึ่ง основา於การสร้างสรรค์นวัตกรรมที่มีความรับผิดชอบในทุกๆ การตัดสินใจที่เราทำ สิ่งนี้อยู่ในผลประโยชน์สูงสุดของลูกค้าระดับโลกของเรา – แบรนด์องค์กร

คุณพัฒนาแพลตฟอร์ม AI เสียงที่มีจริยธรรมได้อย่างไร?

WellSaid Labs มุ่งมั่นต่อการสร้างสรรค์นวัตกรรมที่มีจริยธรรมตั้งแต่เริ่มต้น เราเน้นย้ำความไว้วางใจและความโปร่งใสผ่านการใช้โมเดลข้อมูลในองค์กร การต้องมีการยินยอมอย่างชัดเจน โปรแกรมการดูแลเนื้อหา และความมุ่งมั่นในการปกป้องแบรนด์ ที่ WellSaid เราใช้หลักการของ Responsible AI เพื่อสร้างความมั่นใจในการตัดสินใจและการออกแบบของเรา และหลักการเหล่านี้ขยายไปสู่การใช้เสียงของเรา รหัสจริยธรรมของเราแสดงถึงหลักการเหล่านี้เป็นความรับผิดชอบ ความโปร่งใส ความเป็นส่วนตัวและความปลอดภัย และความยุติธรรม

ความรับผิดชอบ: เรารักษามาตรฐานที่เข้มงวดสำหรับเนื้อหาที่เหมาะสม โดยห้ามการใช้เสียงของเราเพื่อเนื้อหาที่เป็นอันตราย เกลียดชัง การฉ้อโกง หรือมีเจตนากระตุ้นให้เกิดความรุนแรง ทีม Trust & Safety ของเรายึดมั่นในมาตรฐานเหล่านี้ด้วยโปรแกรมการดูแลเนื้อหาที่เข้มงวด โดยบล็อกและลบผู้ใช้ที่พยายามละเมิดข้อกำหนดการบริการของเรา

ความโปร่งใส: เราต้องการการยินยอมอย่างชัดเจนก่อนที่จะสร้างเสียงสังเคราะห์ด้วยข้อมูลเสียงของใครบางคน ผู้ใช้ไม่สามารถอัปโหลดข้อมูลเสียงจากนักการเมือง คนดัง หรือใครก็ตามที่จะสร้างสำเนาของเสียงของพวกเขา เว้นแต่เราจะได้รับการยินยอมอย่างชัดเจนจากบุคคลนั้น

ความเป็นส่วนตัวและความปลอดภัย: เรอปกป้องตัวตนของนักแสดงเสียงของเราโดยใช้ภาพสต็อกและชื่อสมมติเพื่อแสดงถึงเสียงสังเคราะห์ เรายังแนะนำให้พวกเขาปฏิบัติตามความระมัดระวังเกี่ยวกับวิธีการและกับใครที่พวกเขาจะแบ่งปันความสัมพันธ์กับ WellSaid Labs หรือบริษัทเสียงสังเคราะห์อื่นๆ เพื่อลดโอกาสที่จะละเมิดเสียงของพวกเขา

ความยุติธรรม: เราจ่ายค่าตอบแทนให้กับนักแสดงเสียงทุกคนที่ให้ข้อมูลเสียงสำหรับแพลตฟอร์มของเรา และเรายังให้พวกเขามีส่วนแบ่งรายได้อย่างต่อเนื่องสำหรับการใช้เสียงสังเคราะห์ที่เราสร้างขึ้นด้วยข้อมูลของพวกเขา

พร้อมกับหลักการเหล่านี้ เรายังให้ความเคารพอย่างเคร่งครัดต่อทรัพย์สินทางปัญญา เราไม่聲称ความเป็นเจ้าของเนื้อหาที่ผู้ใช้หรือนักแสดงเสียงของเราให้มา เราให้ความสำคัญกับความซื่อสัตย์ ความยุติธรรม และความโปร่งใสในทุกสิ่งที่เราทำ เพื่อให้แน่ใจว่าเทคโนโลยีการพูดสังเคราะห์ของเราจะถูกใช้อย่างมีความรับผิดชอบและจริยธรรม เราแสวงหาการร่วมมือกับเสียงจากภูมิหลังและประสบการณ์ที่หลากหลายเพื่อให้แน่ใจว่าไลบรารีเสียงของ WellSaid Labs สะท้อนถึงผู้สร้างและผู้ฟัง

ความมุ่งมั่นของเราในการสร้างสรรค์นวัตกรรมที่มีความรับผิดชอบและพัฒนาเทคโนโลยีเสียง AI โดยคำนึงถึงจริยธรรม ทำให้เราแตกต่างจากผู้อื่นในอุตสาหกรรมที่พยายามที่จะใช้ประโยชน์จากอุตสาหกรรมใหม่ที่ไม่มีการควบคุมผ่านวิธีการใดๆ การลงทุนของเราในด้านจริยธรรม ความปลอดภัย และความเป็นส่วนตัวตั้งแต่เนิ่นๆ สร้างความไว้วางใจและความจงรักภักดีในหมู่นักแสดงเสียงและลูกค้าของเรา ซึ่งกำลังมองหาสินค้าและบริการที่ทำขึ้นด้วยจริยธรรมจากบริษัทที่อยู่ในระดับแนวหน้าของนวัตกรรม

WellSaid Labs สร้างโมเดล AI ในองค์กรที่ทำให้เสียง AI ของพวกเขาบรรลุความเท่าเทียมกับมนุษย์ และพวกเขาทำได้โดยการนำความไม่สมบูรณ์ของมนุษย์มาสู่การสนทนา สิ่งใดที่ทำให้ความไม่สมบูรณ์เหล่านี้ทำให้ AI ดีขึ้น และพวกเขานำความไม่สมบูรณ์เหล่านี้ไปใช้อย่างไร?

WellSaid Labs ไม่ใช่เพียง TTS generator อีกตัวหนึ่ง เทคโนโลยี TTS ในช่วงแรกไม่สามารถรับรู้คุณภาพของการกล่าวของมนุษย์ เช่น โทน เสียง และสำเนียงที่สื่อถึงบริบทและอารมณ์เบื้องหลังคำพูด แต่เสียงของ WellSaid ได้บรรลุถึงความเท่าเทียมกับมนุษย์ โดยนำความไม่สมบูรณ์ที่เป็นเอกลักษณ์ของมนุษย์มาสู่การกล่าวของ AI

มาตรฐานหลักของเราสำหรับคุณภาพเสียงคือและยังคงเป็นความเป็นธรรมชาติของมนุษย์ ความเชื่อมั่นนี้ได้กำหนดรูปแบบเทคโนโลยีของเราในทุกๆ ระยะตั้งแต่ไลบรารีสคริปต์ที่เราได้สร้างขึ้นไปจนถึงคำแนะนำที่เราให้กับคนมีพรสวรรค์และล่าสุดวิธีการที่เราปรับปรุงอัลกอริทึม TTS ของเรา

เราทราบการกล่าวของมนุษย์ที่แท้จริง นักแสดงเสียงของเราอ่านสคริปต์ของพวกเขาอย่างแท้จริงและน่าดึงดูดเมื่อพวกเขาบันทึกสำหรับเรา ความสมบูรณ์แบบของการกล่าวเป็นแนวคิดที่กลไก ซึ่งนำไปสู่เอาต์พุตที่ไม่มีจุดบกพร่องและไม่เป็นธรรมชาติ เมื่อนักแสดงเสียงมืออาชีพแสดง อัตราการพูดของพวกเขาจะเปลี่ยนแปลง ความดังของพวกเขาจะเคลื่อนไหวพร้อมกับเนื้อหาที่พวกเขากำลังอ่าน ส่วนสูงของเสียงของพวกเขาอาจเพิ่มขึ้นในบทที่ต้องการการอ่านด้วยความตื่นเต้นและลดลงอีกครั้งในบรรทัดที่อ่านด้วยความอ่อนโยน การเปลี่ยนแปลงเหล่านี้ทำให้เกิดการแสดงเสียงที่น่าดึงดูดของมนุษย์

โดยการสร้างกระบวนการ AI ที่ทำงานร่วมกับการแสดงของนักแสดงเสียงมืออาชีพของเรา เราได้สร้างแพลตฟอร์ม TTS ที่เป็นธรรมชาติอย่างแท้จริง เราได้พัฒนาระบบ TTS ระยะยาวแรกที่มีการควบคุมแบบคาดการณ์ทั่วทั้งกระบวนการสร้างสรรค์ ไลบรารี фонетิกของเรามีคลังข้อมูลเสียงที่หลากหลาย ทำให้ผู้ใช้สามารถรวมคิวเสียงเฉพาะ เช่น การแนะนำการออกเสียงหรือการควบคุมได้ในช่วงการผลิต ในแพลตฟอร์มเดียว ผู้ใช้ WellSaid สามารถบันทึก แก้ไข และสร้างสไตล์เสียงของตนเองโดยไม่ต้องนำเข้าข้อมูลภายนอก

คุณสามารถพูดคุยเกี่ยวกับความท้าทายบางประการในการสร้างบริษัท AI เสียง (TTS) ได้หรือไม่?

การพัฒนาเทคโนโลยีเสียง AI ได้สร้างอุปสรรคใหม่ๆ สำหรับทั้งผู้ผลิตและผู้บริโภคของมัน หนึ่งในความท้าทายหลักคือการไม่หลงไปกับเสียงและความฮือฮาที่หลั่งไหลเข้ามาในภาค AI เนื่องจากเป็นเทคโนโลยีที่ใหม่และน่าฮือฮาหลายองค์กรพยายามที่จะใช้ประโยชน์จากการพัฒนาเสียง AI ในระยะสั้น เราต้องการให้เสียงสำหรับทุกคน โดยมีหลักจริยธรรมเป็นศูนย์กลางและความจริงใจ การยึดมั่นในความจริงใจนี้อาจชะลอการพัฒนาและใช้งานเทคโนโลยีของเรา แต่ทำให้ความปลอดภัยและความปลอดภัยของเสียง WellSaid และข้อมูลของพวกเขาเป็นรากฐานที่มั่นคง

อีกความท้าทายหนึ่งในการพัฒนาแพลตฟอร์ม TTS ของเราคือการสร้างแนวทางในการยินยอมที่ชัดเจนเพื่อให้แน่ใจว่าองค์กรหรือบุคคลจะไม่ล่วงละเมิดเทคโนโลยีของเรา เพื่อต่อสู้กับความท้าทายนี้ เราแสวงหาความร่วมมือระยะยาวและร่วมมือกันอย่างเต็มที่ในการพัฒนาเสียงเพื่อเพิ่มความรับผิดชอบ ความโปร่งใส และความปลอดภัยของผู้ใช้ เราแสวงหาความร่วมมือกับนักแสดงเสียงจากภูมิหลังต่างๆ องค์กรและประสบการณ์เพื่อให้แน่ใจว่าไลบรารีเสียงของ WellSaid Labs สะท้อนถึงผู้สร้างและผู้ฟังของเรา กระบวนการเหล่านี้ได้รับการออกแบบมาเพื่อให้เจตนาและให้ความสนใจในรายละเอียดเพื่อให้แน่ใจว่าเทคโนโลยีของเราจะถูกใช้อย่างปลอดภัยและจริยธรรม ซึ่งอาจชะลอการพัฒนาและเปิดตัว

คุณมีวิสัยทัศน์สำหรับอนาคตของเสียง AI ที่สร้างขึ้นอย่างไร?

มานานแล้วที่เทคโนโลยีการพูด AI ไม่สามารถบรรลุคุณภาพที่สูงพอที่จะทำให้บริษัทต่างๆ สามารถสร้างเนื้อหาที่มีความหมายในระดับใหญ่ได้ แต่ตอนนี้เทคโนโลยีการฟังไม่ต้องการอุปกรณ์หรือฮาร์ดแวร์ที่มีราคาแพงอีกต่อไป ทุกๆ เนื้อหาที่เขียนสามารถผลิตและเผยแพร่ในรูปแบบเสียงเพื่อสร้างประสบการณ์ที่น่าดึงดูดและหลายรูปแบบ

ในปัจจุบัน เสียง AI สามารถผลิตเสียงที่เหมือนมนุษย์และจับประเด็นนุ่มนวลที่จำเป็นในการทำให้การบอกเล่าเรื่องราวดิจิทัลเป็นไปได้มากขึ้นและเป็นธรรมชาติ อนาคตของเสียง AI ที่สร้างขึ้นจะครอบคลุมประสบการณ์ที่ได้ยินซึ่งสัมผัสทุกด้านของชีวิตของเรา เมื่อเทคโนโลยีดำเนินต่อไป เราจะเห็นเสียงสังเคราะห์ที่เป็นธรรมชาติและแสดงออกมากขึ้น ซึ่งจะทำให้เส้นแบ่งระหว่างการกล่าวของมนุษย์และเครื่องจักรพรรณนาลดลง – เปิดประตูใหม่ๆ สำหรับธุรกิจ การสื่อสาร ความสามารถในการเข้าถึง และวิธีที่เราสื่อสารกับโลกที่อยู่รอบๆ ตัวเรา

ธุรกิจจะพบว่ามีการปรับแต่งที่ดีขึ้นในอินเทอร์เฟซเสียง AI และใช้พวกมันเพื่อทำให้การโต้ตอบกับตัวแทนเสมือนเป็นมิตรและใช้งานง่ายมากขึ้น การปรับปรุงเหล่านี้กำลังเกิดขึ้นแล้ว ตั้งแต่ตัวแทนศูนย์บริการลูกค้าที่ฉลาดไปจนถึงเครื่องเสียงที่เร็ว การสร้างเนื้อหา รวมถึงการโฆษณา การตลาดผลิตภัณฑ์ การบรรยายข่าว โพดแคสต์ หนังสือเสียง และมัลติมีเดียอื่นๆ จะเห็นการเพิ่มประสิทธิภาพโดยใช้เครื่องมือในการพัฒนาเนื้อหาที่น่าดึงดูด – สุดท้ายจะเพิ่มการยกและรายได้ให้กับองค์กร โดยเฉพาะอย่างยิ่งตอนนี้โมเดลหลายภาษาสามารถขยายการเข้าถึงของบริษัทจากจุดเดียวไปยังการมีฐานที่มั่นทั่วโลกได้ ทีมงานผลิตจะพบประโยชน์มากมายในเสียงสังเคราะห์ในการสร้างเสียงที่ออกแบบมาเพื่อตอบสนองความต้องการของแบรนด์หรือปรับแต่งให้เหมาะกับผู้ฟัง

ก่อนที่จะมีการแนะนำ AI เทคโนโลยี TTS ขาดความสามารถในการแสดงอารมณ์ การเน้นย้ำ และการออกเสียงที่จำเป็นในการเล่าเรื่องราวที่สมบูรณ์แบบในระดับใหญ่และง่ายดาย ตอนนี้ เทคโนโลยี TTS ที่ได้รับการสนับสนุนจาก AI เสนอประสบการณ์ที่ลึกซึ้งและเข้าถึงได้มากขึ้น รวมถึงความสามารถในการพูดแบบเรียลไทม์และตัวแทนการสนทนาที่โต้ตอบได้

การบรรลุความสามารถในการพูดที่เหมือนมนุษย์เป็นการเดินทาง แต่ตอนนี้ที่เป็นไปได้แล้ว เรากำลังเห็นขอบเขตทั้งหมดของเสียง AI ในการสร้างมูลค่าทางธุรกิจที่แท้จริงให้กับองค์กร

ขอขอบคุณสำหรับการสัมภาษณ์ที่ดี ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม WellSaid Labs

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ