Connect with us

วิกเตอร์ เอรูคิมอฟ, CEO ของ CraftStory – สัมภาษณ์ซีรีส์

สัมภาษณ์

วิกเตอร์ เอรูคิมอฟ, CEO ของ CraftStory – สัมภาษณ์ซีรีส์

mm

วิกเตอร์ เอรูคิมอฟ, CEO ของ CraftStory, เป็นวิศวกรวิจัยด้านการมองเห็นของคอมพิวเตอร์ที่เปลี่ยนมาเป็นนักธุรกิจที่ช่วย塑造การพัฒนาของ OpenCV ในช่วงแรก และร่วมก่อตั้ง Itseez และนำบริษัทจากสตาร์ทอัพทางเทคนิคมาเป็นหนึ่งในทีมวิจัยด้านการมองเห็นของคอมพิวเตอร์ที่มีชื่อเสียงที่สุดในโลก ก่อนที่จะถูกซื้อโดย Intel ในช่วงมากกว่าหนึ่งทศวรรษ เขาได้พัฒนาตัวเองจาก CTO เป็น CEO และต่อเนื่องในบทบาทนั้นที่ Itseez3D โดยที่เขานำการพัฒนาเทคโนโลยีการสแกน 3D มือถือและเทคโนโลยีการสร้างอาวตารขั้นสูง และยังดำรงตำแหน่งเป็นสมาชิกคณะกรรมการของ OpenCV.org ในระยะเวลานาน

ที่ CraftStory, เขาเน้นการสร้างวิดีโอด้วย AI ที่เปลี่ยนอินพุตแบบง่ายๆ ให้เป็นวิดีโอที่มีความสมจริงและพร้อมสำหรับผู้สร้าง โดยภายใต้การนำของเขา บริษัทกำลังพัฒนามอเดลวิดีโอสร้างสรรค์แบบใหม่ที่ออกแบบสำหรับทีมการตลาด ผู้ศึกษา และผู้เล่าเรื่องผลิตภัณฑ์ที่ต้องการเนื้อหาคุณภาพสูงโดยไม่ต้องมีค่าใช้จ่ายในการผลิตในสตูดิโอ

คุณได้เป็นแรงผลักดันเบื้องหลังโครงการการมองเห็นของคอมพิวเตอร์ที่มีอิทธิพลมากที่สุด ตั้งแต่ OpenCV ถึง Itseez3D สิ่งไหนที่ทำให้คุณตัดสินใจก่อตั้ง CraftStory และงานในอดีตของคุณมีอิทธิพลต่อวิสัยทัศน์ของวิดีโอ AI คุณภาพสตูดิโอแบบยาวๆ อย่างไร

ก่อน CraftStory ทีมของเรากำลังทำงานใน Avatar SDK—เครื่องมือที่สร้างอาวตารที่สมจริงจากเซลฟี่สำหรับ VR/AR, เกม, การตลาด และการประยุกต์ใช้อื่นๆ เราได้คิดเกี่ยวกับมนุษย์ดิจิทัลอย่างลึกซึ้งมาหลายปีแล้ว จากนั้นประมาณสองปีที่แล้ว เราได้ทราบว่าเทคโนโลยี GenAI สำหรับการสร้างวิดีโอได้ดีขึ้นเพียงพอแล้วที่จะปลดปล่อยการประยุกต์ใช้ใหม่ๆ และเราก็เข้าร่วมทันที

CraftStory เริ่มต้นด้วยผู้สร้าง OpenCV เป็นแกนกลาง วิสัยทัศน์ร่วมกันนี้มีอิทธิพลต่อทิศทางทางเทคนิคและลำดับความสำคัญการวิจัยของ Model 2.0 อย่างไร

เรากำลังอยู่ในช่วงเวลาที่มีการพัฒนาที่ไม่เคยเกิดขึ้นมาก่อนในด้านการมองเห็นของคอมพิวเตอร์และการเรียนรู้ของเครื่อง มันรู้สึกเหมือนกับว่าทุกๆ การพัฒนาที่เกิดขึ้นในยุคแรกของกลศาสตร์ควอนตัม—ที่เดิมทีกระจายไปทั่วทศวรรษ—ได้ถูกบีบอัดให้เข้ามาในเพียงไม่กี่ปี การเข้าใจและสร้างภาพได้พัฒนาล่วงหน้าไปไกลกว่าที่เราเคยทำงานด้วยเมื่อสร้าง OpenCV การสังเกตการเปลี่ยนแปลงนี้มาเกินหนึ่งทศวรรษ และการทำนายว่าอะไรจะสำเร็จหรือล้มเหลว ทำให้เราได้รับข้อมูลเชิงลึกที่ลึกซึ้งเกี่ยวกับทิศทางที่เทคโนโลยีและตลาดกำลังจะไป ซึ่งโดยตรงได้กำหนดลำดับความสำคัญการวิจัยและแผนการสำหรับ Model 2.0

Model 2.0 ตอบสนองต่อปัญหาที่หลายๆ โมเดลวิดีโอต้องเผชิญ: การรักษาอัตลักษณ์, อารมณ์ และความสอดคล้องตลอดหลายๆ นาทีของวิดีโอ สิ่งพัฒนาใดที่ทำให้สิ่งนี้เป็นไปได้

ทีมของคุณได้แนะนำการขยายกระบวนการฟิวชั่นแบบขนานเพื่อรักษาความสอดคล้องของลำดับยาวๆ สิ่งนี้ได้รับการออกแบบมาเพื่อแก้ปัญหาใด และทำไมมันจึงจำเป็นต่อวิดีโอของมนุษย์หลายๆ นาที

CraftStory เน้นความสมจริงทั้งในด้านการเคลื่อนไหวและน้ำเสียง อุปสรรคที่ยากที่สุดในการรักษาการเคลื่อนไหวตามธรรมชาติของมือ, ร่างกาย และใบหน้าในระยะเวลานานคืออะไร

หลายบริษัทติดอยู่ระหว่างการถ่ายทำสดที่มีค่าใช้จ่ายสูงและคลิป AI ที่สั้นและไม่น่าเชื่อถือ ที่ไหนที่คุณเห็นความต้องการเชิงพาณิชย์ที่ใหญ่ที่สุดสำหรับวิดีโอ AI ที่มีคนเป็นหลักและความยาวหลายๆ นาที

คุณได้สร้างระบบจัดตำแหน่งลิปซิงค์และการเคลื่อนไหวที่ซับซ้อน มีอะไรบ้างที่ทำให้ได้เสียงพูด AI ที่น่าเชื่อถืออย่างสมบูรณ์ และสิ่งใดที่ยังต้องการการปรับปรุง

โมเดล text-to-video ที่คุณกำลังพัฒนาสัญญาว่าจะสร้างวิดีโอความยาวหลายๆ นาทีโดยตรงจากสคริปต์ อุปสรรคทางเทคนิคใดที่คุณยังต้อง克服ก่อนที่สิ่งนี้จะกลายเป็นกระแสหลัก

การเคลื่อนไหวของกล้องแบบขนาน—เช่น การเดินและพูด—เป็นขั้นตอนสำคัญในการทำให้วิดีโอเหมือนภาพยนตร์ ทีมของคุณเข้าใกล้ความท้าทายนี้อย่างไรเมื่อเทียบกับคู่แข่งอย่าง Sora

ด้วย OpenAI, Google และผู้อื่นๆ ที่กำลังเข้าสู่ตลาดวิดีโอ AI แบบยาวๆ คุณเห็นจุดเด่นของ CraftStory ในตลาดที่เกิดขึ้นใหม่นี้อย่างไร

เมื่อวิดีโอ AI ที่มีคนเป็นหลักกลายเป็นเรื่องที่สมจริงและสามารถขยายขนาดได้ คุณเชื่อว่าควรจะมีการป้องกันทางจริยธรรมหรือสิ่งสร้างสรรค์ใดๆ เพื่อให้แน่ใจว่าเทคโนโลยีนี้จะไม่ถูกใช้ในทางที่ผิด

เมื่อวิดีโอ AI ที่มีคนเป็นหลักกลายเป็นเรื่องที่สมจริงและสามารถขยายขนาดได้ คุณเชื่อว่าควรจะมีการป้องกันทางจริยธรรมหรือสิ่งสร้างสรรค์ใดๆ เพื่อให้แน่ใจว่าเทคโนโลยีนี้จะไม่ถูกใช้ในทางที่ผิด

ขอขอบคุณสำหรับการสัมภาษณ์ที่ยอดเยี่ยม ผู้อ่านสามารถเรียนรู้เพิ่มเติมได้ที่ CraftStory

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ