ต้นขั้ว Gil Elbaz ผู้ร่วมก่อตั้งและ CTO ของ Datagen - ซีรี่ส์สัมภาษณ์ - Unite.AI
เชื่อมต่อกับเรา

บทสัมภาษณ์

Gil Elbaz ผู้ร่วมก่อตั้งและ CTO ของ Datagen – ซีรี่ส์สัมภาษณ์

mm
วันที่อัพเดท on

กิล เอลบาซ ดาต้าเจน CTO และผู้ร่วมก่อตั้ง ซึ่งประจำอยู่ในเทลอาวีฟ เขาได้รับวิทยาศาสตรบัณฑิตและวิทยาศาสตรมหาบัณฑิตจาก Technion งานวิจัยวิทยานิพนธ์ของ Gil มุ่งเน้นไปที่ 3D Computer Vision และได้รับการตีพิมพ์ที่ CVPR ซึ่งเป็นการประชุมวิจัยด้านคอมพิวเตอร์วิทัศน์ชั้นนำของโลก Datagen เป็นผู้บุกเบิกสาขาใหม่ของ Simulated Data ซึ่งเป็นชุดย่อยของข้อมูลสังเคราะห์ ซึ่งมุ่งเน้นไปที่ภาพถ่ายที่สร้างโลกรอบตัวเราขึ้นมาใหม่อย่างสมจริง บริษัทเปิดตัวจากการลักลอบด้วยเงินทุนมากกว่า 18 ล้านเหรียญสหรัฐในเดือนมีนาคม 2021 และขณะนี้กำลังทำงานร่วมกับบริษัทที่ติดอันดับ Fortune 100 จำนวนหนึ่งในด้านความเป็นจริงเสริม/ความเป็นจริงเสมือน หุ่นยนต์ และยานยนต์ รวมถึงบริษัทยักษ์ใหญ่ด้านเทคโนโลยีชั้นนำของสหรัฐฯ ส่วนใหญ่

อะไรดึงดูดคุณให้สนใจหุ่นยนต์และการเรียนรู้ของเครื่องจักรในตอนแรก

หนังสือ Sci-Fi เช่น Foundation Series ของ Isaac Asimov และ iRobot มักทำให้ฉันคิดถึงอนาคตที่หุ่นยนต์เป็นส่วนสำคัญในชีวิตประจำวันของเรา มีงานที่น่าเบื่อและซ้ำซากมากมายที่ผู้คนทำ ฉันรู้ว่าฉันไม่อยากทำ และนึกไม่ออกเลยว่าจะมีใครอยากทำอีก เมื่อพิจารณาว่าวิทยาการหุ่นยนต์เป็นสิ่งที่หลีกเลี่ยงไม่ได้ทางเทคโนโลยี ฉันคิดว่าการไปในทิศทางนั้นจะเป็นการตัดสินใจด้านอาชีพที่ชาญฉลาดและ “พิสูจน์อนาคต”

ดังนั้น ในตอนแรกฉันจึงเข้าสู่ภาคสนามโดยเน้นที่ลักษณะทางกายภาพของวิชา และได้รับปริญญาด้านวิศวกรรมเครื่องกลจาก Technion ในเมืองไฮฟา ประเทศอิสราเอล เมื่อจบปริญญา ฉันเริ่มดำดิ่งสู่โลกของเครื่องมือและความสามารถของ CAD เครื่องมือเหล่านี้ช่วยให้วิศวกรเครื่องกลสามารถออกแบบโครงสร้างและอุปกรณ์เชิงกล (ตั้งแต่สะพานไปจนถึงรถยนต์) ฉันเห็นโอกาสมหาศาลที่จะสร้างผลกระทบที่ยิ่งใหญ่โดยไม่ต้องรับมือกับการทำซ้ำอย่างช้าๆ ของโลกทางกายภาพ ในทางปฏิบัติ โปรแกรมเหล่านี้มีความสามารถด้านแมชชีนเลิร์นนิง/คอมพิวเตอร์วิทัศน์น้อยมาก (ถ้ามี) ซึ่งช่วยให้วิศวกรสร้างระบบกลไกที่เรียบง่ายขึ้น ราคาถูกลง และมีเสถียรภาพมากขึ้น (ย้อนกลับไปในปี 2015) ฉันเริ่มต้นในทิศทางของ Computer Vision บนข้อมูล 3 มิติด้วยการเรียนรู้เชิงลึก (ในตอนนั้นยังใหม่มาก) โดยมีเป้าหมายในการสร้างโปรแกรม CAD ที่ชาญฉลาดขึ้น การทำงานในยุคแรกๆ ของการเรียนรู้เชิงลึกสมัยใหม่ รู้สึกเหมือนเป็นส่วนหนึ่งของบางสิ่งที่อาจยิ่งใหญ่มาก — คล้ายกับอินเทอร์เน็ต

ในทางปฏิบัติ งานวิจัยของฉันเป็นงานวิจัยชิ้นแรกที่นำการปฏิวัติการเรียนรู้เชิงลึกมาสู่คณาจารย์ของเราที่ Technion ต่อมาสิ่งนี้กลายเป็นเอกสารที่ได้รับการยอมรับในการประชุม Computer Vision ชั้นนำของโลก นั่นคือ CVPR และฉันก็บินไปฮาวายที่งาน CVPR 2017 การนำเสนอบทความของฉันและพบปะผู้คนได้เปิดตาของฉันให้เห็นถึงขนาดของชุมชนคอมพิวเตอร์วิทัศน์ (ซึ่งในปัจจุบันนี้ มีขนาดใหญ่กว่าอย่างน้อย 10 เท่า) ผู้เข้าร่วมหลายพันคนล้วนทำงานวิจัยในสาขานี้ด้วยความกระตือรือร้น เหตุการณ์นั้นค่อนข้างประสานทิศทางของฉัน แสดงให้ฉันเห็นถึงพลังของคอมพิวเตอร์วิทัศน์และศักยภาพที่รอการปลดล็อก

คุณช่วยแบ่งปันเรื่องราวการกำเนิดเบื้องหลัง Datagen ได้ไหม

Datagen ก่อตั้งขึ้นในปี 2018 โดยมีพันธกิจในการเปลี่ยนแปลงวิธีที่ทีมได้รับข้อมูลสำหรับการฝึกอบรมเครือข่ายการมองเห็นด้วยคอมพิวเตอร์ ปีก่อน เราได้เห็นการสาธิต Oculus Rift ซึ่งประกอบด้วยชุดหูฟัง VR และอุปกรณ์ควบคุมระยะไกลแบบมือถือ หลังจากการสาธิต เราพบว่าตัวเองสงสัยว่า “ด้วยกล้องที่ล้ำสมัยที่ฝังอยู่ในชุดหูฟัง เหตุใดจึงต้องใช้อุปกรณ์พกพาเพื่อเชื่อมต่อพื้นที่เสมือนกับพื้นที่ทางกายภาพ (เช่น ติดตามการเคลื่อนไหวของมือ)” โครงข่ายประสาทเทียมนั้นซับซ้อนพอที่จะจัดการกับมันได้ แล้วปัญหาคืออะไร?” และนั่นคือตอนที่หลอดไฟดับลง — ข้อมูล! เราเห็นโอกาสอันยิ่งใหญ่ในการแก้ปัญหาการแสดงตนเชิงพื้นที่แบบ 3 มิติในทันที โดยใช้คอมพิวเตอร์วิทัศน์ขั้นสูงและข้อมูลเมตา 3 มิติ แทนที่จะมุ่งเน้นไปที่ VR/AR เพียงอย่างเดียว เราใช้แนวทางแบบองค์รวมมากขึ้น โดยมุ่งเน้นไปที่ปัญหาที่ดูเหมือนจะยากในการสร้างข้อมูลการฝึกอบรมที่เพียงพอ (และแม่นยำ) เพื่อเปิดใช้งานแอปพลิเคชัน 3D AI ในโลกแห่งความเป็นจริง

ด้วยการมุ่งเน้นไปที่มนุษย์และการมีปฏิสัมพันธ์ระหว่างมนุษย์กับสิ่งแวดล้อม Datagen จึงเป็นผู้บุกเบิกในด้านใหม่ของข้อมูลจำลอง ซึ่งเป็นชุดย่อยของข้อมูลสังเคราะห์ ซึ่งมุ่งเน้นที่การสร้างโลกรอบตัวเราขึ้นมาใหม่อย่างสมจริงด้วยภาพถ่าย ทุกวันนี้ เราทำงานร่วมกับบริษัทที่มีนวัตกรรมมากที่สุดในโลกเพื่อเติมพลังและเร่งการพัฒนาการมองเห็นด้วยคอมพิวเตอร์ของพวกเขา และได้รับการสนับสนุนจากนักลงทุนที่ได้รับการยอมรับมากที่สุดในแวดวงนี้

สำหรับผู้อ่านที่ไม่คุ้นเคย คุณช่วยอธิบายได้ไหมว่าข้อมูลสังเคราะห์คืออะไร

ข้อมูลสังเคราะห์คือข้อมูลการฝึกอบรมใดๆ ที่ถูกสร้างขึ้นโดยวิธีอัลกอริทึมหรือผ่านการจำลอง ในบริบทของการมองเห็นด้วยคอมพิวเตอร์ ข้อมูลสังเคราะห์คือภาพที่คอมพิวเตอร์สร้างขึ้นพร้อมข้อมูลเมตาที่เกี่ยวข้องซึ่งจำเป็นสำหรับการฝึกอบรมปัญญาประดิษฐ์ ด้วยปัญหาด้านความเป็นส่วนตัวและข้อจำกัดทางกายภาพและเศรษฐกิจที่แท้จริงต่อข้อมูลภาพในโลกแห่งความเป็นจริง จึงเป็นเรื่องยากที่จะกล่าวเกินจริงถึงความสำคัญของข้อมูลสังเคราะห์ต่อแมชชีนเลิร์นนิงและ AI ในรายงานล่าสุด Gartner คาดการณ์ว่าภายในปี 2024 ข้อมูลส่วนใหญ่ที่ใช้ในด้าน AI จะถูกสร้างเทียมด้วยเหตุผลดังกล่าว

ข้อมูลสังเคราะห์มีประโยชน์อย่างไรเมื่อเทียบกับการได้มาซึ่งข้อมูลด้วยตนเอง

คำตอบสั้นๆ คือ ให้นึกถึงทุกแง่มุมของการได้มาซึ่งข้อมูลด้วยตนเองซึ่งเป็นสิ่งที่ไม่พึงปรารถนา และลบออกจากกระบวนการ — สิ่งเหล่านี้คือประโยชน์ของข้อมูลสังเคราะห์

การสร้างชุดข้อมูลที่หลากหลายตามขนาดสำหรับการฝึกการมองเห็นด้วยคอมพิวเตอร์เป็นกระบวนการที่มีค่าใช้จ่ายสูงและใช้เวลามาก และความแปรปรวนถูกจำกัดอย่างมากด้วยข้อเท็จจริงที่ว่าการจัดตำแหน่งของมนุษย์ในสถานที่เฉพาะและการถ่ายภาพนั้นเป็นกระบวนการที่ซับซ้อน ซึ่งซับซ้อนและมีค่าใช้จ่ายสูงกว่าการทำแบบนั้นมาก สภาพแวดล้อมจำลอง ประโยชน์หลักอีกประการหนึ่งคือการขจัดความจำเป็นในการใส่คำอธิบายประกอบด้วยตนเองได้อย่างมีประสิทธิภาพ ซึ่งเป็นเรื่องที่น่าเบื่อ ใช้เวลานาน และมีแนวโน้มที่จะเกิดข้อผิดพลาดโดยมนุษย์

Datagen หมายถึงข้อมูลจำลองเป็นส่วนย่อยของข้อมูลสังเคราะห์ คุณช่วยอธิบายรายละเอียดเกี่ยวกับข้อมูลจำลองได้ไหม

ข้อมูลจำลองเป็นข้อมูลสังเคราะห์ที่สร้างขึ้นผ่านการจำลอง เราใช้ GAN (เช่นเดียวกับวิธีการเรียนรู้ของเครื่องที่ทันสมัยอื่นๆ) เพื่อสร้างวัตถุ 3 มิติและวางไว้ภายในการจำลอง 3 มิติที่เหมือนจริงอย่างมากของโลกแห่งความเป็นจริง สิ่งที่ดูเหมือนเป็นกระบวนการ "ถ่ายภาพเสมือนจริง" ในมุมมองบุคคลที่หนึ่ง แต่ดำเนินการภายในระบบฟิสิกส์ที่อิงตามภาพถ่ายที่เหมือนจริง การจำลองเหล่านี้สร้างข้อมูลภาพ (ราวกับว่ามันถูกรวบรวมในโลกแห่งความเป็นจริง) พร้อมกับคำอธิบายประกอบเต็มรูปแบบ (ฟิสิกส์ การจัดแสง ฯลฯ) ดังนั้น ข้อมูลจำลองจึงเป็นข้อมูลสังเคราะห์ที่เป็นภาพ 3 มิติที่เหมือนจริงจากภาพถ่าย สร้างขึ้นตามบริบท ซึ่งรวบรวมไว้ในสภาพแวดล้อมจำลอง

Datagen สร้างข้อมูลจำลองที่ปรับแต่งอย่างไร

เทคโนโลยีของ Datagen สร้างข้อมูลจำลองที่ทั้งปรับขนาดได้ง่ายและปรับแต่งด้วยมือเพื่อตอบสนองความต้องการเฉพาะของแอปพลิเคชันที่แตกต่างกันของลูกค้าแต่ละราย เราดำเนินการดังกล่าวโดยคำนึงถึงทุกแง่มุมของทุกโครงการ ตั้งแต่ระบบการมองเห็นด้วยคอมพิวเตอร์ที่ใช้ไปจนถึงองค์ประกอบทางประชากรศาสตร์ของภูมิภาคที่จะดำเนินงาน ไม่ว่าจะทำงานโดยตรงกับลูกค้าของเราหรือเพียงแค่เปิดใช้งานวิศวกรของพวกเขาเอง กระบวนการ Datagen จะเริ่มต้นด้วยการกำหนดพารามิเตอร์หลักสำหรับแต่ละกรณีการใช้งานเฉพาะ เช่น ข้อมูลจำเพาะของเลนส์ แสง สภาพแวดล้อม การกระจายข้อมูลประชากร และอื่นๆ Datagen ใช้ GAN และเครื่องมือและเทคนิคล้ำสมัยอื่น ๆ เพื่อสร้างสินทรัพย์ที่หลากหลาย รวมถึงทุกอย่างตั้งแต่ศีรษะมนุษย์ที่แสดงสีหน้าแบบไดนามิกเพื่อฝึก AI ในการวิเคราะห์อารมณ์ ไปจนถึงการตกแต่งภายในรถยนต์สำหรับการตรวจสอบผู้โดยสารในห้องโดยสาร และสภาพแวดล้อมในบ้านสำหรับวิดีโอ แอปพลิเคชั่นการประชุม เป็นเพียงตัวอย่างบางส่วนเท่านั้น สำหรับสินทรัพย์แต่ละประเภท Datagen นำเสนอค่าความแปรปรวนในแกนแยกจำนวนนับไม่ถ้วน (ตั้งแต่โทนสีผิวและความสูงของคิ้ว ไปจนถึงขนาด สี และรูปร่างของเฟอร์นิเจอร์ในครัวเรือน) โดยใช้พารามิเตอร์ที่ได้รับการปรับอย่างละเอียดเพื่อสะท้อนถึงการใช้งานเฉพาะที่มีอยู่

ด้วยความสามารถเหล่านี้ ชุดข้อมูลของ Datagen ไม่เพียงแต่มีขนาดใหญ่และมีความหลากหลายสูงเท่านั้น แต่ยังได้รับการปรับให้เหมาะสมสำหรับวัตถุประสงค์ในการฝึกอบรมระบบที่ไม่เหมือนใครเพื่อปฏิบัติงานเฉพาะ (หรือชุดของงาน) ในสภาพแวดล้อมหรือการตั้งค่าเฉพาะที่จะใช้งาน — ทั้งหมดโดยไม่สูญเสียความสามารถในการปรับขนาด นอกจากนี้ เรายังคำนึงถึงข้อกำหนดคำอธิบายประกอบ/ข้อมูลเมตาเฉพาะของแต่ละแอปพลิเคชันด้วย

ตัวอย่างโซลูชันในวิทยาการหุ่นยนต์ที่ใช้ข้อมูลสังเคราะห์และ/หรือข้อมูลจำลองมีอะไรบ้าง

ข้อดีอย่างหนึ่งของการใช้ข้อมูลจำลองในวิทยาการหุ่นยนต์คือความสามารถในการสร้างอิมเมจของฮาร์ดแวร์ที่ยังอยู่ในระหว่างการพัฒนา ด้วยวิธีนี้ สมองของหุ่นยนต์ (AI) และร่างกาย (ฮาร์ดแวร์) ของคุณสามารถพัฒนาไปพร้อมกันได้ ตอนนี้ การฝึกอบรมสามารถพัฒนาไปตามข้อกำหนดที่พัฒนาขึ้น แทนที่จะรอจนกระทั่งผลิตภัณฑ์ขั้นสุดท้ายของคุณได้รับการสร้างต้นแบบอย่างสมบูรณ์ก่อนที่คุณจะสามารถถ่ายภาพและเริ่มพัฒนา AI ได้

นอกจากนี้ เนื่องจากข้อมูลจำลองถูกสร้างขึ้นในบริบท คุณจึงสามารถอธิบายการโต้ตอบระหว่างหุ่นยนต์ของคุณกับสภาพแวดล้อมได้ง่ายขึ้นมาก ดังนั้น หากคุณจินตนาการถึงหุ่นยนต์ที่จับและนำผลิตภัณฑ์ที่มีข้อบกพร่องออกจากสายการประกอบ ข้อมูลจำลองจะช่วยให้คุณไม่เพียงแต่สร้างข้อมูลสำหรับข้อบกพร่องทางกายภาพทุกอย่างเท่าที่จะจินตนาการได้ในผลิตภัณฑ์เท่านั้น แต่ยังรวมถึงจากมุมมองของหุ่นยนต์เพื่อจับภาพช่วงแขนกลทั้งหมด ของการเคลื่อนไหว การโต้ตอบกับวัตถุที่จับ ยิ่งไปกว่านั้น ข้อมูลเมตา 3 มิติหมายความว่าไม่จำเป็นต้องใส่คำอธิบายประกอบภาพแล้วภาพเล่าเพื่อให้แน่ใจว่าหุ่นยนต์สามารถระบุผลิตภัณฑ์ ข้อบกพร่อง แขน หรือสิ่งอื่นใดในขอบเขตการมองเห็นได้อย่างเหมาะสม

กรณีการใช้ข้อมูลจำลองในรถยนต์อัจฉริยะมีอะไรบ้าง

ข้อมูลจำลองในการพัฒนารถยนต์อัจฉริยะทำให้การพัฒนาชุดข้อมูลสำหรับรถยนต์รุ่นใดรุ่นหนึ่งง่ายขึ้นอย่างไม่สิ้นสุด ขณะที่กำลังออกแบบ โดยจะวนซ้ำไปพร้อมกับตัวรถเองขณะดำเนินการผ่านขั้นตอนต่างๆ ของการออกแบบและการผลิต ด้วยข้อมูลภาพจำลอง วิศวกรยังสามารถใช้การมองเห็นในห้องโดยสารได้อย่างมีประสิทธิภาพมากขึ้นเพื่อระบุผู้ขับขี่ที่ง่วงนอนหรือเสียสมาธิ หากผู้ขับขี่ปล่อยมือออกจากพวงมาลัย หรือขอบกรณีใดก็ตามเพื่อความปลอดภัยของผู้ขับขี่ นอกจากนี้ยังช่วยให้วิศวกรสามารถคำนึงถึงความหลากหลายที่มากขึ้นของผู้ขับขี่และผู้โดยสาร และแนะนำความแปรปรวนในรูปแบบของมุมภาพและแสง โดยไม่ละเมิดความเป็นส่วนตัวของบุคคลจริง

เมื่อเร็ว ๆ นี้ Datagen ประกาศจำนวนมาก พนักงานใหม่ที่น่าตื่นเต้นสิ่งนี้หมายความว่าอย่างไรสำหรับอนาคตของบริษัท

การเพิ่มเติมล่าสุดในคณะกรรมการที่ปรึกษาและผู้บริหารระดับสูงของเรา ได้แก่ ผู้เชี่ยวชาญที่ประสบความสำเร็จและยอดเยี่ยมที่สุดบางคนในสาขา AI และ Computer Vision ความรู้ ข้อมูลเชิงลึก และประสบการณ์ของพวกเขาจะช่วยกำหนดทิศทางและเร่งการเติบโตของ Datagen ในขณะที่เราสำรวจอุตสาหกรรมที่ยังใหม่และเต็มไปด้วยโอกาส ในพื้นที่ที่มีสิ่งแปลกปลอมมากมาย ไม่มีสิ่งใดมีค่ามากกว่าความรู้

มีอะไรอีกบ้างที่คุณต้องการแบ่งปันเกี่ยวกับ Datagen?

Datagen เป็นส่วนหนึ่งของการเปลี่ยนแปลงทางเศรษฐกิจและวัฒนธรรมที่ยิ่งใหญ่กว่าที่เคยเกิดขึ้นในอิสราเอล และเราภูมิใจที่ได้เป็นส่วนหนึ่งของการเปลี่ยนแปลงนี้ ในช่วงเวลาสั้นๆ อิสราเอล (โดยเฉพาะเทลอาวีฟ) ได้เติบโตขึ้นเป็นศูนย์กลางเทคโนโลยีระดับโลกที่สำคัญ พร้อมด้วยระบบนิเวศของสตาร์ทอัพที่เฟื่องฟูและชุมชนการลงทุนที่กระตือรือร้น แม้ว่าอิสราเอลมักจะถูกมองว่าเป็นศูนย์กลางเทคโนโลยีที่มีความปลอดภัยทางไซเบอร์ แต่ AI และเทคโนโลยีที่มีข้อมูลเป็นศูนย์กลางก็เติบโตขึ้นอย่างทวีคูณในช่วงไม่กี่ปีที่ผ่านมาที่นี่ ปัจจุบันมีบริษัทด้านปัญญาประดิษฐ์มากกว่า 680 บริษัทในอิสราเอล ซึ่งระดมทุนรวมกันได้ 4.5 พันล้านดอลลาร์ การเติบโตอย่างรวดเร็วในช่วงไม่กี่ปีที่ผ่านมามีสาเหตุหลักมาจากการที่วิศวกรและมหาวิทยาลัยที่มีชื่อเสียงระดับโลกของอิสราเอลมีความเข้มข้นสูง สถาบันการศึกษาเหล่านี้ให้การเข้าถึงความสามารถและการพัฒนาเทคโนโลยีใหม่ที่ทันสมัยในพื้นที่ ในช่วงสองเดือนที่ผ่านมา Datagen ได้จ้างพนักงานมากกว่า 20 คน และวางแผนที่จะเพิ่มสมาชิกในทีมเพิ่มเติมในฝ่ายขายและการตลาด ซอฟต์แวร์และ DevOps และแผนกผลิตภัณฑ์

ขอบคุณสำหรับบทสัมภาษณ์ที่ดี ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม ดาต้าเจน.

ผู้ร่วมก่อตั้ง unite.AI และเป็นสมาชิกของ สภาเทคโนโลยี Forbes อองตวนเป็นอ ผู้เป็นเจ้ายังมาไม่ถึง ผู้หลงใหลเกี่ยวกับอนาคตของ AI และหุ่นยนต์

เขายังเป็นผู้ก่อตั้ง หลักทรัพย์.ioซึ่งเป็นเว็บไซต์ที่เน้นการลงทุนด้านเทคโนโลยีก่อกวน