สัมภาษณ์
Ofir Mulla, ผู้ร่วมก่อตั้งและ CTO ของ Lumana – สัมภาษณ์ซีรีส์

Ofir Mulla, ผู้ร่วมก่อตั้งและ CTO ของ Lumana, มีประสบการณ์มากกว่าหนึ่งทศวรรษในด้านเทคโนโลยี 3D และการมองเห็นคอมพิวเตอร์ โดยเป็นผู้บุกเบิกและขยายโซลูชันข้ามโหมด coded-light, สเตอริโอ และ LiDAR ในขณะที่นำการพัฒนาระหว่างสาขาในซอฟต์แวร์, ระบบไฟฟ้า, โรบอต, ML/AI และอุปกรณ์ทางการแพทย์ ก่อนที่เขาจะร่วมงานกับ Lumana ในปัจจุบัน เขาใช้เวลาเกือบ 15 ปีที่ Intel โดยที่เขาออกแบบแพลตฟอร์ม RealSense 3D และนำทีมที่ครอบคลุมฮาร์ดแวร์, เฟิร์มแวร์ และระบบสถาปัตยกรรม
Lumana เป็นบริษัทด้านความปลอดภัยของวิดีโอและวิชาการที่มีแพลตฟอร์มที่สามารถเปลี่ยนกล้องที่มีอยู่ให้เป็นตัวแทน智能ที่สามารถรับรู้และตอบสนองต่อเหตุการณ์ในโลกแห่งความเป็นจริงได้แบบเรียลไทม์ – ตั้งแต่การเข้าถึงโดยไม่ได้รับอนุญาตและการละเมิดกฎความปลอดภัยไปจนถึงข้อมูลเชิงลึกด้านการดำเนินงาน – ทำให้องค์กรต่างๆ ในด้านการศึกษา, รัฐบาล, ค้าปลีก, การผลิต และการบริการสามารถรวมความฉลาดของกล้อง, อัตโนมัติในการตรวจสอบ และปลดล็อกการวิเคราะห์ที่สามารถดำเนินการได้จากโครงสร้างพื้นฐานวิดีโอของตน
คุณมีประสบการณ์อย่างไรที่ Intel ที่เตรียมคุณให้พร้อมสำหรับ Lumana และการก่อตั้งบริษัท?
เทคโนโลยี LiDAR เป็นส่วนสำคัญของ RealSense ซึ่งเป็นวิธีการใช้แสงเลเซอร์เพื่อจับภาพเรขาคณิตของโลก มันเป็นเทคโนโลยีที่สวยงามที่นักวิศวกรที่มีพรสวรรค์ของเราที่ Intel คิดค้นขึ้น การรับรู้เรขาคณิตมีความสำคัญสำหรับวัตถุที่เคลื่อนที่ เช่น โรบอตและรถยนต์ ซึ่งเป็นเหตุผลที่ระบบโรบอตส่วนใหญ่ในปัจจุบันพึ่งพาอุปกรณ์ RealSense
แต่เกิดคำถามขึ้น: สิ่งใดจะเกิดขึ้นเมื่อเซ็นเซอร์อยู่ในตำแหน่งที่ไม่เปลี่ยนแปลง โดยที่การนำทางและการตอบสนองไม่ใช่ภารกิจหลัก? เราได้ถามตัวเองว่าเทคโนโลยีใดที่สามารถให้คุณค่าสูงสุดแก่ผู้ใช้ในบริบทนั้น
จากการอภิปรายอย่างลึกซึ้ง เราได้พบว่าระบบกล้องที่มีอยู่ส่วนใหญ่ไม่สามารถขยายได้อย่างเป็นธรรมชาติ การตรวจสอบแต่ละระบบเป็นเรื่องที่ยุ่งยาก ในเวลาเดียวกัน AI ได้พัฒนาถึงจุดที่เริ่มถามว่า: ระบบที่มีราคาไม่แพงสามารถส่งมอบการตอบสนองด้านความปลอดภัยที่เร่งด่วนและเชื่อถือได้ให้กับการเตือนภัยที่สำคัญได้อย่างไร?
เราได้สร้างทีม AI ที่แข็งแกร่งซึ่งสามารถเปลี่ยนความมุ่งมั่นนี้ให้เป็นผลิตภัณฑ์ที่ใช้การได้จริงได้อย่างรวดเร็ว ข้อคิดเห็นนั้นง่ายมาก: ยานพาหนะที่เคลื่อนที่ต้องการการรับรู้เรขาคณิต แต่เซ็นเซอร์ที่อยู่ในตำแหน่งที่ไม่เปลี่ยนแปลง ซึ่งมุ่งเน้นไปที่การตรวจสอบพฤติกรรมมากกว่าการวางแผนการเคลื่อนไหว จะได้รับประโยชน์มากขึ้นจากการวิเคราะห์วิดีโอที่ซับซ้อนโดยไม่ต้องมีการสร้างเรขาคณิตอย่างชัดเจน
การเดินทางของ RealSense สอนฉันว่าปัญหาแต่ละอย่างต้องการวิธีแก้ปัญหาของตนเอง และการเปลี่ยนแปลงที่แท้จริงต้องอาศัยนวัตกรรม ทีมของฉันที่ Lumana มีหลักการนี้: มืออาชีพ, นวัตกรรม และมุ่งมั่น ด้วยกันเราสร้างระบบแบบเรียลไทม์ที่นำประสิทธิภาพคลาวด์มาไว้ที่ขอบ มีราคาไม่แพง ขยายได้ และตอบสนองได้
Physical AI มีความแตกต่างจากวิดีโอแอนะไลซิสแบบดั้งเดิมอย่างไร เช่น การตรวจจับวัตถุและการระบุแบบแผน?
เมื่อเราพูดถึง Physical AI เราหมายถึงระบบ AI ที่ไม่หยุดเพียงแค่การรับรู้ แต่ยังโต้ตอบกับโลกแห่งความเป็นจริงด้วย วิดีโอแอนะไลซิสแบบดั้งเดิม เช่น การตรวจจับวัตถุหรือการระบุแบบแผน เป็นเพียงชั้นแรกเท่านั้น ความท้าทายที่ลึกซึ้งกว่าคือสิ่งที่ตามมา: การจัดเรียง, การติดตาม, การรวม, การระบุ, การค้นหา และการตรวจสอบวัตถุที่ตรวจจับได้ และการเร่งการตอบสนอง นอกจากนี้ยังรวมถึงการเปิดใช้งานการเข้าถึงแบบข้อความและแม้กระทั่งการค้นหาวัตถุที่ระบบไม่ได้รับการฝึกฝนมา
ทั้งหมดนี้ต้องทำได้ภายในอุปกรณ์คอมพิวเตอร์ที่มีราคาไม่แพง นั่นคือจุดที่ Physical AI ไปไกลกว่าการวิเคราะห์แบบดั้งเดิม: มันเปลี่ยนการตรวจจับที่ไม่ได้ประมวลผลเป็นข้อมูลเชิงลึกที่สามารถดำเนินการได้และเข้าถึงได้ ไม่ใช่เกี่ยวกับการค้นหากฎของฟิสิกส์ ซึ่งเป็นการแสวงหาทางวิทยาศาสตร์ที่ยังคงถูกถกเถียงกัน แต่เกี่ยวกับการให้วิธีการที่เป็นไปได้และเชื่อถือได้ในการเข้าถึงและดำเนินการกับเนื้อหาวิดีโอและเสียงในโลกแห่งความเป็นจริง
คุณสามารถอธิบายเสาหลักทางเทคนิคที่ทำให้ Lumana สามารถรวมข้อมูลจากกล้องหลายตัว, ตีความพฤติกรรมในแบบเรียลไทม์ และปรับตัวอย่างต่อเนื่องตามข้อมูลบริบทและประวัติได้หรือไม่?
เป็นคำถามที่ดี เสาหลักทางเทคนิคหลักของเราคือความสามารถของระบบแบบเรียลไทม์ที่จะปรับตัวให้เข้ากับฉากที่สังเกตได้ ซึ่งปัจจุบันเรียกว่าการเรียนรู้อย่างต่อเนื่อง คุณสามารถคิดว่ามันเป็นระบบที่พัฒนาไปพร้อมกับสภาพแวดล้อมของมัน โดยปรับปรุงไปตามเวลา วิธีการนี้ทำให้เราสามารถส่งมอบประสิทธิภาพสูงด้วยต้นทุนที่ต่ำมากและความคล่องตัวที่ดีเยี่ยม
เสาหลักอีกประการหนึ่งคือสถาปัตยกรรมแบบ階層ของเรา ซึ่งเพิ่มความพยายามในการคำนวณเฉพาะเมื่อจำเป็นเท่านั้น ซึ่งทำให้แน่ใจว่าการกระทำที่ซับซ้อนจะได้รับทรัพยากรที่จำเป็นโดยไม่ทำให้ระบบทั้งหมดหนักเกินไป
เมื่อรวมกันแล้ว หลักการเหล่านี้ก่อตัวเป็นแพลตฟอร์มที่เรียบง่าย มีประสิทธิภาพ และขยายได้มาก ทำให้ผู้ใช้สามารถสัมผัสกับข้อมูลเชิงลึกแบบเรียลไทม์และการตีความพฤติกรรมได้ในราคาที่ต่ำที่สุด
คุณสามารถแบ่งปันการนำไปใช้จริงหนึ่งหรือสองครั้งได้หรือไม่ โดยที่ระบบของ Lumana ตรวจจับเหตุการณ์เช่น การเพิ่มขึ้นของความรุนแรง, การละเมิดขอบเขตความปลอดภัย หรือ การลอยหน้า และอธิบายผลกระทบที่มีต่อความปลอดภัยหรือการตอบสนองด้านการดำเนินงาน?
การนำไปใช้ของ Lumana ในเมืองแสดงให้เห็นถึงการปรับปรุงที่ชัดเจนในด้านการรับรู้และตอบสนองแบบเรียลไทม์ ในเมืองหลักของอิสราเอล ระบบได้เปลี่ยนเครือข่ายวิดีโอที่มีอยู่ให้เป็นชั้นการเตือนล่วงหน้าที่ฉลาดซึ่งตรวจจับการลอยหน้าในพื้นที่ที่ถูกจำกัด, ความผิดปกติของฝูงชน, การบุกรุกหลังเวลาทำการ และการเคลื่อนไหวที่ไม่ปกติ ซึ่งนำไปสู่การบุกรุกที่น้อยลง, การทำลายทรัพย์สินลดลง และการแทรกแซงเร็วขึ้นในพื้นที่เสี่ยง
เทศบาลในสหรัฐอเมริกามีผลลัพธ์ที่คล้ายกันในย่านประวัติศาสตร์ที่ต่อสู้กับการทำลายทรัพย์สิน, การบุกรุก, การก่อความวุ่นวาย และการลอยหน้า Lumana ส่งมอบการตรวจสอบอย่างต่อเนื่องและการเตือนภัยทันที ทำให้สามารถควบคุมและตอบสนองได้เร็วขึ้น ซึ่งนำไปสู่พื้นที่สาธารณะที่ปลอดภัยยิ่งขึ้นและลดการเสียเปล่าในการดำเนินงานของเมือง
ตัวอย่างเหล่านี้แสดงให้เห็นว่าการตรวจจับพฤติกรรมแบบเรียลไทม์ เช่น การลอยหน้าและการละเมิดขอบเขต จะเสริมสร้างความปลอดภัยสาธารณะและทำให้การดำเนินงานมีประสิทธิภาพ
เมื่อระบบ AI ตีความพฤติกรรมทางกายภาพที่ละเอียดอ่อน คุณมีมาตรการรักษาความปลอดภัยอย่างไรที่ฝังอยู่ในกระบวนการออกแบบและนำไปใช้?
เทคโนโลยีและออกแบบของ Lumana เน้นการกำกับดูแลที่เข้มแข็งและการเคลื่อนย้ายข้อมูลที่น้อยที่สุด การประมวลผลจะดำเนินการ ณ จุดสิ้นสุดเมื่อเป็นไปได้ เพื่อจำกัดการเปิดเผยและเสริมสร้างความปลอดภัย การเข้าถึงถูกจำกัดผ่านการควบคุมที่ชัดเจนและประวัติการตรวจสอบ เพื่อให้ทีมสามารถติดตามกระบวนการทำงานทั้งหมดได้ ระบบเก็บวิดีโอไว้ที่ địa phương โดยแบ่งปันเฉพาะข้อมูลอ้างอิงที่จำเป็น ซึ่งสนับสนุนความคาดหวังด้านความปลอดภัยในสภาพแวดล้อมที่มีการควบคุม
มาตรการเหล่านี้รับประกันว่าข้อมูลวิดีโอที่ละเอียดอ่อนจะถูกจัดการอย่างรับผิดชอบ ในขณะเดียวกันก็รักษาความสามารถในการดำเนินงานแบบเรียลไทม์
อะไรขับเคลื่อนสถาปัตยกรรมแบบไฮบริด-คลาวด์ของคุณ และมันสนับสนุนการประมวลผลแบบเรียลไทม์และการเรียนรู้อย่างต่อเนื่องได้อย่างไร?
Lumana ใช้แนวทางแบบไฮบริดเพื่อรวมประสิทธิภาพของระบบแบบเรียลไทม์ที่จุดสิ้นสุดกับความยืดหยุ่นของคลาวด์ การประมวลผล ณ จุดสิ้นสุดให้การประมวลผล AI, การจัดเก็บ และการจัดการวิดีโอแบบเรียลไทม์โดยค่าเริ่มต้น ซึ่งลดความต้องการแบนด์วิธและเสริมสร้างความปลอดภัย ในขณะเดียวกันก็ยังช่วยให้สามารถเข้าถึงคลาวด์ได้เมื่อจำเป็นสำหรับการประสานงานที่กว้างขึ้นหรือการเรียนรู้ข้ามการนำไปใช้
สถาปัตยกรรมนี้ให้ผู้ใช้ได้รับการตอบสนองทันที ในขณะเดียวกันก็ยังคงความสามารถในการขยายและปรับปรุงผ่านการปรับตัวแบบต่อเนื่องข้ามไซต์
คุณออกแบบความสามารถในการเรียนรู้ด้วยตนเองได้อย่างไร และมันปรับปรุงอย่างไรเมื่อเวลาผ่านไปในการนำไปใช้หลายแห่ง?
สถาปัตยกรรมของความสามารถในการเรียนรู้ด้วยตนเองของเราถูกสร้างขึ้นรอบๆ ความสามารถในการปรับขนาด มากกว่าไซต์ที่เรานำไปใช้ แนวคิดของเราจะกว้างขึ้นข้ามภูมิทัศน์ของอุปกรณ์จุดสิ้นสุดแต่ละตัว ทุกสภาพแวดล้อมใหม่จะนำเสนอข้อมูลใหม่ๆ ที่เพิ่มความหลากหลายของสถานการณ์และฉากที่ระบบสามารถเรียนรู้ได้
วิธีการเรียนรู้อย่างต่อเนื่องของเรานำประโยชน์จากความรู้ร่วมกันนี้มาใช้ เมื่อระบบปรับปรุงตัวเองข้ามการนำไปใช้ กระบวนการฝึกอบรมออนไลน์จะกลายเป็นเรื่องที่ง่ายและรวดเร็วมากขึ้น ในแง่ปฏิบัติ แนวคิดที่กว้างขึ้นจะทำให้การปรับตัวเร็วขึ้นและแม่นยำยิ่งขึ้น โดยนำไปสู่ระบบที่ปรับปรุงตัวเองอย่างต่อเนื่องเมื่อเวลาผ่านไปทุกแห่ง
คุณเห็นใครเป็นคู่แข่งหลักหรือผู้ร่วมงานในพื้นที่นี้ และอะไรที่ทำให้ Lumana มีเอกลักษณ์?
ความเป็นเอกลักษณ์ที่แท้จริงของเรานั้นอยู่ที่คนของเรา ข้างหลัง Lumana คือทีมวิศวกรและนวัตกรที่มีพรสวรรค์ เริ่มตั้งแต่กลุ่ม AI ของเรา ซึ่งได้รับการสนับสนุนจากผู้เชี่ยวชาญด้านคลาวด์, นักออกแบบ UX/UI และเสริมสร้างโดยการสนับสนุนลูกค้าและการขาย ในขณะที่ AI เป็นรากฐานของเทคโนโลยีของเรา แต่เครื่องยนต์ของมนุษย์ของเราที่ขับเคลื่อนความสำเร็จของเรา ความสร้างสรรค์, มืออาชีพ และความมุ่งมั่นของทีมของเราคือสิ่งที่ทำให้ Lumana แตกต่าง ไม่ว่าจะเป็นการแข่งขันหรือการทำงานร่วมกัน
Lumana เน้น “คิดใหญ่”, “ลูกค้าเป็นศูนย์กลาง”, “ทีมเดียว” และ “ชำนาญงานของตน” คุณดำเนินการค่านิยมเหล่านี้ในกระบวนการสรรหาบุคลากร, การพัฒนาผลิตภัณฑ์ และชีวิตประจำวันอย่างไร?
เราจ้างนวัตกรที่คิดใหญ่, แก้ปัญหา, ร่วมมือ และมุ่งมั่นต่อการเติบโต
ทีมผลิตภัณฑ์สร้าง AI ที่มีประสิทธิภาพสูงด้วยวิสัยทัศน์ที่ทะเยอทะยาน, พัฒนาผ่านการรับฟังความคิดเห็นของลูกค้า, ส่งเสริมการทำงานร่วมกัน และมุ่งมั่นต่อความเป็นเลิศ
การดำเนินงานประจำวันใช้วิธีการแบบ Agile เพื่อทำให้ความคิดที่กล้าได้ผล, จัดลำดับความสำคัญของความต้องการของลูกค้า, สร้างความสามัคคีในทีม และสนับสนุนการพัฒนาทางวิชาชีพ
แนวปฏิบัติเหล่านี้ขับเคลื่อนนวัตกรรม, ความสำเร็จของลูกค้า และผลกระทบในด้าน AI ความปลอดภัยของวิดีโอ
เมื่อมองไปข้างหน้า 5 ปี คุณเห็นบทบาทของ Lumana วิวัฒนาการอย่างไรในระบบ AI ที่กว้างขึ้น และคุณหวังว่า Physical AI จะมีผลกระทบต่ออุตสาหกรรมอย่างความปลอดภัย, การผลิต หรือเมืองอัจฉริยะเมื่อถึงเวลานั้น?
เมื่อมองไปข้างหน้า 5 ปี เราเห็นบทบาทของ Lumana วิวัฒนาการเป็นผู้ให้ความสามารถหลักของ Physical AI ที่ใช้ได้จริงข้ามอุตสาหกรรม ในขณะที่การแก้ปัญหาพื้นฐานของฟิสิกส์ยังคงเป็นปริศนาทางวิทยาศาสตร์ที่ยังคงถูกถกเถียงกัน ความมุ่งมั่นของเราตอนนี้คือการสร้างมูลค่าให้กับลูกค้า โดยพัฒนาทools ที่ช่วยให้องค์กรต่างๆ สามารถตรวจสอบและตอบสนองต่อโลกที่อยู่รอบตัวพวกเขาได้ดีขึ้น
เรามีการทำงานร่วมกันระยะยาวกับศูนย์ทางการแพทย์ และกำลังสำรวจการขยายไปยังแพลตฟอร์มที่เคลื่อนไหว เช่น โรบอตและระบบขนส่ง เมื่อเวลาผ่านไปและเราขยายตัว เรายังตั้งใจที่จะลงทุนในคำถามการวิจัยพื้นฐานมากขึ้น: AI สามารถช่วยค้นหาความสัมพันธ์ที่ลึกซึ้งยิ่งขึ้นในธรรมชาติได้หรือไม่? หรือแม้กระทั่งช่วยให้เราเข้าใจแนวคิดใหม่ๆ เกี่ยวกับกฎของฟิสิกส์?
ความทะเยอทะยานของเราคือการขับเคลื่อนผลกระทบต่อความปลอดภัย, การผลิต และเมืองอัจฉริยะ ในขณะเดียวกันก็ยังคงเห็นภาพที่กว้างขึ้น โดยผลักดันขอบเขตของสิ่งที่ AI สามารถช่วยให้เราค้นพบได้
ขอขอบคุณสำหรับสัมภาษณ์ที่ยอดเยี่ยม ผู้อ่านสามารถเยี่ยมชม Lumana เพื่อเรียนรู้เพิ่มเติม.












