Phỏng vấn
Ofir Mulla, Đồng sáng lập và CTO của Lumana – Loạt phỏng vấn

Ofir Mulla, Đồng sáng lập và CTO của Lumana, mang lại hơn một thập kỷ kinh nghiệm sâu sắc trong các công nghệ 3D và tầm nhìn máy tính, đã tiên phong và mở rộng các giải pháp trên các phương thức mã hóa ánh sáng, stereo và LiDAR trong khi dẫn đầu phát triển liên ngành trong phần mềm, hệ thống điện, robot, ML / AI và thiết bị y tế. Trước khi đảm nhiệm vai trò hiện tại tại Lumana, anh đã dành gần 15 năm tại Intel, nơi anh đã thiết kế nền tảng 3D RealSense và dẫn đầu các nhóm bao gồm phần cứng, firmware và kiến trúc hệ thống.
Lumana là một công ty an ninh video và trí tuệ hình ảnh tiên tiến, nền tảng của công ty này biến các camera hiện có thành các tác nhân thông minh, nhạy cảm bằng cách tận dụng AI để phát hiện và phản ứng với các sự kiện thế giới thực theo thời gian thực – từ truy cập không được phép và vi phạm an toàn đến thông tin hoạt động – cho phép các doanh nghiệp trên các lĩnh vực giáo dục, chính phủ, bán lẻ, sản xuất và khách sạn thống nhất thông tin camera, tự động hóa giám sát và mở khóa phân tích hành động từ cơ sở hạ tầng video của họ.
Làm thế nào kinh nghiệm của bạn tại Intel đã chuẩn bị cho bạn để thành lập Lumana và thành lập công ty?
Công nghệ LiDAR là một phần cốt lõi của RealSense, một phương pháp chủ động phát xạ ánh sáng laser để thu thập hình học của thế giới. Đó là một công nghệ ánh sáng mã hóa đẹp được các kỹ sư tài năng của chúng tôi tại Intel phát minh. Cảm biến hình học là rất quan trọng đối với các đối tượng di chuyển, chẳng hạn như robot và ô tô, đó là lý do tại sao hầu hết các hệ thống robot ngày nay dựa vào thiết bị RealSense.
Tuy nhiên, một câu hỏi đã được đặt ra: điều gì xảy ra khi các cảm biến là cố định, nơi điều hướng và thời gian tác động không phải là nhiệm vụ chính? Chúng tôi tự hỏi bản thân công nghệ nào có thể mang lại giá trị lớn nhất cho người dùng trong bối cảnh đó.
Thông qua các cuộc thảo luận sâu sắc, chúng tôi nhận ra rằng hầu hết các hệ thống camera cố định hiện có không thể được mở rộng một cách tự nhiên. Giám sát mỗi hệ thống là một việc vất vả. Đồng thời, AI đã trưởng thành đến mức chúng tôi bắt đầu tự hỏi: làm thế nào một hệ thống có giá cả phải chăng tại địa điểm của khách hàng có thể cung cấp các phản hồi an ninh đáng tin cậy và cấp bách nhất cho các cảnh báo quan trọng?
Chúng tôi đã xây dựng một đội AI mạnh mẽ đã nhanh chóng biến tầm nhìn này thành một sản phẩm hoạt động. Sự hiểu biết là đơn giản: các phương tiện di chuyển đòi hỏi cảm biến hình học, nhưng các cảm biến cố định, tập trung vào việc theo dõi hành vi hơn là lập kế hoạch di chuyển, sẽ được hưởng lợi nhiều hơn từ phân tích video tiên tiến mà không cần xây dựng hình học rõ ràng.
Chuyến đi RealSense đã dạy tôi rằng mỗi vấn đề đòi hỏi phải có giải pháp riêng và sự gián đoạn thực sự đòi hỏi sự đổi mới. Đội ngũ của tôi tại Lumana thể hiện nguyên tắc này: chuyên nghiệp, đổi mới và đầy tham vọng. Cùng nhau, chúng tôi đã tạo ra một hệ thống trên cơ sở, theo thời gian thực, mang lại hiệu suất như đám mây đến rìa, phải chăng, có thể mở rộng và phản hồi.
Làm thế nào Physical AI vượt qua phân tích video truyền thống như phát hiện đối tượng và ghi nhãn mẫu?
Khi chúng tôi nói về Physical AI, chúng tôi có nghĩa là một hệ thống AI không chỉ dừng lại ở việc nhận thức, mà còn tích cực tương tác với thế giới thực. Phân tích video truyền thống, như phát hiện đối tượng hoặc ghi nhãn mẫu, chỉ là lớp đầu tiên. Thách thức sâu sắc hơn là những gì đến sau: sắp xếp, theo dõi, tổng hợp, xác định, thu hồi, tìm kiếm và xác minh các đối tượng đã phát hiện và tăng tốc phản hồi. Nó cũng bao gồm việc cho phép truy cập dựa trên văn bản và thậm chí tìm kiếm các đối tượng mà hệ thống không được đào tạo ban đầu để phát hiện.
Tất cả những điều này phải được thực hiện trong một thiết bị tính toán nhỏ gọn, phải chăng. Đó là nơi Physical AI vượt qua phân tích truyền thống: nó biến phát hiện thô thành thông tin có thể hành động và có thể tiếp cận. Nó không phải là về việc khám phá các định luật của vật lý, một cuộc điều tra khoa học vẫn còn tranh cãi, mà về việc cung cấp các cách thực tế, hiệu quả để tiếp cận và hành động trên nội dung hình ảnh và âm thanh trong các môi trường thế giới thực.
Các trụ cột kỹ thuật nào cho phép Lumana kết hợp dữ liệu từ nhiều camera, giải thích hành vi theo thời gian thực và liên tục thích nghi dựa trên đầu vào ngữ cảnh và lịch sử?
Câu hỏi tuyệt vời. Một trong những trụ cột kỹ thuật cốt lõi của chúng tôi là khả năng của hệ thống trên cơ sở liên tục thích nghi với cảnh nó quan sát, điều mà bây giờ thường được gọi là học liên tục. Bạn có thể nghĩ về nó như một hệ thống phát triển cùng với môi trường của nó, cải thiện theo thời gian. Cách tiếp cận này đã cho phép chúng tôi cung cấp hiệu suất cao với chi phí rất thấp và sự linh hoạt đặc biệt.
Một trụ cột quan trọng khác là kiến trúc phân cấp của chúng tôi, nó thông minh tăng cường nỗ lực tính toán chỉ khi cần. Điều này đảm bảo rằng các hành động phức tạp nhận được tài nguyên chúng cần mà không làm nặng hệ thống toàn bộ.
Khi kết hợp lại, những nguyên tắc này tạo thành một nền tảng đơn giản, hiệu quả và có khả năng mở rộng cao, cho phép người dùng trải nghiệm những hiểu biết theo thời gian thực mạnh mẽ và giải thích hành vi tại chi phí thấp nhất có thể.
Bạn có thể chia sẻ một hoặc hai triển khai thực tế nơi hệ thống của Lumana đã phát hiện các sự kiện như leo thang bạo lực, vi phạm ranh giới an toàn hoặc lang thang, và giải thích tác động của chúng đối với an toàn hoặc phản ứng hoạt động?
Triển khai của Lumana ở các thành phố cho thấy sự cải thiện rõ ràng về nhận thức và phản ứng theo thời gian thực. Tại một thành phố lớn ở Israel, hệ thống đã biến một mạng video hiện có thành một lớp cảnh báo sớm thông minh, phát hiện lang thang trong các khu vực hạn chế, dị thường đám đông, xâm nhập sau giờ và di chuyển không đều. Điều này dẫn đến ít đột nhập, giảm phá hoại và can thiệp nhanh hơn trong các khu vực rủi ro cao.
Một thành phố ở Mỹ đã thấy những lợi ích tương tự trong một khu lịch sử đang vật lộn với phá hoại, đột nhập xe hơi, mất trật tự và lang thang. Lumana đã cung cấp giám sát liên tục và cảnh báo ngay lập tức, cho phép tuần tra chủ động và phản ứng nhanh hơn. Điều này dẫn đến không gian công cộng an toàn hơn và ít lãng phí hoạt động hơn cho thành phố.
Các ví dụ này minh họa cho cách phát hiện hành vi theo thời gian thực, chẳng hạn như lang thang và vi phạm ranh giới, củng cố an toàn công cộng và tối ưu hóa hoạt động.
Khi các hệ thống AI giải thích hành vi vật lý nhạy cảm, những biện pháp bảo vệ quyền riêng tư nào được nhúng vào quy trình thiết kế và triển khai?
Công nghệ và thiết kế của Lumana nhấn mạnh quản trị mạnh mẽ và di chuyển dữ liệu tối thiểu. Xử lý được thực hiện trên rìa, khi có thể, để hạn chế tiếp xúc và tăng cường quyền riêng tư. Truy cập được hạn chế thông qua các điều khiển rõ ràng và nhật ký kiểm toán để các nhóm có thể theo dõi mọi quy trình làm việc. Hệ thống giữ video tại địa phương, chỉ chia sẻ các siêu dữ liệu cần thiết, điều này hỗ trợ mong đợi quyền riêng tư trong các môi trường được quản lý.
Các biện pháp bảo vệ này đảm bảo rằng dữ liệu hình ảnh nhạy cảm được xử lý một cách có trách nhiệm, đồng thời duy trì hiệu suất cần thiết cho hoạt động theo thời gian thực.
Điều gì thúc đẩy kiến trúc đám mây lai của bạn, và làm thế nào nó hỗ trợ xử lý theo thời gian thực và học liên tục?
Lumana sử dụng một cách tiếp cận lai để kết hợp hiệu suất của các hệ thống trên cơ sở với sự linh hoạt của đám mây. Xử lý trên rìa cung cấp AI theo thời gian thực, lưu trữ và quản lý video tại địa phương theo mặc định. Điều này giảm nhu cầu băng thông và tăng cường quyền riêng tư, đồng thời vẫn cho phép hỗ trợ đám mây khi cần cho phối hợp rộng hơn hoặc học tập trên các triển khai.
Kiến trúc này mang lại cho người dùng khả năng phản hồi ngay lập tức đồng thời duy trì khả năng mở rộng và cải thiện thông qua thích nghi liên tục trên các trang web.
Làm thế nào khả năng tự học được thiết kế, và làm thế nào nó cải thiện theo thời gian trong các triển khai đa trang web?
Kiến trúc của khả năng tự học của chúng tôi được xây dựng xung quanh quy mô. Số trang web chúng tôi triển khai càng nhiều, thì quan điểm của chúng tôi càng rộng hơn trên toàn bộ cảnh quan của các thiết bị rìa. Mỗi môi trường mới đóng góp dữ liệu mới, mở rộng sự đa dạng của các kịch bản và cảnh mà hệ thống có thể học.
Phương pháp học liên tục của chúng tôi tận dụng kiến thức tập thể này. Khi hệ thống tinh chỉnh bản thân trên các triển khai, quá trình đào tạo trực tuyến trở nên đơn giản và hiệu quả hơn. Về mặt thực tế, triển khai càng rộng, thì sự thích nghi càng nhanh và chính xác, dẫn đến một hệ thống liên tục cải thiện theo thời gian trên tất cả các trang web.
Ai là đối thủ cạnh tranh hoặc cộng tác chính của bạn trong không gian này, và điều gì làm cho Lumana độc đáo?
Độc đáo thực sự của chúng tôi nằm ở con người. Đằng sau Lumana là một đội các kỹ sư và nhà đổi mới tài năng, bắt đầu từ nhóm AI của chúng tôi, được hỗ trợ bởi các chuyên gia đám mây, nhà thiết kế UX / UI và được tăng cường bởi hỗ trợ khách hàng và bán hàng. Trong khi AI tạo thành xương sống của công nghệ của chúng tôi, thì động cơ con người của chúng tôi là điều thúc đẩy thành công của chúng tôi. Sáng tạo, chuyên nghiệp và cống hiến của đội ngũ là những gì làm cho Lumana khác biệt, dù trong cạnh tranh hay hợp tác.
Lumana nhấn mạnh “Nghĩ lớn”, “Khách hàng đầu tiên”, “Một đội” và “Thành thạo nghề nghiệp”. Bạn vận hành những giá trị này như thế nào trong tuyển dụng, phát triển sản phẩm và cuộc sống hàng ngày?
Chúng tôi tuyển dụng những người đổi mới nghĩ lớn, giải quyết vấn đề, cộng tác và cam kết phát triển.
Các nhóm sản phẩm phát triển AI có thể mở rộng với tầm nhìn tham vọng, lặp lại thông qua phản hồi của khách hàng, thúc đẩy công việc cộng tác và phấn đấu để đạt được sự xuất sắc.
Hoạt động hàng ngày sử dụng các phương pháp linh hoạt để cho phép những ý tưởng táo bạo, ưu tiên nhu cầu của khách hàng, xây dựng sự đoàn kết của đội và hỗ trợ phát triển chuyên môn.
Các thực tiễn này thúc đẩy đổi mới, thành công của khách hàng và tác động trong an ninh video AI.
Nhìn về tương lai năm năm, bạn hình dung vai trò của Lumana sẽ phát triển như thế nào trong hệ sinh thái AI rộng lớn hơn – và tác động nào bạn hy vọng Physical AI sẽ có trên các ngành như an ninh, sản xuất hoặc thành phố thông minh vào thời điểm đó?
Nhìn về tương lai năm năm, chúng tôi thấy vai trò của Lumana sẽ phát triển như một nhà cung cấp chính của Physical AI thực tế trên các ngành. Trong khi việc giải mã các định luật cơ bản của vật lý vẫn còn là một điều bí ẩn khoa học, sự tập trung của chúng tôi ngày nay là vào giá trị của khách hàng, phát triển các công cụ cho phép các tổ chức theo dõi và phản ứng với thế giới xung quanh họ tốt hơn, trên mọi ứng dụng.
Chúng tôi đã duy trì các hợp tác lâu dài với các trung tâm y tế và đang khám phá việc mở rộng vào các nền tảng di chuyển như robot và giao thông. Theo thời gian, khi chúng tôi phát triển và mở rộng quy mô, chúng tôi cũng có ý định đầu tư vào các câu hỏi nghiên cứu cơ bản hơn: Liệu AI có thể khám phá ra các mẫu sâu hơn trong tự nhiên, hay thậm chí giúp chúng tôi xây dựng các lý thuyết mới về các định luật của vật lý? Liệu các khái niệm như chiều của thời gian có thể được làm sáng tỏ bởi các hệ thống học tập?
Ambition của chúng tôi là thúc đẩy tác động trên an ninh, sản xuất và thành phố thông minh, đồng thời duy trì tầm nhìn về chân trời rộng lớn hơn, đẩy ranh giới của những gì AI có thể giúp chúng tôi khám phá.
Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Lumana.












