Connect with us

Gil Elbaz, Đồng sáng lập & CTO của Datagen – Loạt phỏng vấn

Phỏng vấn

Gil Elbaz, Đồng sáng lập & CTO của Datagen – Loạt phỏng vấn

mm

Gil Elbaz là CTO và Đồng sáng lập của Datagen, có trụ sở tại Tel Aviv. Ông đã nhận bằng Cử nhân và Thạc sĩ từ Technion. Nghiên cứu luận văn của Gil tập trung vào tầm nhìn máy tính 3D và đã được xuất bản tại CVPR, hội nghị nghiên cứu tầm nhìn máy tính hàng đầu thế giới. Datagen là một công ty tiên phong trong lĩnh vực Dữ liệu mô phỏng, một tập con của dữ liệu tổng hợp, tập trung vào việc tái tạo lại thế giới xung quanh chúng ta một cách chân thực. Công ty này đã ra mắt từ chế độ ẩn với hơn 18 triệu đô la tiền vốn vào tháng 3 năm 2021 và hiện đang làm việc với một số công ty trong danh sách Fortune 100 trong lĩnh vực thực tế ảo, robot và ô tô, bao gồm cả большин của các gã khổng lồ công nghệ hàng đầu của Mỹ.

Điều gì ban đầu thu hút bạn đến lĩnh vực robot và học máy?

Những cuốn sách khoa học viễn tưởng, như loạt sách Foundation của Isaac Asimov và iRobot, luôn khiến tôi nghĩ về một tương lai trong đó robot là một phần không thể thiếu trong cuộc sống hàng ngày của chúng ta. Có rất nhiều nhiệm vụ nhàm chán, lặp đi lặp lại mà con người thực hiện; tôi biết rằng tôi không muốn làm những việc đó, và tôi không thể tưởng tượng bất kỳ ai khác muốn làm chúng. Xem xét robot là một tất yếu công nghệ, tôi nghĩ rằng đi theo hướng đó sẽ là một quyết định nghề nghiệp thông minh, “chống lại tương lai”.

Vì vậy, tôi ban đầu tiếp cận lĩnh vực này với trọng tâm vào các khía cạnh vật lý của chủ đề, và tôi đã nhận bằng cấp về Kỹ thuật Cơ khí từ Technion ở Haifa, Israel. Vào cuối bằng cấp của tôi, tôi bắt đầu深入 vào thế giới của các công cụ CAD và khả năng của chúng. Những công cụ này cho phép các kỹ sư cơ khí thiết kế cấu trúc và thiết bị cơ khí (bất cứ thứ gì từ một cây cầu đến một chiếc xe hơi). Tôi thấy một cơ hội lớn để tạo ra tác động lớn mà không phải đối mặt với các lần lặp lại chậm chạp của thế giới vật lý. Trong thực tế, những chương trình này có rất ít, nếu có, khả năng học máy / tầm nhìn máy tính tích hợp, giúp các kỹ sư tạo ra các hệ thống cơ khí đơn giản, rẻ hơn và ổn định hơn (đây là vào năm 2015). Tôi đã bắt đầu theo hướng Tầm nhìn máy tính trên dữ liệu 3D với học sâu (rất mới vào thời điểm đó) với mục tiêu tạo ra các chương trình CAD thông minh hơn. Làm việc trong những ngày đầu của học sâu hiện đại, cảm giác như được ở trong một phần của điều gì đó có thể thực sự lớn — tương tự như internet.

Trong thực tế, nghiên cứu của tôi là nghiên cứu đầu tiên mang cuộc cách mạng Học sâu đến khoa của tôi tại Technion. Điều này sau đó đã trở thành một bài báo được chấp nhận vào hội nghị Tầm nhìn máy tính hàng đầu thế giới, CVPR, và tôi đã bay đến Hawaii tại CVPR 2017. Trình bày bài báo của tôi và gặp gỡ những người thực sự mở mắt tôi về quy mô của cộng đồng tầm nhìn máy tính (ngày nay là ít nhất 10 lần lớn hơn), hàng nghìn người tham gia đều làm việc nghiên cứu trong lĩnh vực này với đam mê. Sự kiện đó gần như đã củng cố hướng đi của tôi, cho tôi thấy sức mạnh của tầm nhìn máy tính và tiềm năng chờ được mở khóa.

Có thể bạn chia sẻ câu chuyện về sự ra đời của Datagen?

Datagen được thành lập vào năm 2018 với sứ mệnh biến đổi cách các đội nhận được dữ liệu cho đào tạo mạng tầm nhìn máy tính. Năm trước, chúng tôi đã xem một bản demo của Oculus Rift, bao gồm một chiếc tai nghe thực tế ảo và một thiết bị điều khiển từ xa. Sau bản demo, chúng tôi tự hỏi, “với các máy ảnh tiên tiến được nhúng trong tai nghe, tại sao lại cần một thiết bị cầm tay để kết nối không gian ảo với không gian vật lý (tức là theo dõi chuyển động tay)?” Các mạng nơ-ron đã đủ tinh vi để xử lý nó, vậy vấn đề là gì?” Và đó là khi ý tưởng xuất hiện — Dữ liệu! Chúng tôi ngay lập tức thấy cơ hội lớn để giải quyết các thách thức về không gian 3D sử dụng tầm nhìn máy tính tiên tiến và siêu dữ liệu 3D. Thay vì tập trung chỉ vào VR / AR, chúng tôi đã tiếp cận một cách toàn diện hơn, tập trung vào vấn đề似乎 không thể giải quyết được về việc tạo ra đủ (và chính xác) dữ liệu đào tạo để cho phép các ứng dụng AI 3D trong thế giới thực.

Với trọng tâm vào con người và tương tác giữa con người với môi trường, Datagen là một công ty tiên phong trong lĩnh vực Dữ liệu mô phỏng, một tập con của dữ liệu tổng hợp, tập trung vào việc tái tạo lại thế giới xung quanh chúng ta một cách chân thực. Ngày nay, chúng tôi làm việc với các công ty sáng tạo nhất trên thế giới để thúc đẩy và tăng tốc phát triển tầm nhìn máy tính của họ và được hỗ trợ bởi một số nhà đầu tư được kính trọng nhất trong lĩnh vực này.

Đối với những người đọc chưa quen, bạn có thể giải thích cụ thể dữ liệu tổng hợp là gì?

Dữ liệu tổng hợp là bất kỳ dữ liệu đào tạo nào được tạo ra không phải thông qua đo lường trực tiếp hoặc quan sát thế giới thực — mà được tạo ra thông qua thuật toán hoặc mô phỏng. Trong bối cảnh tầm nhìn máy tính, dữ liệu tổng hợp là hình ảnh được tạo ra bằng máy tính với siêu dữ liệu cần thiết cho đào tạo trí tuệ nhân tạo. Với các vấn đề về quyền riêng tư và các hạn chế vật lý và kinh tế thực sự đối với dữ liệu hình ảnh thế giới thực, rất khó để đánh giá cao tầm quan trọng của dữ liệu tổng hợp đối với học máy và AI. Trong một báo cáo gần đây, Gartner dự đoán rằng, vào năm 2024, hầu hết dữ liệu được sử dụng trong lĩnh vực AI sẽ được tạo ra một cách nhân tạo vì những lý do này.

Có những lợi ích gì của dữ liệu tổng hợp so với thu thập dữ liệu thủ công?

Câu trả lời ngắn gọn là, hãy nghĩ về mọi khía cạnh của thu thập dữ liệu thủ công mà không mong muốn và loại bỏ chúng khỏi quá trình — những điều đó là lợi ích của dữ liệu tổng hợp.

Tạo ra các tập dữ liệu đa dạng với quy mô lớn cho đào tạo tầm nhìn máy tính là một quá trình tốn kém, mất thời gian, và sự đa dạng bị hạn chế bởi chính việc đặt con người vào các vị trí cụ thể và chụp ảnh họ là một quá trình phức tạp — phức tạp và tốn kém hơn nhiều so với việc thực hiện trong một môi trường mô phỏng. Một lợi ích lớn khác là loại bỏ hiệu quả nhu cầu về chú thích thủ công, điều này nhàm chán, mất thời gian và dễ bị lỗi của con người.

Datagen đề cập đến dữ liệu mô phỏng như một tập con của dữ liệu tổng hợp. Bạn có thể giải thích thêm về dữ liệu mô phỏng là gì?

Dữ liệu mô phỏng là dữ liệu tổng hợp được tạo ra thông qua mô phỏng. Chúng tôi sử dụng GAN (và một số phương pháp học máy tiên tiến khác) để tạo ra các đối tượng 3D và đặt chúng trong các mô phỏng 3D thực tế của thế giới thực. Điều đó trông như một quá trình “chụp ảnh ảo” từ góc nhìn thứ nhất, nhưng hoạt động trong một hệ thống thực tế, dựa trên vật lý. Những mô phỏng này tạo ra dữ liệu hình ảnh (như thể nó được thu thập trong thế giới thực), cùng với một loạt các chú thích (vật lý, ánh sáng, v.v.). Vì vậy, Dữ liệu mô phỏng là dữ liệu tổng hợp được tạo ra một cách chân thực, được tạo ra theo ngữ cảnh, hình ảnh 3D, thu thập trong một môi trường mô phỏng.

Làm thế nào Datagen tạo ra dữ liệu mô phỏng được tùy chỉnh?

Công nghệ của Datagen tạo ra dữ liệu mô phỏng không chỉ có thể mở rộng quy mô mà còn được tùy chỉnh để đáp ứng nhu cầu cụ thể của từng ứng dụng khách hàng. Chúng tôi làm điều này bằng cách xem xét mọi khía cạnh của mỗi dự án — từ hệ thống tầm nhìn máy tính được sử dụng đến thành phần dân số của khu vực mà nó sẽ hoạt động. Cho dù làm việc trực tiếp với khách hàng của chúng tôi hoặc chỉ cho phép kỹ sư của họ, quá trình của Datagen bắt đầu bằng việc thiết lập các tham số chính cho từng trường hợp sử dụng cụ thể, chẳng hạn như thông số kỹ thuật của ống kính, ánh sáng, môi trường, phân bố dân số, v.v. Datagen sử dụng GAN và các công cụ, kỹ thuật tiên tiến khác để tạo ra một loạt các tài sản, bao gồm mọi thứ từ đầu người với biểu cảm khuôn mặt động để đào tạo AI trong phân tích cảm xúc, đến nội thất xe hơi cho giám sát hành khách trong cabin, và môi trường gia đình cho các ứng dụng hội nghị video, chỉ để đặt tên một vài. Đối với mỗi loại tài sản, Datagen giới thiệu sự đa dạng trên hàng nghìn trục rời rạc (từ màu da và chiều cao của lông mày, đến kích thước, màu sắc và hình dạng của đồ đạc trong nhà), sử dụng các tham số được tinh chỉnh cẩn thận để phản ánh ứng dụng cụ thể.

Nhờ những khả năng này, các tập dữ liệu của Datagen không chỉ lớn và đa dạng, mà còn được tối ưu hóa cho mục đích đào tạo một hệ thống duy nhất để thực hiện một nhiệm vụ duy nhất (hoặc một tập hợp các nhiệm vụ) trong môi trường hoặc cài đặt duy nhất mà nó sẽ được sử dụng — tất cả đều không ảnh hưởng đến khả năng mở rộng quy mô. Chúng tôi cũng xem xét các yêu cầu về chú thích / siêu dữ liệu cụ thể của mỗi ứng dụng.

Có những ví dụ nào về các giải pháp trong lĩnh vực robot nơi dữ liệu tổng hợp và / hoặc mô phỏng được sử dụng?

Một trong những lợi thế lớn nhất của việc sử dụng dữ liệu mô phỏng trong robot là khả năng tạo ra hình ảnh của phần cứng vẫn đang được phát triển. Điều này cho phép bộ não của robot (AI) và cơ thể (phần cứng) được phát triển song song. Bây giờ, quá trình đào tạo có thể phát triển cùng với sự phát triển của thông số kỹ thuật, thay vì chờ cho đến khi sản phẩm cuối cùng được tạo mẫu hoàn chỉnh trước khi bạn có thể chụp ảnh và bắt đầu phát triển AI.

Ngoài ra, vì dữ liệu mô phỏng được tạo ra trong ngữ cảnh, bạn có thể dễ dàng tính đến sự tương tác giữa robot và môi trường của nó. Vì vậy, nếu bạn tưởng tượng một robot có thể nhặt và loại bỏ các sản phẩm bị lỗi khỏi dây chuyền lắp ráp, dữ liệu mô phỏng sẽ cho phép bạn không chỉ tạo ra dữ liệu cho mọi khiếm khuyết vật lý có thể tưởng tượng được trong sản phẩm, mà còn từ góc nhìn của robot để chụp toàn bộ phạm vi chuyển động của cánh tay robot, sự tương tác của nó với vật thể nó đang nhặt. Hơn nữa, siêu dữ liệu 3D có nghĩa là không cần phải chú thích từng hình ảnh một cách cẩn thận để đảm bảo robot có thể xác định đúng sản phẩm, các khiếm khuyết, cánh tay của nó, hoặc bất cứ thứ gì khác trong tầm nhìn của nó.

Có những ví dụ nào về các trường hợp sử dụng dữ liệu mô phỏng trong xe hơi thông minh?

Dữ liệu mô phỏng trong phát triển xe hơi thông minh làm cho việc tạo ra các tập dữ liệu cho các mẫu xe cụ thể khi chúng đang được thiết kế trở nên dễ dàng hơn nhiều, lặp lại cùng với sự phát triển của xe itself khi nó tiến qua các giai đoạn thiết kế và sản xuất. Với dữ liệu hình ảnh mô phỏng, các kỹ sư cũng có thể sử dụng tầm nhìn trong cabin một cách hiệu quả hơn để xác định các tài xế buồn ngủ hoặc mất tập trung, nếu một tài xế đã lấy tay ra khỏi bánh xe, hoặc bất kỳ trường hợp nào khác để đảm bảo an toàn cho tài xế. Nó cũng cho phép các kỹ sư tính đến sự đa dạng lớn hơn trong các tài xế và hành khách, và giới thiệu sự đa dạng dưới dạng góc hình ảnh và ánh sáng — tất cả đều không xâm phạm quyền riêng tư của những người thực sự.

Gần đây, Datagen đã công bố một số lượng lớn những thuê mới thú vị, điều này có nghĩa là gì cho tương lai của công ty?

Những bổ sung gần đây cho hội đồng tư vấn và lãnh đạo điều hành của chúng tôi bao gồm một số chuyên gia tài năng và thành tựu nhất trong lĩnh vực AI và Tầm nhìn máy tính. Kiến thức, tầm nhìn và kinh nghiệm của họ sẽ giúp định hướng và tăng tốc sự phát triển của Datagen khi chúng tôi điều hướng một ngành công nghiệp vẫn còn trẻ và đầy cơ hội. Trong một lĩnh vực có nhiều điều không chắc chắn, không có gì quý giá hơn kiến thức.

Có điều gì khác mà bạn muốn chia sẻ về Datagen?

Được đặt tại Tel Aviv, Datagen là một phần của một sự thay đổi kinh tế và văn hóa lớn đã diễn ra ở Israel, và chúng tôi tự hào là một phần của nó. Trong một khoảng thời gian ngắn, Israel (Tel Aviv đặc biệt), đã phát triển thành một trung tâm công nghệ toàn cầu lớn, với một hệ sinh thái khởi nghiệp sôi động và một cộng đồng đầu tư năng động. Mặc dù Israel thường được coi là một trung tâm công nghệ an ninh mạng, AI và công nghệ dữ liệu đã phát triển theo cấp số nhân trong những năm gần đây ở đây. Ngày nay, có hơn 680 công ty trí tuệ nhân tạo ở Israel, đã huy động được 4,5 tỷ đô la. Sự bùng nổ tăng trưởng này trong vài năm qua chủ yếu là do nồng độ cao của các kỹ sư và các trường đại học hàng đầu thế giới của Israel. Những cơ sở giáo dục này cung cấp quyền truy cập vào tài năng và sự phát triển công nghệ mới nhất trong lĩnh vực này. Trong hai tháng qua, Datagen đã thuê hơn 20 nhân viên và dự kiến sẽ tuyển thêm thành viên trong các bộ phận bán hàng và tiếp thị, phần mềm và DevOps, và sản phẩm.

Cảm ơn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Datagen.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.