Röportajlar
Gil Elbaz, Datagen’in Kurucu Ortağı ve CTO’su – Röportaj Serisi

Gil Elbaz, Datagen’in CTO’su ve kurucu ortağıdır ve Tel Aviv’de bulunmaktadır. Technion’dan B.Sc ve M.Sc derecelerini almıştır. Gil’in tez araştırması 3D Bilgisayarlı Görüntüleme üzerine odaklanmış ve dünyanın en büyük bilgisayar görüntüleme araştırma konferansı CVPR’de yayımlanmıştır. Datagen, sentetik verinin bir alt kümesi olan Simule Edilmiş Veri alanındaki yeni bir alanda öncüdür ve世界i etrafımızı foto-gerçekçi bir şekilde yeniden yaratmaya odaklanmaktadır. Şirket, Mart 2021’de 18 milyon doların üzerinde fon ile gizlilik perdesini aralandı ve şimdi artırılmış/virtual gerçeklik, robotik ve otomotiv gibi alanlarda Fortune 100 şirketleri ile birlikte çalışmaktadır.
Sizleri robotik ve makine öğrenimi alanlarına neler çekmiştir?
Isaac Asimov’un Vakıf Serisi ve iRobot gibi bilim kurgu kitapları, robotların günlük hayatımızın bir parçası olduğu bir gelecek hakkında düşünmeme neden oldu. İnsanların yaptığı birçok sıkıcı ve tekrarlı görev vardır; ben bunları yapmak istemem ve başkalarının da isteyeceğini düşünmüyorum. Robotik teknolojisinin kaçınılmaz bir gerçeklik olduğunu düşünerek, bu alana yönelmenin akıllıca bir karar olacağını düşündüm.
Bu nedenle, önce mekanik mühendisliği alanında odaklandım ve İsrail’deki Haifa’daki Technion’dan mekanik mühendisliği diploması aldım. Diplomamın sonuna doğru, CAD araçları ve yetenekleri hakkında derinlemesine araştırma yapmaya başladım. Bu araçlar, mekanik mühendislerine yapılar ve mekanik cihazlar (köprüden arabaya kadar her şey) tasarlamalarına olanak tanır. Büyük bir etkiye sahip olabileceğimi gördüm ve fiziksel dünyanın yavaş iterasyonları ile uğraşmak istemiyordum. Bu programlar, mühendislerin daha basit, ucuz ve daha稳 định mekanik sistemler oluşturmasına yardımcı olan çok az veya hiç makine öğrenimi/bilgisayarlı görüntüleme kabiliyetine sahip değildi (bu 2015 yılına aittir). Derin öğrenme ile 3D veri上的 bilgisayar görüntüleme alanına yöneldim ve daha akıllı CAD programları oluşturmayı amaçladım. Modern derin öğrenimin başlangıç günlerinde çalışmak, gerçekten büyük bir şeyin parçası olmak gibi hissettim – internet gibi.
Pratikte, benim araştırğim, Technion’daki fakültemize derin öğrenme devrimini getiren ilk araştırma oldu. Bu daha sonra CVPR’ye kabul edilen bir makaleye dönüştü ve 2017’de CVPR’de Hawaii’de sunma fırsatım oldu. Makalemi sunmak ve insanları tanımak, bilgisayar görüntüleme topluluğunun ölçeğini görmeme olanak tanıdı (bugün en az 10 kat daha büyük), binlerce katılımcı, alanındaki araştırmalar üzerinde çalışıyorlardı. Bu olay, yönelimimi belirledi ve bilgisayar görüntülemenin gücünü ve bekleyen potansiyeli gösterdi.
Datagen’in doğuş hikayesini paylaşabilir misiniz?
Datagen, 2018 yılında bilgisayar görüntüleme ağı eğitimleri için veri elde etme şeklini dönüştürme misyonuyla kuruldu. Bir önceki yıl, Oculus Rift’in demosunu gördük, bu bir VR başlığı ve bir el kumandası cihazından oluşuyordu. Demodan sonra, “başlıktaki gelişmiş kameralarla, sanal alanı fiziksel alana (yani el hareketini izleme) bağlamak için bir el cihazı neden gerekli?” diye merak ettik. Sinir ağları zaten bunu işleyebilecek kadar gelişmişti, vậy sorun neydi?” Ve işte o zaman fikir oluştu — Veri! Büyük bir fırsat gördük ve 3D uzaysal varlık sorunlarını gelişmiş bilgisayar görüntüleme ve 3D meta verileri kullanarak çözmeye yöneldik. Sadece VR/AR’ye odaklanmak yerine, daha kapsamlı bir yaklaşım benimseyerek, yeterli (ve doğru) eğitim verisi oluşturarak gerçek dünya 3D AI uygulamalarını mümkün kılan görünüşte çözülemez проблема’ya odaklandık.
İnsanlara ve insan-çevre etkileşimine odaklanan Datagen, sentetik verinin bir alt kümesi olan Simule Edilmiş Veri alanındaki yeni bir alanda öncüdür ve世界i etrafımızı foto-gerçekçi bir şekilde yeniden yaratmaya odaklanmaktadır. Bugün, bilgisayar görüntüleme gelişimini hızlandırmak ve desteklemek için dünyanın en yenilikçi şirketleri ile birlikte çalışıyoruz ve sektörün en saygın yatırımcıları tarafından destekleniyoruz.
Okurlar sentetik veri nedir bilmeyenler için açıklar mısınız?
Sentetik veri, doğrudan ölçümler veya gerçek dünya gözlemleri yerine algoritmik olarak veya simülasyon yoluyla üretilen herhangi bir eğitim verisidir. Bilgisayarlı görüntüleme bağlamında, sentetik veri, yapay zekaları eğitmek için gereken meta verileri ile birlikte bilgisayar tarafından üretilen görüntülerdir. Gizlilik sorunları ve gerçek dünya görüntü verilerine ilişkin fiziksel ve ekonomik sınırlamalar dikkate alındığında, sentetik verinin makine öğrenimi ve AI için önemi abartılmaz.最近 bir raporunda, Gartner, 2024 yılına kadar AI ve analitik projelerinin geliştirilmesinde kullanılan verilerin çoğunun bu nedenlerle sentetik olarak üretilacağını öngördü.
Sentetik verinin el ile veri toplama yöntemlerine göre bazı avantajları nelerdir?
Kısa cevap, el ile veri toplama sürecinin istenmeyen tüm yönlerini düşünün ve onları ortadan kaldırın — bunlar sentetik verinin avantajlarıdır.
Bilgisayarlı görüntüleme eğitimi için çeşitli veri setlerini oluşturmak pahalı ve zaman alıcı bir süreçtir ve çeşitlilik, insanların belirli konumlara yerleştirilmesi ve fotoğraflarının çekilmesi gibi fiziksel dünyanın sınırlamaları nedeniyle sınırlıdır — tüm bunlar simüle edilmiş bir ortamda yapılması daha kolay ve ucuzdur. Bir diğer önemli avantaj, el ile anotasyon ihtiyacını etkili bir şekilde ortadan kaldırmaktır, bu da zahmetli, zaman alıcı ve insan hatasına eğilimlidir.
Datagen, simule edilmiş veriyi sentetik verinin bir alt kümesi olarak tanımlar. Simule edilmiş veri nedir, açıklar mısınız?
Simule edilmiş veri, simülasyon yoluyla üretilen sentetik veridir. GAN’ler (ve bazı diğer öncü makine öğrenimi yöntemleri) kullanarak 3D nesneleri oluşturur ve bunları gerçek dünyanın çok gerçekçi 3D simülasyonlarına yerleştiririz. Bu, bir “sanal fotoğraf çekme” sürecini andırır, ancak foto-gerçekçi, fizik tabanlı bir sistem içinde çalışır. Bu simülasyonlar, gerçek dünya gibi görünen görsel verileri ve tam bir dizi anotasyonu (fizik, aydınlatma vb.) üretir. Böylece, Simule Edilmiş Veri, sentetik verinin bir alt kümesidir ve foto-gerçekçi, bağlamsal olarak üretilen, 3D görüntüleri simüle edilmiş bir ortamda toplar.
Datagen, müşteri özelinde simule edilmiş verileri nasıl oluşturur?
Datagen’in teknolojisi, her müşterinin benzersiz uygulamasının özel ihtiyaçlarını karşılayacak şekilde ölçeklenebilir ve müşteri özelinde simule edilmiş verileri oluşturur. Müşterilerimizle doğrudan çalışarak veya sadece mühendislerini etkinleştirmek için, Datagen süreci, lens özellikleri, aydınlatma, çevre, demografik dağılım gibi her proje için ana parametreleri belirlemekle başlar. Datagen, GAN’ler ve diğer öncü araçlar ve teknikler kullanarak, insan yüzleri ile dinamik yüz ifadeleri (duygusal analiz için AI’yi eğitmek amacıyla) ve araç iç mekanları (kabin içi yolcu izleme için) gibi bir dizi varlığı oluşturur. Her varlık türü için, Datagen, cilt tonu ve kaş yüksekliği gibi birçok ayrı eksen boyunca çeşitlilik getirir ve bu parametreler, eldeki özel uygulamaya göre ince ayarlanır.
Bu yetenekler sayesinde, Datagen’in veri setleri sadece büyük ve çeşitli değil, aynı zamanda benzersiz bir sistemi, benzersiz bir görevi (veya görev setini) benzersiz bir ortamda veya ayarında gerçekleştirmek için optimize edilmiştir — tüm bunlar ölçekleme kapasitesinden ödün vermeden. Ayrıca, her uygulamanın özel anotasyon/metadata gereksinimlerini dikkate alırız.
Robotikte sentetik ve/veya simule edilmiş verinin kullanıldığı bazı çözümler nelerdir?
Simule edilmiş verinin robotikte kullanıldığı en büyük avantajlardan biri, geliştirilme aşamasındaki donanım için görüntüler oluşturabilmesidir. Bu sayede, robotun beyni (AI) ve bedeni (donanım) birlikte geliştirilebilir. Şimdi, eğitim, ürünün spécifikasyonlarının gelişimi ile birlikte ilerleyebilir, nihai ürün tamamen prototip haline gelmeden önce fotoğraf çekme ve AI geliştirme aşamasına geçmek zorunda kalmazsınız.
Ayrıca, simule edilmiş veri bağlamsal olarak üretilir, bu nedenle robotun çevresiyle etkileşimini daha kolay bir şekilde hesaba katabilirsiniz. Örneğin, bir robotun montaj hattından hatalı ürünleri alma işlemini düşünün. Simule edilmiş veri, ürünün her fiziksel hatası için veri oluşturmanızı sağlar ve ayrıca robotun kolunun hareket aralığını, nesne ile etkileşimini ve görüş alanındaki her şeyi yakalayabilmenizi sağlar. 3D meta verileri sayesinde, robotun ürün, hatalar, kolu veya görüş alanındaki her şeyi doğru bir şekilde tanımlayabilmesi için görüntüleri zahmetli bir şekilde anotasyon yapmaya gerek kalmaz.
Akıllı araçlarda simule edilmiş verinin kullanımı için bazı örnekler nelerdir?
Akıllı araç geliştirme aşamasında simule edilmiş veri kullanımı, araç modelleri için veri setlerini tasarlanırken sonsuz bir kolaylık sağlar. Araçlar tasarlanırken, mühendisler, simule edilmiş görüntü verilerini kullanarak, sürücünün uykulu veya dikkati dağılmış olduğunu belirlemek, sürücünün direksiyondan elini çekip çekmediğini veya diğer kenar durumları için hesaplamalar yapabilirler. Ayrıca, sürücü ve yolcuların çeşitliliği, görüntü açısı ve aydınlatma gibi faktörleri de hesaba katarak daha gerçekçi senaryolar oluşturulabilir — tüm bunlar gerçek insanların mahremiyetini ihlal etmeden.
Datagen, yakın zamanda birçok heyecan verici yeni atamalar duyurdu, bu şirketin geleceği için ne anlama geliyor?
Yönetim kurulu ve üst düzey liderlik ekibindeki yeni üyeler, AI ve bilgisayar görüntüleme alanındaki en yetenekli ve başarılı profesyonellerden oluşuyor. Bilgileri, içgörülerı ve deneyimleri, Datagen’in büyümesini yönlendirmeye ve hızlandırmaya yardımcı olacak — endüstrinin hala genç ve opportunitylerle dolu olduğu bir dönemde. Bu kadar bilinmezlik içeren bir alanda, hiçbir şey bilgi kadar değerli değil.
Datagen hakkında paylaşmak istediğiniz başka bir şey var mı?
Tel Aviv’de bulunan Datagen, İsrail’de gerçekleşen daha büyük bir ekonomik ve kültürel değişimin parçasıdır ve bunun bir parçası olmaktan gurur duyuyoruz. Kısa bir süre içinde, İsrail (özellikle Tel Aviv), önemli bir küresel teknoloji merkezi haline geldi ve canlı bir startup ekosistemi ve enerjik bir yatırım topluluğu oluştu. İsrail, sıklıkla siber güvenlik merkezli bir teknoloji merkezi olarak görülse de, AI ve veri odaklı teknoloji son yıllarda burada hızlı bir büyüme gösterdi. Bugün, İsrail’de 680’den fazla yapay zeka şirketi bulunmakta ve bunlar toplu olarak 4.5 milyar doların üzerinde fon topladılar. Son birkaç yıl içinde yaşanan bu patlama, büyük ölçüde mühendislerin yoğunluğu ve İsrail’in dünya çapındaki üniversitelerine erişim nedeniyle gerçekleşti. Bu akademik kurumlar, yetenek ve yeni teknoloji gelişimi için erişim sağlıyor. Son iki ay içinde, Datagen 20’den fazla personel işe aldı ve satış, pazarlama, yazılım ve DevOps ve ürün bölümlerinde ek takım üyeleri işe almak planlıyor.
Harika bir röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular Datagen’i ziyaret etmelidir.












