์ธํฐ๋ทฐ
๊ธธ ์๋ฐ์ฆ, Datagen์ ๊ณต๋ ์ฐฝ๋ฆฝ์ ๋ฐ CTO – ์ธํฐ๋ทฐ ์๋ฆฌ์ฆ

길 엘바즈는 Datagen의 CTO이자 공동 창립자로, 텔 아비브에 기반을 두고 있습니다. 그는 테크니온에서 학사와 석사를 취득했습니다. 길의 논문 연구는 3D 컴퓨터 비전에 초점을 맞추었으며, 세계에서 가장顶级인 컴퓨터 비전 연구 컨퍼런스인 CVPR에 발표되었습니다. Datagen은 시뮬레이션 데이터의 새로운 분야에서 선구자로, 합성 데이터의 하위 집합으로서 우리 주변의 세계를 사진적으로 재현하는 데 중점을 두고 있습니다. 이 회사는 2021년 3월에 1,800만 달러 이상의 자금을 확보한 상태에서 스타트업을 시작했으며, 현재는 증강/가상 현실, 로봇공학, 자동차 분야에서 Fortune 100 기업들과 함께 작업하고 있으며, 미국의 주요 기술 기업 대부분과 협력하고 있습니다.
로봇공학과 기계 학습에 처음으로 관심을 갖게 된 것은 무엇입니까?
과학 소설 책들, 예를 들어 아이작 아시모프의 Foundation Series와 iRobot는 로봇이 우리 일상 생활의 일부가 되는 미래에 대해 생각하게 만들었습니다. 사람들은 하는 많은 단조로운, 반복적인 작업들이 있습니다. 저는 그것을 하고 싶지 않았으며, 다른 사람들도 하고 싶어하지 않겠다고 생각했습니다. 로봇공학은 기술적으로 불가피한 것이라고 생각했기 때문에, 그 방향으로 가는 것이 현명한, “미래를 위한” 경력 결정이라고 생각했습니다.
그래서 저는 처음에 물리적인 측면에 초점을 맞추고 테크니온에서 기계 공학 학위를 취득했습니다. 학위의 끝부분에서 저는 CAD 도구와 능력의 세계로 깊이 뛰어들기 시작했습니다. 이러한 도구들은 기계 공학자들이 구조와 기계 장치(다리에서 자동차까지)를 설계할 수 있게 해줍니다. 저는 큰 영향을 미칠 수 있는 엄청난 기회를 보았지만, 물리적인 세계의 느린 반복을 다루지 않았습니다. 실제로, 이러한 프로그램들은 기계 학습/컴퓨터 비전 능력이 거의 없거나 전혀 없었으며, 이는 기계 공학자들이 더 단순한, 더 저렴한, 더 안정적인 기계 시스템을 만들 수 있게 해줍니다(이것은 2015년입니다). 저는 3D 데이터에서 깊은 학습(당시에는 매우 새로운 분야)을 가진 컴퓨터 비전으로 방향을 틀었으며, 더智能한 CAD 프로그램을 만들기 위한 목표를 가지고 있었습니다. 초기의 현대적인 깊은 학습의 일원으로 일하는 것은 인터넷과 같은 것을经历하는 것과 비슷했습니다.
실제로, 제 연구는 테크니온의 우리 학부에서 딥 러닝 혁명을 처음으로 가져온 것이었습니다. 이것은 나중에 세계에서 가장顶级인 컴퓨터 비전 컨퍼런스인 CVPR에 제출된 논문으로 발전했으며, 저는 2017년 하와이에서 열린 CVPR에 참석했습니다. 제 논문을 발표하고 사람들을 만나면서 저의 방향을 더 잘 이해할 수 있었습니다. 컴퓨터 비전 커뮤니티의 규모(현재는 적어도 10배 크다)를 보면서, 저는 컴퓨터 비전의 힘과 잠재된 잠재력을 보았습니다.
Datagen의 기원 이야기를 공유해 줄 수 있습니까?
Datagen은 2018년에 컴퓨터 비전 네트워크 훈련을 위한 데이터를 얻는 방식을 변革하는 것을 목표로 설립되었습니다. 전년, 우리는 Oculus Rift의 데모를 보았으며, 이것은 VR 헤드셋과 손으로 잡는 원격 제어 장치로 구성되었습니다. 데모 후에, 우리는 “헤드셋에 내장된 고급 카메라로, 왜 원격 장치를 사용하여 가상 공간을 물리적인 공간에 연결해야 하는가?”라고 생각했습니다. 신경망은 이미 충분히 발전해 있었으므로, 문제는 무엇이었을까요? 그리고 그때에 불이 켜졌습니다 — 데이터! 우리는 3D 공간 존재 문제를 고급 컴퓨터 비전과 3D 메타데이터를 사용하여 해결하는巨大的 기회를 보았습니다. VR/AR에만 집중하는 대신, 우리는 더 포괄적인 접근 방식을 취하여, 실제 3D AI 애플리케이션을 가능하게 하는 충분한(또는 정확한) 훈련 데이터를 생성하는 문제에 집중했습니다.
인간과 인간-환경 상호작용에 초점을 맞춘 Datagen은 시뮬레이션 데이터의 새로운 분야에서 선구자로, 합성 데이터의 하위 집합으로서 우리 주변의 세계를 사진적으로 재현하는 데 중점을 두고 있습니다. 현재, 우리는 컴퓨터 비전 개발을 가속화하고 구동하는 세계에서 가장 혁신적인 기업들과 함께 작업하고 있으며, 이 분야에서 가장 존경받는 투자자들에 의해 지원되고 있습니다.
읽는 분들이 익숙하지 않은 경우 합성 데이터가 무엇인지 설명해 줄 수 있습니까?
합성 데이터는 실제 세계의 직접적인 측정 또는 관찰을 통해 수집되지 않고, 알고리즘적으로 또는 시뮬레이션을 통해 생성되는 모든 훈련 데이터입니다. 컴퓨터 비전의 경우, 합성 데이터는 인공 지능을 훈련하는 데 필요한 메타데이터와 함께 생성된 컴퓨터 이미지입니다. 개인 정보 보호 문제와 실제 세계 이미지 데이터의 물리적 및 경제적 제한으로 인해, 합성 데이터의 중요성을 과장할 수 없습니다. 최근의 보고서에 따르면, 2024년까지 AI 및 분석 프로젝트 개발에 사용되는 대부분의 데이터는 이러한 이유로 인공적으로 생성될 것입니다.
수동 데이터 수집과 비교하여 합성 데이터의 일부 이점은 무엇입니까?
간단한答案은, 수동 데이터 수집의 모든 바람직하지 않은 측면을 생각해 보고, 그것들을 프로세스에서 제거하세요 — 그것들이 합성 데이터의 이점입니다.
컴퓨터 비전 훈련을 위한 다양한 데이터 세트를 대규모로 생성하는 것은 비용이 많이 들고 시간이 걸리는 프로세스이며, 변이는 인간을 특정 위치에 두고 사진을 찍는 것의 복잡성으로 인해 제한됩니다 — 시뮬레이션 환경에서 하는 것보다 더 복잡하고 비용이 많이 듭니다. 또 다른 주요 이점은 수동 주석의 필요성을 효과적으로 제거하는 것입니다. 이는 단조롭고, 시간이 걸리고, 인간의 오류에 취약합니다.
Datagen은 시뮬레이션 데이터를 합성 데이터의 하위 집합으로 언급합니다. 시뮬레이션 데이터가 무엇인지 자세히 설명해 줄 수 있습니까?
시뮬레이션 데이터는 시뮬레이션을 통해 생성되는 합성 데이터입니다. 우리는 GAN(およびその他의尖端 기계 학습 방법)을 사용하여 3D 객체를 생성하고, 실제 세계의 매우 현실적인 3D 시뮬레이션 내에서 그것들을 배치합니다. 그것은 첫 번째 사람의 “가상 사진 촬영” 프로세스와 같습니다. 그러나, 사진-현실적인, 물리 기반 시스템 내에서 작동합니다. 이러한 시뮬레이션은 실제 세계에서 수집된 것과 같은 시각적 데이터(이미지)를 생성하며, 함께 전체 범위의 주석(물리학, 조명 등)을 생성합니다. 따라서, 시뮬레이션 데이터는 실제 세계에서 수집된 것과 같은, контекстуально 생성된, 3D 이미지이며, 시뮬레이션 환경에서 수집됩니다.
Datagen은 어떻게 맞춤형 시뮬레이션 데이터를 생성합니까?
Datagen의 기술은 대규모로 확장 가능하고, 각 고객의 고유한 애플리케이션의 요구 사항에 맞게 맞춤형으로 설계된 시뮬레이션 데이터를 생성합니다. 우리는 각 프로젝트의 모든 측면을 고려하여, 컴퓨터 비전 시스템, 지역의 인구 통계적 구성, 렌즈 사양, 조명, 환경 등을 고려합니다. Datagen의 프로세스는 각 사용 사례에 대한 주요 매개 변수를 설정하는 것에서 시작합니다. Datagen은 GAN 및 기타尖端 기계 학습 도구와 기술을 사용하여, 인공 지능을 감정 분석에 훈련시키는 데 사용되는 동적 표정의 인간의 머리부터, 차량 내부의 승객 모니터링, 비디오 회의 애플리케이션을 위한 가정 환경에 이르기까지, 다양한 자산을 생성합니다. 각 자산 유형에 대해, Datagen은 무수한 이산 축(피부 톤,眉毛 높이, 가구의 크기, 색상, 모양 등)에서 변이를 도입하여, 각 애플리케이션에 맞게 매개 변수를 세부적으로 조정합니다.
이러한 기능 덕분에, Datagen의 데이터 세트는 크고 다양하지만, 고유한 시스템을 훈련시키는 데 최적화되어 있으며, 고유한 작업(또는 작업 세트)을 수행하는 데 사용되는 고유한 환경이나 설정에서 작동할 수 있습니다 — 확장 능력을 손상시키지 않습니다. 우리는 또한 각 애플리케이션의 주석/메타데이터 요구 사항을 고려합니다.
로봇공학에서 시뮬레이션 데이터와/또는 합성 데이터를 사용하는 해결책의 예는 무엇입니까?
로봇공학에서 시뮬레이션 데이터를 사용하는 가장 큰 이점 중 하나는 아직 개발 중인 하드웨어의 이미지를 생성할 수 있다는 것입니다. 이렇게 하면, 로봇의 뇌(AI)와 몸(하드웨어)을 함께 개발할 수 있습니다. 이제, 훈련은 사양이 발전함에 따라 발전할 수 있습니다. 최종 제품이 완전히 프로토タイプ되기 전에 사진을 찍고 AI를 개발하기 시작할 수 있습니다.
또한, 시뮬레이션 데이터는 컨텍스트에서 생성되므로, 로봇과 그 환경 사이의 상호작용을 더 쉽게 고려할 수 있습니다. 예를 들어, 로봇이 조립 라인에서 결함이 있는 제품을 잡고 제거하는 로봇을 상상해 보십시오. 시뮬레이션 데이터를 사용하면, 물체를 잡는 로봇의 팔의 전체 동작 범위, 물체와의 상호작용을 포함하여, 모든 물리적인 결함에 대한 데이터를 생성할 수 있습니다. 3D 메타데이터는 로봇이 제품, 결함, 팔, 또는 시야 범위 내의 모든 것을 올바르게 식별할 수 있도록, 이미지마다 주석을 추가할 필요가 없습니다.
스마트 카에서 시뮬레이션 데이터를 사용하는 예는 무엇입니까?
스마트 카 개발에서 시뮬레이션 데이터는 자동차가 설계되는 동안 특정 자동차 모델에 대한 데이터 세트를 개발하는 것을 훨씬 더 쉽게 만듭니다. 자동차가 설계 및 생산의 다양한 단계를 통해 진행됨에 따라, 시뮬레이션 이미지 데이터를 사용하면, 엔지니어들은 더 효과적으로 운전자를 식별할 수 있습니다. 운전자가 졸고 있거나 주의가 산만한 경우, 운전자가 핸들을 놓은 경우, 또는 운전자의 안전을 고려한 다양한 엣지 케이스를 식별할 수 있습니다. 또한, 운전자와 승객의 다양성을 고려하여, 이미지 각도와 조명을 포함한 변이를 도입할 수 있습니다 — 실제 사람들의 개인 정보를 침해하지 않고.
최근에 Datagen은 많은 새로운 인재들을 영입했습니다. 이것은 회사 미래에 어떤 영향을 미칠까요?
최근에 추가된 고문과 최고 경영진에는 AI 및 컴퓨터 비전 분야에서 가장优秀하고, 가장 경험이 풍부한 전문가들이 포함되어 있습니다. 그들의 지식, 통찰력, 경험은 Datagen의 성장과 발전을 가속화하는 데 도움이 될 것입니다. 아직 молод고, 기회가 넘치는 산업에서, 가장 귀한 것은 지식입니다.
Datagen에 대해 더 공유하고 싶은 내용이 있습니까?
텔 아비브에 기반을 둔 Datagen은 이스라엘에서发生한 더 큰 경제적 및 문화적 변화를 일부로 합니다. 우리는 일부가 된 것을 자랑스럽게 생각합니다. 짧은 시간에, 이스라엘(특히 텔 아비브)은 주요 글로벌 기술 허브로 성장했으며, 번성하는 스타트업 생태계와 에너지 넘치는 투자 커뮤니티가 있습니다. 이스라엘이 종종 사이버 보안 중심의 기술 허브로 간주되는 반면, AI 및 데이터 중심 기술은 최근 몇 년 동안 이곳에서指数적으로 성장했습니다. 현재, 이스라엘에는 680개 이상의 인공 지능 회사들이 있으며, 총 4.5억 달러를 모금했습니다. 이러한 성장은 주로 이스라엘의 세계적으로 유명한 대학들에 의해 제공되는 인재와 최신 기술 개발에 대한 접근성에 기인합니다. 지난 2개월 동안, Datagen은 20명 이상의 직원을 채용했으며, 판매, 마케팅, 소프트웨어 및 DevOps, 제품 부서에서 추가 직원을 채용할 계획입니다.
멋진 인터뷰 감사합니다. 더 많은 정보를 원하는 독자는 Datagen을 방문해야 합니다.












