인터뷰

Synthesis AI CEO Yashar Behzadi – 인터뷰 시리즈

게재

2 년 전

2022년 ２월 7일

Yashar Behzadi 박사는 CEO이자 설립자입니다. 합성 AI. 그는 AI, 의료 기술 및 IoT 시장에서 혁신적인 비즈니스를 구축한 경험이 풍부한 기업가입니다. 그는 지난 14년 동안 실리콘 밸리에서 데이터 중심 기술 회사를 구축하고 확장했습니다. Yashar는 30개 이상의 특허 및 특허 출원 중이며 박사 학위를 보유하고 있습니다. 기능적 뇌 영상의 시공간 모델링에 중점을 둔 UCSD에서.

합성 AI 딥러닝과 CGI의 교차점에서 컴퓨터 비전 모델 개발의 새로운 패러다임을 창조하는 스타트업입니다. 이를 통해 고객은 기존의 인간 주석 기반 접근 방식에 비해 훨씬 짧은 시간과 비용으로 더 나은 모델을 개발할 수 있습니다.

처음에 어떻게 컴퓨터 과학과 AI에 참여하게 되었나요?

저는 박사 학위를 받았습니다. 2006년 UCSD에서 컴퓨터 비전과 뇌 영상 데이터의 공간적, 시간적 모델링에 중점을 두었습니다. 그 후 저는 실리콘밸리에서 향후 16년 동안 산업 전반에 걸쳐 센서, 데이터, 기계 학습이 교차하는 지점에서 일했습니다. 저는 몇 가지 놀라운 기술에 대해 작업할 수 있는 기회를 갖게 된 것을 매우 행운으로 생각하며, 신호 처리, 기계 학습 및 데이터 과학에 중점을 두고 30개 이상의 특허를 취득했거나 제출했습니다.

Synthesis AI의 기원 이야기를 나눌 수 있습니까?

2019년 Synthesis AI를 설립하기 전에 저는 선도적인 기술 기업을 위한 컴퓨터 비전 모델 개발에 중점을 둔 글로벌 AI 서비스 회사를 이끌었습니다. 회사 규모에 관계없이 레이블이 지정된 교육 데이터의 품질과 양이 극히 제한적이라는 사실을 알게 되었습니다. 회사가 지리적으로 확장하거나 고객 기반을 확장하거나 새 모델과 새 하드웨어를 개발함에 따라 모델이 적절하게 수행되도록 하려면 새로운 교육 데이터가 필요했습니다. 또한 컴퓨터 비전의 미래는 오늘날의 휴먼 인 더 루프(Human-in-the-Loop) 주석 패러다임으로는 성공하지 못할 것이라는 점도 분명해졌습니다. 자율성, 로봇 공학 및 AR/VR/메타버스 애플리케이션의 새로운 컴퓨터 비전 애플리케이션에는 인간이 라벨을 지정할 수 없는 풍부한 3D 라벨 세트, 깊이 정보, 재료 속성, 세부 세분화 등이 필요합니다. 이러한 새 모델을 교육하는 데 필요한 풍부한 레이블 세트를 제공하려면 새로운 패러다임이 필요했습니다. 기술적 동인 외에도 모델 편향 및 소비자 프라이버시와 관련된 윤리적 문제에 대한 소비자 및 규제 조사가 증가하는 것을 보았습니다.

컴퓨터 비전 패러다임을 바꾸고자 Synesis AI를 설립했습니다. 회사의 합성 데이터 생성 플랫폼을 사용하면 확장된 픽셀 단위의 3D 라벨 세트를 통해 사진처럼 사실적인 이미지 데이터를 주문형으로 생성할 수 있습니다. 우리의 임무는 보다 유능한 모델의 윤리적 개발을 가능하게 하는 합성 데이터 기술을 개척하는 것입니다.

이 용어에 익숙하지 않은 독자를 위해 합성 데이터가 무엇인지 정의할 수 있습니까?

합성 데이터는 실제 데이터의 대안으로 사용되는 컴퓨터 생성 데이터입니다. 합성 데이터는 실제 세계에서 수집되거나 측정되는 것이 아니라 시뮬레이션된 디지털 세계에서 생성됩니다. 시각 효과 및 CGI 세계의 도구를 생성 AI 모델과 결합한 Synthesis AI를 통해 회사는 컴퓨터 비전 모델을 교육하기 위해 방대한 양의 사실적이고 다양한 온디맨드 데이터를 생성할 수 있습니다. 회사의 데이터 생성 플랫폼은 개인 정보를 보호하면서 고품질 이미지 데이터를 얻기 위한 비용과 속도를 대폭 줄였습니다.

합성 데이터가 생성되는 방식에 대해 논의할 수 있습니까?

합성 데이터 세트는 실제 데이터가 아닌 인위적으로 생성됩니다. 시각 효과 산업의 기술은 생성 신경망과 결합되어 방대하고 다양하며 사실적인 라벨 이미지 데이터를 생성합니다. 합성 데이터를 사용하면 현재 접근 방식보다 훨씬 적은 비용과 시간으로 교육 데이터를 만들 수 있습니다.

합성 데이터를 활용하여 어떻게 경쟁 우위를 창출합니까?

현재 대부분의 AI 시스템은 인간이 이미지에 속성을 부여한 키에 레이블을 지정한 다음 AI 알고리즘을 훈련시켜 이미지를 해석하는 '감독 학습'을 활용합니다. 이는 리소스와 시간이 많이 소요되는 프로세스이며 사람이 정확하게 레이블을 지정할 수 있는 범위에 따라 제한됩니다. 또한 AI 인구통계학적 편향과 소비자 프라이버시에 대한 우려가 증폭되어 대표적인 인간 데이터를 얻는 것이 점점 더 어려워지고 있습니다.

우리의 접근 방식은 복잡한 이미지 데이터를 합성하는 사실적인 디지털 세계를 만드는 것입니다. 우리는 데이터를 생성하기 때문에 개체의 3D 위치 및 서로 간의 복잡한 상호 작용 및 환경에 대해 이전에는 사용할 수 없었던 정보를 포함하여 장면에 대한 모든 것을 알고 있습니다. 현재 접근 방식을 사용하여 이 양의 데이터를 수집하고 레이블을 지정하려면 몇 년은 아니더라도 몇 달이 걸릴 것입니다. 이 새로운 패러다임은 효율성과 비용 면에서 100배 개선을 가능하게 하고 더 많은 기능을 갖춘 새로운 등급의 모델을 주도할 것입니다.

합성 데이터는 인위적으로 생성되기 때문에 전통적으로 실제 세계에서 데이터 세트를 수집할 때 많은 편견과 개인 정보 보호 문제가 제거됩니다.

온디맨드 데이터 생성은 어떻게 가속화된 확장을 가능하게 합니까?

모델 학습을 위해 실제 데이터를 캡처하고 준비하는 것은 길고 지루한 프로세스입니다. 필요한 하드웨어를 배포하는 것은 자율 주행 차량, 로봇 공학 또는 위성 이미지와 같은 복잡한 컴퓨터 비전 시스템에 엄청나게 많은 비용이 들 수 있습니다. 데이터가 캡처되면 사람이 필수 기능에 레이블을 지정하고 주석을 답니다. 이 프로세스는 오류가 발생하기 쉬우며 인간은 많은 애플리케이션에 필요한 3D 위치와 같은 주요 정보에 레이블을 지정하는 능력이 제한됩니다.

합성 데이터는 기존의 사람이 주석을 단 실제 데이터 접근 방식보다 훨씬 빠르고 저렴하며 산업 전반에 걸쳐 새롭고 더 유능한 모델의 배포를 가속화하게 될 것입니다.

합성 데이터는 어떻게 AI 편향을 줄이거나 예방할 수 있습니까?

AI 시스템은 편재하지만 사람들에게 영향을 미칠 수 있는 고유한 편견을 포함할 수 있습니다. 데이터 세트는 특정 데이터 클래스와 과도하게 또는 과소 대표되는 사람들 그룹과 균형이 맞지 않을 수 있습니다. 인간 중심 시스템 구축은 종종 성별, 민족 및 연령 편견으로 이어질 수 있습니다. 대조적으로 디자인 생성 훈련 데이터는 적절하게 균형을 이루고 인간의 편견이 없습니다.

합성 데이터는 AI의 편향 문제를 해결하는 강력한 솔루션이 될 수 있습니다. 합성 데이터는 실제 사건이나 현상에서 측정되거나 추출되지 않고 부분적으로 또는 완전히 인위적으로 생성됩니다. 데이터 세트가 다양하지 않거나 충분히 크지 않은 경우 AI 생성 데이터가 구멍을 채우고 편향되지 않은 데이터 세트를 형성할 수 있습니다. 가장 좋은 부분? 이러한 데이터 세트를 수동으로 생성하려면 팀에서 완료하는 데 몇 개월 또는 몇 년이 걸릴 수 있습니다. 합성 데이터로 설계하면 하룻밤 사이에 완료할 수 있습니다.

컴퓨터 비전 외에 합성 데이터에 대한 미래의 다른 잠재적 사용 사례는 무엇입니까?

소비자 제품, 자율성, 로봇 공학, AR/VR/메타버스 등과 관련된 다양한 컴퓨터 비전 사용 사례 외에도 합성 데이터는 다른 데이터 형식에도 영향을 미칠 것입니다. 우리는 이미 기업들이 구조화된 표 데이터, 음성 및 자연어 처리를 위해 합성 데이터 접근 방식을 활용하는 것을 보고 있습니다. 기본 기술과 생성 파이프라인은 각 양식별로 다르며, 가까운 미래에는 다중 모드 시스템(예: 비디오 + 음성)이 나타날 것으로 예상됩니다.

Synthesis AI에 대해 공유하고 싶은 다른 사항이 있습니까?

작년 말, 우리는 출시 휴먼API, Synthesis AI의 합성 데이터 기능을 크게 확장하여 수백만 명의 고유한 고품질 3D 디지털 인간을 프로그래밍 방식으로 생성할 수 있습니다. 이 발표는 선도적인 스마트폰, 원격 회의, 자동차 및 기술 회사에 10만 개 이상의 레이블이 지정된 얼굴 이미지를 제공한 FaceAPI 합성 데이터 서비스 제품 출시 후 몇 달 만에 나온 것입니다. HumanAPI는 고급 컴퓨터 비전 인공 지능(AI) 애플리케이션을 지원하기 위한 회사 여정의 다음 단계입니다.

HumanAPI는 또한 스마트 AI 도우미, 가상 피트니스 코치, 물론 메타버스 애플리케이션의 세계를 포함하여 고객을 위한 무수히 많은 새로운 기회를 제공합니다.

현실 세계의 디지털 더블을 생성함으로써 메타버스는 재구상된 소셜 네트워크, 엔터테인먼트 경험, 원격 회의, 게임 등에 이르는 새로운 애플리케이션을 가능하게 할 것입니다. 컴퓨터 비전 AI는 디지털 영역에서 실제 세계를 고화질로 캡처하고 재현하는 방법의 기본이 될 것입니다. 사실적이고 표현력이 풍부하며 행동적으로 정확한 인간은 미래의 컴퓨터 비전 응용 프로그램의 필수 구성 요소가 될 것입니다. HumanAPI는 자세 추정, 감정 인식, 활동 및 행동 특성화, 안면 재구성 등을 포함하여 보다 유능한 AI 모델을 구축하기 위해 주문형으로 완벽하게 레이블이 지정된 방대한 양의 전신 데이터를 생성할 수 있는 최초의 제품입니다.

훌륭한 인터뷰 감사합니다. 자세한 내용을 알고 싶은 독자는 방문하세요. 합성 AI.

Unite.AI

Synthesis AI CEO Yashar Behzadi – 인터뷰 시리즈

인터뷰

Synthesis AI CEO Yashar Behzadi – 인터뷰 시리즈

차례

최근 게시물

Unite.AI

Synthesis AI CEO Yashar Behzadi – 인터뷰 시리즈

차례

너는 좋아할지도 모른다.

최근 게시물