Connect with us

Yubei Chen, Aizip Inc의 공동 설립자 – 인터뷰 시리즈

인터뷰

Yubei Chen, Aizip Inc의 공동 설립자 – 인터뷰 시리즈

mm

Yubei Chen은 Aizip inc.의 공동 설립자로, 세계에서 가장 작은 그리고 효율적인 AI 모델을 개발하는 회사입니다. 그는 또한 University of California, Davis의 ECE 부서에서 조교수로 재직하고 있습니다. Chen의 연구는 계산 신경 과학과 깊은 비감독 학습(self-supervised learning)의 교차점에 있으며, 우리의 뇌와 기계에서 비감독 표현 학습을 지배하는 계산 원리의 이해를 강화하고, 자연 신호 통계에 대한 우리의 통찰력을 재정의합니다.

UC Davis에 합류하기 전에, Chen은 NYU Center for Data Science (CDS)와 Meta Fundamental AI Research (FAIR)에서 Yann LeCun 교수와 함께 포스닥 연구를 수행했습니다. 그는 UC Berkeley의 Redwood Center for Theoretical Neuroscience와 Berkeley AI Research (BAIR)에서 Bruno Olshausen 교수의 지도 아래 박사 학위를 취득했습니다.

Aizip은 에지 디바이스를 위한 초효율적인 AI 솔루션을 개발하며, 비전, 오디오, 시계열, 언어, 센서 퓨전 애플리케이션을 위한 컴팩트 모델을 제공합니다. 其의 제품은 얼굴 및 객체 인식, 키워드 스팟팅, ECG/EEG 분석, 온디바이스 채트봇 등을 가능하게 하며, 모두 TinyML에 의해 구동됩니다. Aizip의 AI 나노 팩토리 플랫폼, Aizipline을 통해, 회사에서는 기초 및 생성 모델을 사용하여 모델 개발을 가속화하고, 완전한 AI 설계 자동화를 추진합니다. Aizip의 Gizmo 시리즈의 작은 언어 모델(300M–2B 파라미터)은 다양한 디바이스를 지원하며, 에지에 지능형 능력을 제공합니다.

당신은 NYU와 Meta FAIR에서 Yann LeCun과 함께 포스닥 연구를 수행했습니다. 그는 당신과 당신의 연구가 UC Berkeley에서 실제 세계의 AI 솔루션을 구축하는 접근 방식에 어떻게 영향을 미쳤는지 설명해 주세요.

버클리에서,私の 연구는 과학적 탐구와 수학적 엄밀성에 깊이 뿌리박혀 있었습니다.私の 박사 연구는 전기 공학, 컴퓨터 과학, 계산 신경 과학을 결합하여, “백색 박스” 관점에서 AI 시스템을 이해하거나, 데이터와 학습 모델의 기본 구조를 드러내는 방법을 개발하는 데 중점을 두었습니다.私は 해석 가능한, 고성능 AI 모델과 시각화 기법을 구축하여 블랙박스 AI 시스템을 열어 보았습니다.

Meta FAIR에서, 초점은 대규모에서 최첨단 성능을 달성하기 위한 AI 시스템의 엔지니어링에 맞추어졌습니다. 세계급 컴퓨팅 리소스에 접근할 수 있게 된 나는, 자기 지도 학습의 한계를 탐구하고, 현재 “세계 모델”이라고 불리는 것에 기여했습니다. — 데이터에서 학습하고 가능한 환경을 상상하는 AI 시스템. 버클리에서 과학적 이해와 메타에서 엔지니어링 주도적인 확장에 대한 이중 경험은 실제 애플리케이션을 개발할 때 이론적 통찰력과 실제 구현의 중요성을 강조했습니다.

당신의 연구는 계산 신경 과학과 AI를 결합합니다. 신경 과학의 통찰력이 어떻게 AI 모델을 개발하는 방식에 영향을 미치는지 설명해 주세요.

계산 신경 과학에서, 우리는 뇌가 정보를 처리하는 방식을 다양한 자극에 대한 뇌의 반응을 측정함으로써 연구합니다. 초기에는, 나는 단어 임베딩을 분석하기 위한 시각화 기법을 개발했습니다. — 단어를 “사과”와 같은 구성 요소로 분해하는 것, 예를 들어 “과일”과 “기술”과 같은 의미 요소로. 나중에, 이러한 접근 방식은 트랜스포머와 같은 더 복잡한 AI 모델로 확장되어, 그들이 지식을 처리하고 저장하는 방식을 드러내는 데 도움이 되었습니다.

이러한 방법은 실제로 신경 과학에서 사용되는 기술, 즉 뇌 활동을 연구하기 위한 전극이나 fMRI와 같은 기술을 사용하는 것과 평행합니다. AI 모델의 내부 표현을 조사하는 것은 그들의 추론 전략과 새로운 특성, 예를 들어 특정 아이디어(예: 골든 게이트 브리지 기능)에 활성화하는 개념 뉴런을 감지하는 것을 가능하게 합니다. 이러한 연구 방향은 산업에서 널리 채택되어 해석 가능성과 실제 개입을 가능하게 하여, 모델에서 편향을 제거합니다. 따라서 신경 과학에서 영감을 받은 접근 방식은 AI를 더 설명 가능하고 신뢰할 수 있으며 효율적으로 만듭니다.

당신은 Aizip을 공동 설립하기 위해 어떤 영감을 받았나요? 개념에서 회사 출시까지의 여정을 공유해 주세요.

기본적인 AI 연구자로서,私の 많은 연구는 이론적이었습니다. 그러나 나는 연구와 실제 애플리케이션 간의 간격을 메우고 싶었습니다. 나는 에지 디바이스를 위한 최첨단 AI 혁신을 실제 사용으로 가져오기 위해 Aizip을 공동 설립했습니다. 대형 기초 모델을 구축하는 대신, 우리는 세계에서 가장 작은 그리고 효율적인 AI 모델을 개발하는 데 중점을 두었습니다.

여정은 기본적으로 한 가지 핵심 관찰에서 시작되었습니다. AI의 발전은 급속히 확대되고 있었지만, 실제 애플리케이션은 종종 경량화되고 효율적인 모델을 필요로 합니다. 우리는 새로운 방향을 개척할 기회를 보았습니다. 즉, 과학적 엄밀성과 실제 배포를 균형 있게 하는 방향입니다. 자기 지도 학습과 컴팩트 모델 아키텍처의 통찰력을 활용하여, Aizip은 에지에서 효율적으로 작동하는 AI 솔루션을 제공할 수 있었습니다. 이는 임베디드 시스템, IoT, 및 기타 분야에서 새로운 가능성을 열어주었습니다.

Aizip은 에지 디바이스를 위한 작은 AI 모델에 중점을 두고 있습니다. 시장에서 어떤 간격을 채우기 위해 이러한 초점을 두게 되셨나요?

AI 산업은 주로 모델을 확대하는 데 중점을 두었습니다. 그러나 실제 애플리케이션은 종종 반대의 것을 요구합니다. 즉, 높은 효율성, 낮은 전력 소비, 최소한의 지연이 필요합니다. 현재 많은 AI 모델은 임베디드 디바이스에 배포하기에는 계산적으로 너무 비용이 많이 듭니다. 우리는 시장에서 AI 솔루션이 강한 성능을 발휘하면서 극단적인 자원 제약 내에서 작동할 수 있는 간격을 보았습니다.

우리는 모든 AI 애플리케이션에 대형 모델이 필요하지 않으며, 모든 것을 대형 모델에 의존하는 것은 확장 가능하지도 않다는 것을 인식했습니다. 대신, 우리는 알고리즘을 최대한의 효율성을 달성하면서 정확도를 유지하는 데 중점을 두었습니다. 에지 애플리케이션을 위한 AI 모델을 설계함으로써 — 스마트 센서, 웨어러블, 산업 자동화 — 우리는 AI를 전통적인 모델이 비실용적인 곳에서 작동할 수 있도록启用했습니다. 우리의 접근 방식은 AI를 더 접근 가능하고, 확장 가능하며, 에너지 효율적으로 만듭니다. 이는 에지以外의 AI 주도적인 혁신을 위한 새로운 가능성을 열어줍니다.

Aizip은 Small Language Models (SLMs)의 개발에서 앞서고 있습니다. SLMs와 더 큰 모델들, 예를 들어 GPT-4와의 경쟁 또는 보완 관계를 어떻게 보시나요?

SLMs와 더 큰 모델들은 직접적인 경쟁 관계에 있지 않습니다. 더 큰 모델은 일반화와 깊은 추론에서 강력하지만, 상당한 계산 리소스를 필요로 합니다. SLMs는 효율성과 에지 디바이스上的 배포를 위해 설계되었습니다.它们는 클라우드 기반 모델이 복잡한 쿼리를 처리하는 동안 에지에서 실시간, 지역화된 지능을 제공함으로써 보완합니다. AI 채택이 증가함에 따라, 우리는 하이브리드 접근 방식이 등장하는 것을 볼 수 있습니다. 즉, 대형 클라우드 기반 모델이 복잡한 쿼리를 처리하는 동안, SLMs는 에지에서 실시간 지능을 제공합니다.

에지 디바이스를 위한 AI 모델을 효율적으로 만드는 데 가장 큰 기술적인 도전은 무엇인가요?

기본적인 도전은 AI 모델이 어떻게 작동하는지에 대한 완전한 이론적 이해의 부족입니다. 명확한 이론적 기초가 없으면, 최적화 노력은 종종 경험적이며, 효율성 향상은 제한적입니다. 또한, 인간의 학습은 다양한 방식으로 발생하지만, 현재의 기계 학습 패러다임은 이를 완전히 포착하지 못합니다. 이는 인간의 효율성을 모방하는 모델을 설계하기 어렵게 만듭니다.

엔지니어링 관점에서, AI를 극단적인 제약 내에서 작동하게 만드는 것은 모델 압축, 양자화, 아키텍처 설계 등에서 혁신적인 솔루션이 필요합니다. 또 다른 도전은 다양한 디바이스와 환경에서 작동하면서도 강건성을 유지하는 AI 모델을 생성하는 것입니다. AI가 물리적 세계와 상호 작용하는 IoT 및 센서를 통해 점점 더 많이 상호 작용함에 따라, 음성, 제스처, 기타 비전통적인 입력과 같은 자연스럽고 효율적인 인터페이스의 필요성이 중요해집니다. 에지의 AI는 디지털 세계와의 상호 작용을 무결하게 재정의하는 것입니다.

Softbank와 같은 회사와의 Aizip의 협력을 통해 어떤 세부 사항을 공유할 수 있나요?

우리는 최근 SoftBank와 함께 수족관 프로젝트를 수행했으며, CES Innovation Award를 수상했습니다. 우리는 어류 카운팅 애플리케이션을 위한 에지 기반의 효율적인 AI 모델을 개발했습니다. 이는 수족관 운영자가 어류 농장에서 사용할 수 있습니다. 이 솔루션은 어류 양식에서 지속 가능성, 식품 폐기, 수익성 문제를 만들 수 있는 중요한 도전을 해결합니다. 산업은 클라우드 기반 AI 솔루션이 해양에서 불안정한 전력과 연결로 인해 비실용적이기 때문에 AI를 솔루션으로 채택하기가 느렸습니다.

해결책을 찾기 위해, 우리는 온디바이스 솔루션을 개발했습니다. 우리는 SoftBank의 컴퓨터 그래픽 시뮬레이션을 훈련 데이터로 사용하고, 우리의 컴팩트 AI 모델을 결합하여, 매우 정확한 시스템을 만들었습니다. 이는 스마트폰에서 작동합니다. 수중 필드 테스트에서, 95%의 인식률을 달성하여, 어류 카운팅 정확도를 크게 개선했습니다. 이는 농가에서 저장 조건을 최적화하고, 어류를 생으로 운송해야 하는지 또는 동결해야 하는지 결정하며, 어류의 건강 문제를 감지하는 데 도움이 됩니다.

이 돌파구는 효율성을 개선하고, 비용을 절감하며, 수동 노동의 의존도를 줄입니다. 더 넓게 보면, 실제 문제에 대한 실제적인 영향을 미치는 AI의 능력을 보여줍니다.

Aizip은 “AI 나노 팩토리”라는 개념을 도입했습니다. 이것이 무엇이며, AI 모델 개발을 어떻게 자동화하는지 설명해 주세요.

AI 나노 팩토리는 우리의 내부 AI 설계 자동화 파이프라인으로, 반도체 제조의 전자 설계 자동화(EDA)에서 영감을 받았습니다. 새로운 기술 분야의 초기 개발에는 수동 노력이 많이 필요하지만, 자동화는 진행을 가속화하고, 솔루션을 확장하는 데 핵심입니다.

우리는 다른 산업을 가속화하는 AI를 사용하는 대신, AI가 자체 개발을 가속화할 수 있는지 물었습니다. AI 나노 팩토리는 데이터 처리에서 모델 선택, 훈련, 양자화, 배포, 디버깅까지 AI 모델 개발의 모든 단계를 자동화합니다. AI를 사용하여 AI를 최적화함으로써, 우리는 새로운 모델 개발 시간을 평균 10배로 줄일 수 있었습니다. 어떤 경우에는 1,000배 이상으로 줄일 수 있었습니다. 즉, 이전에는 1년 이상 걸렸던 모델이 이제 몇 시간 만에 생성될 수 있습니다.

또 다른 이점은 bahwa 자동화는 또한 AI 솔루션이 다양한 애플리케이션에서 경제적으로 실현 가능하도록 보장합니다. 이는 실제 세계의 AI 배포를 더 접근 가능하고 확장 가능하게 만듭니다.

5년 내에 에지 AI의 역할이 어떻게 진화할 것으로 보시나요?

에지 AI는 스마트폰이 인터넷 접근을 혁신한 것과 마찬가지로 기술과의 상호 작용을 변革할 것입니다. 현재 대부분의 AI 애플리케이션은 클라우드 기반입니다. 그러나 에지에서 센서와 디바이스가 물리적 세계와 상호 작용하는 방향으로 이동하고 있습니다. 이는 에지에서 실시간 처리의 필요성을 강조합니다.

5년 내에, 에지 AI는 더 자연스러운 인간-컴퓨터 상호 작용을 가능하게 할 것입니다. 예를 들어, 음성 및 제스처 인식과 같은 인터페이스를 통해, 전통적인 장벽인 키보드와 터치스크린의 의존도를 제거할 것입니다. AI는 스마트 홈이나 산업 자동화와 같은 일상 환경에 더 많이 내장되어, 최소한의 지연으로 실시간 의사 결정을 가능하게 할 것입니다.

또 다른 주요 트렌드는 에지 AI 시스템의 점점 더 많은 자율성이 될 것입니다. AI 모델은 더 자체 최적화 및 적응 가능하여, 배포 및 유지 보수에서 인간의 개입을 줄일 수 있을 것입니다. 이는 의료, 자동차, 농업 등 다양한 산업에서 새로운 기회를 열어줄 것입니다.

Aizip에서 가장 흥미로운 AI 기반 디바이스 중 어떤 것이 있나요?

우리는 새로운 산업에서 모델의 사용 사례를 확장하는 것을 위해 노력하고 있으며, 특히 우리가 가장 흥미로운 것은 자동차 부문입니다. 중국의 자동차 제조업체를 중심으로, ChatGPT와 같은 언어 모델을 내장한 음성 어시스턴트를 개발하고 있습니다. 그러나 현재의 어시스턴트는 클라우드에 의존하는 경우가 많으며, 특히 유연한 대화에서 vậy입니다. 기본적인 명령 및 제어 작업(예: “에어컨을 켜라” 또는 “트렁크를 열라”)만이 일반적으로 차량에서 로컬로 실행됩니다.

우리는 차량용 “공동 조종사”로 작동하는, 초효율적인 SLM 기반 AI 에이전트인 Gizmo 시리즈를 개발했습니다. Gizmo는 의도를 더 세부적으로 이해하도록 훈련되며, 차량의 AI 에이전트로 작동할 때, 대화형 언어를 통해 명령을 실행할 수 있습니다. 예를 들어, 운전자가 “추워”라고 말하면, 에이전트는 카빈의 온도를 조절할 수 있습니다.또는 “내일 보스턴으로 운전할 거야, 무엇을 입어야 할까?”라는 프롬프트에 대한 반응으로, 날씨를 확인하고 제안을 할 수 있습니다.

이러한 에이전트는 클라우드에 의존하지 않고 로컬에서 작동하므로, 사각지대 또는 연결이 불안정한 지역(예: 터널, 산, 시골 도로)에서도 작동합니다. 또한 운전手を 도로에서 눈을 떼지 않고 음성 기반 제어를 제공함으로써 안전성을 향상시킵니다. 그리고, 별도로, 우리는 차량 및 블루투스 스피커를 위한 AI 기반 카라오케 모델을 생산에 넣고 있습니다. 이는 입력 오디오에서 인간의 목소리를 제거하여, 실시간으로 노래의 카라오케 버전을 만들 수 있습니다. 따라서 고객이 차량 내의 컨트롤을 더 안전하게 관리하는 데 도움을 주는 것 외에도, 우리는 경험을 더 즐겁게 만드는 방법을 찾고 있습니다.

이러한 종류의 솔루션, 즉 일상 생활에서 의미 있는 차이를 만드는 솔루션, 우리가 가장 자랑스러운 것입니다.

Aizip은 에지 디바이스를 위한 초효율적인 AI 솔루션을 개발하며, 비전, 오디오, 시계열, 언어, 센서 퓨전 애플리케이션을 위한 컴팩트 모델을 제공합니다. 其의 제품은 얼굴 및 객체 인식, 키워드 스팟팅, ECG/EEG 분석, 온디바이스 채트봇 등을 가능하게 하며, 모두 TinyML에 의해 구동됩니다. Aizip의 AI 나노 팩토리 플랫폼, Aizipline을 통해, 회사에서는 기초 및 생성 모델을 사용하여 모델 개발을 가속화하고, 완전한 AI 설계 자동화를 추진합니다. Aizip의 Gizmo 시리즈의 작은 언어 모델(300M–2B 파라미터)은 다양한 디바이스를 지원하며, 에지에 지능형 능력을 제공합니다.

멋진 인터뷰 감사합니다. 더 많은 정보를 원하는 독자는 Aizip을 방문할 수 있습니다.

앙투안은 Unite.AI의 비전있는 리더이자 공동 창립자로서, AI와 로봇공학의 미래를 형성하고 촉진하는 데 대한 불변의 열정에 의해 추동됩니다. 연쇄적인 기업가로서, 그는 AI가 사회에 대한 전기와 같은 파괴력을 가질 것이라고 믿으며, 종종 파괴적인 기술과 AGI의 잠재력에 대해 열광합니다.

作为 futurist, 그는 이러한 혁신이 우리의 세계를 어떻게 형성할지 탐구하는 데 전념하고 있습니다. 또한, 그는 Securities.io의 창립자로서, 미래를 재정의하고 전체 부문을 재형성하는 최첨단 기술에 투자하는 플랫폼입니다.