부본 Waymo의 자율 주행 기술, 콘텐츠 검색 덕분에 더 똑똑해지고 수십억 개의 개체 인식 - Unite.AI
Rescale 미팅 예약

투자

Waymo의 자율 주행 기술은 콘텐츠 검색 덕분에 더 똑똑해지고 수십억 개의 개체를 인식합니다.

mm
업데이트 on

Waymo가 개발한 자율주행차는 컴퓨터 비전 기술과 인공지능을 활용하여 주변 환경을 인식하고 차량이 어떻게 반응하고 움직여야 하는지 실시간으로 결정합니다. 차량 내부의 카메라와 센서에 의해 물체가 감지되면 알파벳이 수집한 대규모 데이터베이스와 대조하여 인식합니다.

대규모 데이터 세트는 자율주행차 훈련에 매우 중요합니다. 차량 내 AI가 더 좋아지고 성능을 향상시킬 수 있기 때문입니다. 그러나 엔지니어는 AI가 특정 유형의 이미지에서 수행하는 방식을 조사할 수 있도록 데이터 세트 내의 항목을 쿼리에 효율적으로 일치시키는 방법이 필요합니다. 이 문제를 해결하기 위해, VentureBeat 보고서, 웨이모 최근 "콘텐츠 검색"이라는 도구를 개발했습니다., Google 이미지 검색 및 Google 포토 작동 방식과 유사하게 작동합니다. 이러한 시스템은 쿼리를 이미지 내의 시맨틱 콘텐츠와 일치시켜 자연어 쿼리를 기반으로 이미지 검색을 더 쉽게 만드는 개체의 표현을 생성합니다.

콘텐츠 검색이 등장하기 전에는 Waymo의 연구원이 로그에서 특정 샘플을 검색하려면 휴리스틱을 사용하여 개체를 설명해야 했습니다. Waymo의 로그는 규칙에 따라 개체를 검색하는 명령을 사용하여 검색해야 했습니다. 즉, "X 높이 미만"인 개체 또는 "시속 y마일로 이동한" 개체에 대한 검색을 실행해야 했습니다. 이러한 규칙 기반 검색의 결과는 종종 매우 광범위할 수 있으며 연구자는 반환된 결과를 수동으로 샅샅이 조사해야 했습니다.

콘텐츠 검색은 개체가 제시될 때 가장 유사한 범주를 찾기 위해 데이터 카탈로그를 생성하고 서로 다른 카탈로그에서 유사성 검색을 수행하여 이 문제를 해결합니다. 콘텐츠 검색에 트럭이나 나무가 표시되면 Waymo의 자율 주행 차량이 만난 다른 트럭이나 나무를 반환합니다. Waymo 차량이 주변을 돌면서 주변 물체의 이미지를 기록한 다음 이러한 물체를 임베딩/수학적 표현으로 저장합니다. 이는 도구가 저장된 개체 이미지가 제공된 개체와 얼마나 유사한지에 따라 개체 범주와 순위 응답을 비교할 수 있음을 의미합니다. 이는 다음과 유사합니다. 임베딩 유사성 매칭 서비스 Google Works에서 운영합니다.

Waymo의 차량이 마주치는 물체는 모양과 크기가 모두 다를 수 있지만 콘텐츠 검색이 작동하려면 모두 필수 구성 요소로 분류되고 분류되어야 합니다. 이를 위해 Waymo는 다양한 개체에 대해 훈련된 여러 AI 모델을 사용합니다. 다양한 모델은 다양한 객체를 인식하는 방법을 학습하고 특정 카테고리에 속하는 항목이 주어진 이미지 내에서 발견되는지 여부를 모델이 이해할 수 있도록 하는 콘텐츠 검색의 지원을 받습니다. 추가 광학 문자 인식 모델이 기본 모델과 함께 활용되어 Waymo 차량이 이미지에서 발견된 모든 텍스트를 기반으로 이미지의 개체에 추가 식별 정보를 추가할 수 있습니다. 예를 들어 간판이 장착된 트럭은 콘텐츠 검색 설명에 포함된 표지판의 텍스트를 갖습니다.

함께 작동하는 위의 모델 덕분에 Waymo의 연구원과 엔지니어는 이미지 데이터 로그에서 특정 나무 종 및 자동차 제조사와 같은 매우 구체적인 물체를 검색할 수 있습니다.

VentureBeat에서 인용한 Waymo에 따르면:

“Content Search를 사용하여 우리는 운전 이력의 개체에 자동으로 주석을 달 수 있습니다. 그 결과 레이블 지정을 위해 전송하는 데이터의 속도와 품질이 기하급수적으로 향상되었습니다. 라벨링을 가속화하는 기능은 보도에 막 진입하려는 어린이가 있는 스쿨버스 또는 전기 스쿠터를 타는 사람을 감지하는 것부터 길을 건너는 고양이나 개에 이르기까지 시스템 전반에 걸쳐 많은 개선에 기여했습니다. Waymo가 더 많은 도시로 확장됨에 따라 우리는 계속해서 새로운 물체와 시나리오를 접하게 될 것입니다.”

Waymo가 차량의 신뢰성과 정확성을 높이기 위해 여러 기계 학습 모델을 사용한 것은 이번이 처음이 아닙니다. 웨이모 과거에 Alphabet/Google과 협력한 적이 있습니다., DeepMind와 함께 AI 기술 개발을 돕습니다. AI 시스템은 진화 생물학에서 영감을 얻습니다. 우선 다양한 기계 학습 모델을 만들고 학습한 후 성능이 저조한 모델을 추려 자손 모델로 대체합니다. 이 기술은 필요한 계산 리소스와 교육 시간을 줄이는 동시에 잘못된 긍정을 크게 줄이는 데 성공한 것으로 알려졌습니다.

Waymo의 AI 콘텐츠 검색 도구를 통해 엔지니어는 운전 기록에서 개체를 빠르게 찾을 수 있습니다.

전문 분야의 블로거 및 프로그래머 기계 학습 깊은 학습 주제. 다니엘은 다른 사람들이 사회적 이익을 위해 AI의 힘을 사용하도록 돕기를 희망합니다.