AI 101

컴퓨터 비전이란 무엇입니까?

업데이트 on 2023 년 7 월 21 일

컴퓨터 비전이란 무엇입니까?

컴퓨터 비전 알고리즘은 현재 세계에서 가장 혁신적이고 강력한 AI 시스템 중 하나입니다. 컴퓨터 비전 시스템 자율 주행 차량, 로봇 내비게이션, 안면 인식 시스템 등에서의 사용을 참조하십시오. 그러나 컴퓨터 비전 알고리즘은 정확히 무엇입니까? 그들은 어떻게 작동합니까? 이러한 질문에 답하기 위해 컴퓨터 비전, 컴퓨터 비전 알고리즘 및 컴퓨터 비전 시스템용 응용 프로그램의 배후에 있는 이론에 대해 자세히 살펴보겠습니다.

컴퓨터 비전 시스템은 어떻게 작동합니까?

컴퓨터 비전 시스템의 작동 방식을 완전히 이해하기 위해 먼저 인간이 물체를 인식하는 방법에 대해 잠시 논의해 보겠습니다. 우리가 대상을 인식하는 방법에 대한 신경심리학의 가장 좋은 설명은 대상의 초기 단계를 설명하는 모델입니다. 물체 인식 형태, 색상, 깊이와 같은 사물의 기본 구성 요소가 뇌에 의해 먼저 해석되는 것입니다. 뇌로 들어오는 눈의 신호는 분석되어 물체의 가장자리를 먼저 끌어내고, 이러한 가장자리는 함께 결합되어 물체의 형태를 완성하는 보다 복잡한 표현으로 결합됩니다.

컴퓨터 비전 시스템은 먼저 물체의 가장자리를 식별한 다음 이러한 가장자리를 물체의 형태로 결합함으로써 인간의 시각 시스템과 매우 유사하게 작동합니다. 가장 큰 차이점은 컴퓨터가 이미지를 숫자로 해석하기 때문에 컴퓨터 비전 시스템은 이미지를 구성하는 개별 픽셀을 해석하는 방법이 필요하다는 것입니다. 컴퓨터 비전 시스템은 이미지의 픽셀에 값을 할당하고 한 픽셀 영역과 다른 픽셀 영역 사이의 값 차이를 검사하여 컴퓨터가 가장자리를 식별할 수 있습니다. 예를 들어 해당 이미지가 그레이스케일인 경우 값의 범위는 검은색(0으로 표시)에서 흰색(255로 표시)까지입니다. 서로 가까운 픽셀 값 범위의 갑작스러운 변화는 가장자리를 나타냅니다.

픽셀 값을 비교하는 이 기본 원칙은 컴퓨터가 서로 다른 RGB 색상 채널 간의 차이를 비교하는 컬러 이미지로도 수행할 수 있습니다. 컴퓨터 비전 시스템이 픽셀 값을 검사하여 이미지를 해석하는 방법을 알고 있으므로 컴퓨터 비전 시스템의 아키텍처를 살펴보겠습니다.

컨볼 루션 신경망 (CNN)

컴퓨터 비전 작업에 사용되는 기본 AI 유형은 다음 중 하나입니다. 컨벌루션 신경망 기반. 컨볼루션이 정확히 무엇인가요?

컨볼루션은 네트워크가 픽셀 간의 값 차이를 결정하는 데 사용하는 수학적 프로세스입니다. 픽셀 값의 그리드를 구상하는 경우 이 기본 그리드 위로 이동하는 더 작은 그리드를 상상해 보십시오. 두 번째 그리드 아래의 값은 네트워크에 의해 분석되고 있으므로 네트워크는 한 번에 소수의 픽셀만 검사합니다. 이것은 종종 "슬라이딩 윈도우" 기술이라고 합니다. 슬라이딩 윈도우에 의해 분석되는 값은 네트워크에 의해 요약되어 이미지의 복잡성을 줄이고 네트워크가 패턴을 더 쉽게 추출할 수 있도록 합니다.

컨벌루션 신경망은 두 개의 다른 섹션으로 나누어, 컨벌루션 섹션 및 완전 연결 섹션. 네트워크의 컨벌루션 레이어는 특징 추출기이며, 이미지 내의 픽셀을 분석하고 신경망의 조밀하게 연결된 레이어가 패턴을 학습할 수 있는 표현을 형성하는 것입니다. 컨볼루션 레이어는 픽셀을 검사하고 가장자리와 같은 이미지의 저수준 기능을 추출하는 것으로 시작합니다. 이후의 컨볼루션 레이어는 가장자리를 결합하여 더 복잡한 모양을 만듭니다. 결국 네트워크는 완전히 연결된 레이어로 전달할 수 있는 이미지의 가장자리와 세부 사항을 표현하게 될 것입니다.

이미지 주석

컨볼루션 신경망은 이미지에서 스스로 패턴을 추출할 수 있지만 이미지에 주석을 추가하면 컴퓨터 비전 시스템의 정확도가 크게 향상될 수 있습니다. 이미지 주석 이미지에서 중요한 개체를 감지할 때 분류자를 지원하는 이미지에 메타데이터를 추가하는 프로세스입니다. 자율 주행 차량이나 로봇을 제어할 때와 같이 컴퓨터 비전 시스템이 매우 정확해야 할 때마다 이미지 주석을 사용하는 것이 중요합니다.

컴퓨터 비전 분류기의 성능을 향상시키기 위해 이미지에 주석을 달 수 있는 다양한 방법이 있습니다. 이미지 주석은 대상 개체의 가장자리를 둘러싸고 컴퓨터가 상자 내에서 주의를 집중하도록 지시하는 상자인 경계 상자로 수행되는 경우가 많습니다. 시맨틱 분할은 이미지의 모든 픽셀에 이미지 클래스를 할당하여 작동하는 또 다른 유형의 이미지 주석입니다. 즉, "잔디" 또는 "나무"로 간주될 수 있는 모든 픽셀은 해당 클래스에 속하는 것으로 레이블이 지정됩니다. 이 기술은 픽셀 수준의 정밀도를 제공하지만 시맨틱 분할 주석을 만드는 것은 단순한 경계 상자를 만드는 것보다 더 복잡하고 시간이 많이 걸립니다. 선 및 점과 같은 다른 주석 방법도 있습니다.