부본 YOLOv7: 가장 진보된 객체 감지 알고리즘? - Unite.AI
Rescale 미팅 예약

인공 지능

YOLOv7: 가장 진보된 객체 감지 알고리즘?

mm

게재

 on

6년 2022월 7일은 YOLOv7이 출시된 날이기 때문에 AI 역사의 랜드마크로 기록될 것입니다. YOLOv7은 출시 이후 컴퓨터 비전 개발자 커뮤니티에서 가장 인기 있는 주제였으며, 그 이유는 바로 그 때문입니다. YOLOvXNUMX은 이미 객체 감지 산업에서 이정표로 간주되고 있습니다. 

얼마 지나지 않아 YOLOv7 논문이 발표되었고, 가장 빠르고 정확한 실시간 이의제기 감지 모델로 나타났습니다. 그러나 YOLOv7은 이전 제품과 어떻게 경쟁합니까? YOLOv7이 컴퓨터 비전 작업을 효율적으로 수행하는 이유는 무엇입니까? 

이 기사에서는 YOLOv7 모델을 분석하고 YOLOv7이 이제 업계 표준이 된 이유에 대한 답을 찾으려고 노력할 것입니다. 그러나 이에 답하기 전에 객체 감지의 간략한 역사를 살펴봐야 합니다. 

객체 감지란 무엇입니까?

객체 감지는 컴퓨터 비전의 한 분야입니다. 이미지 또는 비디오 파일에서 개체를 식별하고 찾습니다. 객체 감지는 자율 주행 자동차, 감시 감시, 심지어 로봇 공학을 비롯한 수많은 애플리케이션의 구성 요소입니다. 

객체 감지 모델은 두 가지 범주로 분류할 수 있습니다. 단발 검출기, 멀티샷 검출기. 

실시간 개체 감지

YOLOv7의 작동 방식을 진정으로 이해하려면 YOLOv7의 주요 목표인 “실시간 개체 감지”. 실시간 개체 감지는 최신 컴퓨터 비전의 핵심 구성 요소입니다. 실시간 개체 감지 모델은 관심 있는 개체를 실시간으로 식별하고 찾습니다. 실시간 개체 감지 모델은 개발자가 비디오 또는 실시간 감시 입력과 같은 움직이는 프레임에서 관심 있는 개체를 추적하는 것을 매우 효율적으로 만들었습니다. 

실시간 개체 감지 모델은 기본적으로 기존 이미지 감지 모델보다 한 단계 앞서 있습니다. 전자는 비디오 파일에서 개체를 추적하는 데 사용되는 반면 후자는 이미지와 같은 고정된 프레임 내에서 개체를 찾고 식별합니다. 

결과적으로 실시간 물체 감지 모델은 비디오 분석, 자율 주행 차량, 물체 계수, 다중 물체 추적 등에 매우 효율적입니다. 

YOLO는 무엇입니까?

욜로 또는 “한 번만 봐”는 실시간 객체 감지 모델 제품군입니다. YOLO 개념은 2016년 Joseph Redmon에 의해 처음 소개되었으며 기존 물체 감지 알고리즘보다 훨씬 빠르고 정확하기 때문에 거의 즉시 화제가 되었습니다. YOLO 알고리즘이 컴퓨터 비전 산업의 표준이 되기까지는 그리 오래 걸리지 않았습니다. 

YOLO 알고리즘이 제안하는 기본 개념은 경계 상자 및 클래스 확률을 사용하여 실시간으로 예측하는 종단 간 신경망을 사용하는 것입니다. YOLO는 분류기를 용도 변경하여 객체 감지를 수행하는 다른 접근 방식을 제안했다는 점에서 이전 객체 감지 모델과 달랐습니다. 

접근 방식의 변화는 YOLO가 곧 업계 표준이 되면서 그 자체와 다른 실시간 객체 감지 알고리즘 간의 성능 차이가 상당했기 때문에 작동했습니다. 하지만 YOLO가 그렇게 효율적인 이유는 무엇이었을까요? 

YOLO와 비교할 때 물체 감지 알고리즘은 관심 지역을 감지하기 위해 Region Proposal Networks를 사용했습니다. 인식 프로세스는 각 영역에서 개별적으로 수행되었습니다. 결과적으로 이러한 모델은 종종 동일한 이미지에 대해 여러 반복을 수행하므로 정확도가 떨어지고 실행 시간이 길어집니다. 반면 YOLO 알고리즘은 완전히 연결된 단일 레이어를 사용하여 한 번에 예측을 수행합니다. 

YOLO는 어떻게 작동합니까?

YOLO 알고리즘이 작동하는 방식을 설명하는 세 단계가 있습니다. 

객체 감지를 단일 회귀 문제로 재구성

XNUMXD덴탈의 YOLO 알고리즘은 개체 감지를 단일 회귀 문제로 재구성하려고 합니다., 이미지 픽셀, 클래스 확률 및 경계 상자 좌표를 포함합니다. 따라서 알고리즘은 이미지에서 대상 개체를 예측하고 찾기 위해 이미지를 한 번만 봐야 합니다. 

이미지가 전 세계적으로 나타나는 이유

더욱이, YOLO 알고리즘이 예측을 할 때 이미지를 전역적으로 추론합니다.. YOLO 알고리즘은 데이터 세트에 대한 교육 및 테스트 중에 전체 이미지를 보고 클래스에 대한 컨텍스트 정보와 클래스가 표시되는 방식을 인코딩할 수 있으므로 영역 제안 기반 및 슬라이딩 기술과 다릅니다. 

YOLO 이전에 Fast R-CNN은 이미지의 배경 패치를 개체로 착각하는 데 사용되었기 때문에 이미지에서 더 큰 컨텍스트를 볼 수 없는 가장 인기 있는 개체 감지 알고리즘 중 하나였습니다. Fast R-CNN 알고리즘과 비교할 때 YOLO는 50% 더 정확합니다. 배경 오류와 관련하여. 

객체 표현 일반화

마지막으로 YOLO 알고리즘은 이미지에서 객체의 표현을 일반화하는 것을 목표로 합니다. 결과적으로 YOLO 알고리즘이 자연 이미지가 있는 데이터 세트에서 실행되고 결과에 대해 테스트되었을 때 YOLO는 기존 R-CNN 모델보다 큰 차이로 성능이 뛰어났습니다. YOLO는 일반화 가능성이 높기 때문에 예상치 못한 입력이나 새로운 도메인에 구현될 때 고장날 가능성이 적습니다. 

YOLOv7: 새로운 기능은 무엇입니까?

이제 실시간 객체 감지 모델이 무엇인지, YOLO 알고리즘이 무엇인지에 대한 기본적인 이해를 마쳤으니 이제 YOLOv7 알고리즘에 대해 논의할 차례입니다. 

교육 프로세스 최적화

YOLOv7 알고리즘은 모델 아키텍처를 최적화하려고 시도할 뿐만 아니라 훈련 프로세스를 최적화하는 것을 목표로 합니다. 최적화 모듈 및 방법을 사용하여 개체 감지의 정확도를 개선하고 교육 비용을 강화하는 동시에 간섭 비용을 유지하는 것을 목표로 합니다. 이러한 최적화 모듈은 훈련 가능한 공짜 가방. 

거친 리드에서 미세한 리드 가이드 라벨 할당

YOLOv7 알고리즘은 기존 방식 대신 새로운 Coarse to Fine Lead Guided Label Assignment를 사용할 계획입니다. 동적 레이블 지정. 동적 레이블 할당을 사용하면 여러 출력 레이어가 있는 모델을 교육하면 몇 가지 문제가 발생하며, 그 중 가장 일반적인 문제는 서로 다른 분기 및 해당 출력에 대한 동적 대상을 할당하는 방법입니다. 

모델 재매개변수화

모델 재매개변수화는 객체 감지에서 중요한 개념이며 일반적으로 학습 중에 몇 가지 문제가 뒤따릅니다. YOLOv7 알고리즘은 다음과 같은 개념을 사용할 계획입니다. 모델 재매개변수화 정책을 분석하기 위한 기울기 전파 경로 네트워크의 다른 계층에 적용할 수 있습니다. 

확장 및 복합 스케일링

YOLOv7 알고리즘은 또한 확장 및 복합 스케일링 방법 실시간 개체 감지를 위해 매개 변수 및 계산을 활용하고 효과적으로 사용합니다. 

YOLOv7 : 관련 작업

실시간 개체 감지

YOLO는 현재 업계 표준이며 대부분의 실시간 객체 탐지기는 YOLO 알고리즘과 FCOS(Fully Convolutional One-Stage Object-Detection)를 배포합니다. 최첨단 실시간 물체 감지기는 일반적으로 다음과 같은 특성을 가지고 있습니다.

  • 더 강력하고 빠른 네트워크 아키텍처. 
  • 효과적인 기능 통합 방법. 
  • 정확한 물체 감지 방법. 
  • 강력한 손실 함수. 
  • 효율적인 라벨 할당 방법. 
  • 효율적인 훈련 방법. 

YOLOv7 알고리즘은 종종 많은 양의 데이터가 필요한 자기 지도 학습 및 증류 방법을 사용하지 않습니다. 반대로 YOLOv7 알고리즘은 학습 가능한 bag-of-freebies 방법을 사용합니다. 

모델 재매개변수화

모델 재매개변수화 기법은 간섭 단계에서 여러 계산 모듈을 병합하는 앙상블 기법으로 간주됩니다. 이 기술은 다시 두 가지 범주로 나눌 수 있습니다. 모델 수준의 앙상블, 모듈 수준 앙상블. 

이제 최종 간섭 모델을 얻기 위해 모델 수준 재매개변수화 기술은 두 가지 방법을 사용합니다. 첫 번째 연습은 서로 다른 훈련 데이터를 사용하여 수많은 동일한 모델을 훈련한 다음 훈련된 모델의 가중치를 평균화합니다. 또는 다른 방법은 다른 반복 동안 모델의 가중치를 평균화합니다. 

Module level re-parameterization은 학습 단계에서 모듈을 서로 다른 모듈 분기 또는 서로 다른 동일한 분기로 분할한 다음 간섭하면서 이러한 서로 다른 분기를 동등한 모듈로 통합하기 때문에 최근 엄청난 인기를 얻고 있습니다. 

그러나 재매개변수화 기법을 모든 종류의 아키텍처에 적용할 수는 없습니다. 그 이유는 YOLOv7 알고리즘은 새로운 모델 재매개변수화 기술을 사용하여 관련 전략을 설계합니다. 다양한 아키텍처에 적합합니다. 

모델 스케일링

모델 확장은 기존 모델을 확장하거나 축소하여 다양한 컴퓨팅 장치에 맞도록 하는 프로세스입니다. 모델 스케일링은 일반적으로 레이어 수와 같은 다양한 요소를 사용합니다(깊이), 입력 이미지 크기(분해능 ), 기능 피라미드 수(단계) 및 채널 수(). 이러한 요소는 네트워크 매개변수, 간섭 속도, 계산 및 모델의 정확성에 대한 균형 잡힌 트레이드 오프를 보장하는 데 중요한 역할을 합니다. 

가장 일반적으로 사용되는 스케일링 방법 중 하나는 NAS 또는 네트워크 아키텍처 검색 복잡한 규칙 없이 검색 엔진에서 적합한 배율 인수를 자동으로 검색합니다. NAS 사용의 주요 단점은 적합한 확장 요소를 검색하는 데 비용이 많이 든다는 점입니다. 

거의 모든 모델 재매개변수화 모델은 개별 및 고유 스케일링 계수를 독립적으로 분석하고 더 나아가 이러한 계수를 독립적으로 최적화합니다. NAS 아키텍처는 상관관계가 없는 배율 인수로 작동하기 때문입니다. 

다음과 같은 연결 기반 모델은 주목할 가치가 있습니다. VoVNet or 덴스넷 모델의 깊이가 조정될 때 몇 개의 레이어의 입력 너비를 변경합니다. YOLOv7은 제안된 연결 기반 아키텍처에서 작동하므로 복합 스케일링 방법을 사용합니다.

위에서 언급한 그림은 확장된 효율적인 계층 집계 네트워크 (이엘란) 다른 모델. 제안하는 E-ELAN 방법은 기존 아키텍처의 기울기 전송 경로를 유지하되, 그룹 컨벌루션을 사용하여 추가된 특징의 카디널리티를 높이는 것을 목표로 한다. 이 프로세스는 다른 맵에서 학습한 기능을 향상시킬 수 있으며 계산 및 매개 변수를 보다 효율적으로 사용할 수 있습니다. 

YOLOv7 아키텍처

YOLOv7 모델은 YOLOv4, YOLO-R 및 Scaled YOLOv4 모델을 기반으로 사용합니다. YOLOv7은 결과를 개선하고 모델을 더 정확하게 만들기 위해 이러한 모델에서 수행된 실험 결과입니다. 

확장된 효율적인 계층 집계 네트워크 또는 E-ELAN

E-ELAN은 YOLOv7 모델의 기본 구성 요소이며 네트워크 효율성에 대한 기존 모델, 주로 기력. 

효율적인 아키텍처를 설계할 때 주요 고려 사항은 매개변수의 수, 계산 밀도 및 계산량입니다. 다른 모델은 입력/출력 채널 비율의 영향, 아키텍처 네트워크의 분기, 네트워크 간섭 속도, 컨볼루션 네트워크의 텐서 요소 수 등과 같은 요소도 고려합니다. 

XNUMXD덴탈의 CSPVoNet 모델은 위에서 언급한 매개변수를 고려할 뿐만 아니라 기울기 경로를 분석하여 서로 다른 레이어의 가중치를 활성화하여 더 다양한 기능을 학습합니다. 이 접근 방식을 사용하면 간섭이 훨씬 빠르고 정확해집니다. 그만큼 기력 아키텍처는 네트워크가 학습 및 수렴에 더 효과적일 수 있도록 가장 짧은 가장 긴 그래디언트 경로를 제어하는 ​​효율적인 네트워크를 설계하는 것을 목표로 합니다. 

ELAN은 계산 블록의 누적 수와 기울기 경로 길이에 관계없이 이미 안정적인 단계에 도달했습니다. 계산 블록이 무제한으로 쌓이면 안정 상태가 파괴될 수 있으며 매개변수 활용률이 감소합니다. 그만큼 제안된 E-ELAN 아키텍처는 확장, 셔플링 및 병합 카디널리티를 사용하므로 문제를 해결할 수 있습니다. 원래 기울기 경로를 유지하면서 네트워크의 학습 능력을 지속적으로 향상시킵니다. 

또한 E-ELAN과 ELAN의 아키텍처를 비교하면, 유일한 차이점은 계산 블록에 있으며 전환 계층의 아키텍처는 변경되지 않습니다. 

E-ELAN은 계산 블록의 카디널리티를 확장하고 다음을 사용하여 채널을 확장할 것을 제안합니다. 그룹 컨벌루션. 그런 다음 기능 맵이 계산되고 그룹 매개변수에 따라 그룹으로 섞인 다음 함께 연결됩니다. 각 그룹의 채널 수는 원래 아키텍처와 동일하게 유지됩니다. 마지막으로 카디널리티를 수행하기 위해 기능 맵 그룹이 추가됩니다. 

연결 기반 모델의 모델 스케일링

모델 스케일링이 도움이 됨 모델의 속성 조정 요구 사항에 따라 모델을 생성하는 데 도움이 되며 다양한 간섭 속도를 충족하기 위해 다양한 규모로 제공됩니다. 

그림은 다양한 연결 기반 모델의 모델 스케일링에 대해 설명합니다. 그림 (a)와 (b)에서 볼 수 있듯이 계산 블록의 출력 너비는 모델의 깊이 스케일링이 증가함에 따라 증가합니다. 결과적으로 전송 레이어의 입력 폭이 증가합니다. 이러한 방법이 연결 기반 아키텍처에서 구현되면 스케일링 프로세스가 심층적으로 수행되며 그림 (c)에 설명되어 있습니다. 

따라서 연결 기반 모델에 대해 배율 인수를 독립적으로 분석하는 것은 불가능하며 함께 고려하거나 분석해야 한다는 결론을 내릴 수 있습니다. 따라서 연결 기반 모델의 경우 해당 복합 모델 스케일링 방법을 사용하는 것이 적합합니다.. 또한 깊이 계수가 조정되면 블록의 출력 채널도 조정되어야 합니다. 

훈련 가능한 사은품 가방 

공짜 가방은 개발자가 설명하는 데 사용하는 용어입니다. 교육 전략 또는 비용을 변경할 수 있는 일련의 방법 또는 기술 모델 정확도를 높이려는 시도에서. 그렇다면 YOLOv7에서 이러한 훈련 가능한 공짜 가방은 무엇입니까? 한번 봅시다. 

계획된 재매개변수화 컨볼루션

YOLOv7 알고리즘은 기울기 흐름 전파 경로를 사용하여 결정합니다. 네트워크를 재매개변수화된 컨벌루션과 이상적으로 결합하는 방법. YOlov7의 이러한 접근 방식은 RepConv 알고리즘 VGG 모델에서는 안정적으로 수행되었지만 DenseNet 및 ResNet 모델에 직접 적용할 때는 성능이 좋지 않습니다. 

컨볼루션 계층에서 연결을 식별하려면 RepConv 알고리즘은 3×3 컨볼루션과 1×1 컨볼루션을 결합합니다.. 알고리즘, 성능 및 아키텍처를 분석하면 RepConv가 DenseNet의 연결 및 ResNet의 잔차

위의 이미지는 계획된 재매개변수화 모델을 보여줍니다. 연결 또는 잔류 연결이 있는 네트워크의 계층이 RepConv 알고리즘에서 ID 연결을 가져서는 안 된다는 것을 YOLov7 알고리즘이 발견한 것을 볼 수 있습니다. 결과적으로 ID 연결 없이 RepConvN으로 전환할 수 있습니다. 

보조의 경우 거칠고 리드 손실의 경우 미세

심층 감독 딥 네트워크의 훈련 과정에서 자주 사용되는 컴퓨터 과학의 한 분야입니다. 심층 감독의 기본 원칙은 다음과 같습니다. 네트워크의 중간 계층에 추가 보조 헤드를 추가합니다. 어시스턴트 손실을 가이드로 하는 얕은 네트워크 가중치와 함께. YOLOv7 알고리즘은 최종 출력을 담당하는 헤드를 리드 헤드라고 하고, 보조 헤드는 트레이닝을 보조하는 헤드라고 합니다. 

계속해서 YOLOv7은 레이블 할당에 다른 방법을 사용합니다. 일반적으로 레이블 할당은 주어진 규칙 세트를 기반으로 실측 정보를 직접 참조하여 레이블을 생성하는 데 사용되었습니다. 그러나 최근에는 예측 입력의 분포와 품질이 신뢰할 수 있는 레이블을 생성하는 데 중요한 역할을 합니다. YOLOv7은 개체의 소프트 레이블을 생성합니다. 경계 상자와 실측 정보의 예측을 사용하여 

또한 YOLOv7 알고리즘의 새로운 레이블 할당 방법은 리드 헤드의 예측을 사용하여 리드 및 보조 헤드를 모두 안내합니다. 레이블 할당 방법에는 두 가지 제안된 전략이 있습니다. 

리드 헤드 가이드 라벨 지정자

이 전략은 리드 헤드의 예측 결과와 Ground Truth를 기반으로 계산한 다음 최적화를 사용하여 소프트 레이블을 생성합니다. 이 소프트 라벨은 리드 헤드와 보조 헤드 모두에 대한 교육 모델로 사용됩니다. 

이 전략은 리드 헤드가 더 큰 학습 능력을 가지고 있기 때문에 리드 헤드가 생성하는 레이블이 더 대표적이고 소스와 대상 사이의 상관관계가 있어야 한다는 가정에서 작동합니다. 

Coarse-to-Fine 리드 헤드 가이드 라벨 할당기

이 전략은 또한 리드 헤드의 예측 결과와 실측 정보를 기반으로 계산을 수행한 다음 최적화를 사용하여 소프트 레이블을 생성합니다. 그러나 중요한 차이점이 있습니다. 이 전략에는 두 세트의 소프트 레이블이 있습니다. 거친 수준, 고급 라벨. 

거친 레이블은 양성 샘플의 제약을 완화하여 생성됩니다.

더 많은 그리드를 포지티브 타겟으로 취급하는 할당 프로세스. 보조 헤드의 약한 학습 강도로 인해 정보를 잃을 위험을 피하기 위해 수행됩니다. 

위의 그림은 YOLOv7 알고리즘에서 훈련 가능한 공짜 가방의 사용을 설명합니다. 보조 헤드는 거칠고 리드 헤드는 미세합니다. 보조 헤드가 있는 모델(b)과 일반 모델(a)을 비교할 때 (b)의 스키마에는 보조 헤드가 있지만 (a)에는 없는 스키마를 관찰할 수 있습니다. 

그림 (c)는 일반적인 독립 레이블 할당자를 묘사하고 그림 (d)와 그림 (e)는 각각 Lead Guided Assigner와 YOLOv7에서 사용하는 Coarse-toFine Lead Guided Assigner를 나타냅니다.  

다른 훈련 가능한 공짜 가방

위에서 언급한 것 외에도 YOLOv7 알고리즘은 원래 제안하지 않았지만 추가 공짜 가방을 사용합니다. 그들은

  • Conv-Bn-Activation 기술의 배치 정규화: 이 전략은 컨볼루션 계층을 배치 정규화 계층에 직접 연결하는 데 사용됩니다. 
  • YOLOR의 암묵적 지식: YOLOv7은 전략을 컨볼루션 기능 맵과 결합합니다. 
  • EMA 모델: EMA 모델은 YOLOv7에서 최종 참조 모델로 사용되지만 주요 용도는 평균 교사 방법에 사용됩니다. 

YOLOv7 : 실험

실험 설정

YOLOv7 알고리즘은 교육 및 검증을 위한 Microsoft COCO 데이터 세트 그들의 객체 감지 모델이며 이러한 모든 실험이 사전 훈련된 모델을 사용하는 것은 아닙니다. 개발자는 훈련을 위해 2017년 훈련 데이터 세트를 사용했고 하이퍼파라미터를 선택하기 위해 2017년 검증 데이터 세트를 사용했습니다. 마지막으로 YOLOv7 객체 감지 결과의 성능을 객체 감지를 위한 최신 알고리즘과 비교합니다. 

개발자는 다음을 위한 기본 모델을 설계했습니다. 에지 GPU(YOLOv7-tiny), 일반 GPU(YOLOv7) 및 클라우드 GPU(YOLOv7-W6). 또한 YOLOv7 알고리즘은 다양한 서비스 요구 사항에 따라 모델 확장을 위한 기본 모델을 사용하고 다른 모델을 얻습니다. YOLOv7 알고리즘의 경우 스택 스케일링은 넥에서 수행되며 제안된 화합물은 모델의 깊이 및 너비를 업스케일링하는 데 사용됩니다. 

기준선

YOLOv7 알고리즘은 이전 YOLO 모델과 YOLOR 객체 감지 알고리즘을 기준선으로 사용합니다.

위의 그림은 YOLOv7 모델의 기준선을 다른 물체 감지 모델과 비교한 것으로 결과는 매우 분명합니다. 와 비교할 때 YOLOv4 알고리즘, YOLOv7은 매개변수를 75% 적게 사용할 뿐만 아니라 계산도 15% 적게 사용하고 정확도는 0.4% 더 높습니다. 

최첨단 개체 감지기 모델과의 비교

위의 그림은 YOLOv7을 모바일 및 일반 GPU에 대한 최신 개체 감지 모델과 비교한 결과를 보여줍니다. YOLOv7 알고리즘이 제안한 방법이 속도-정확도 trade-off 점수가 가장 좋은 것을 확인할 수 있다. 

Ablation 연구 : 복합 스케일링 방법 제안

위에 표시된 그림은 모델 확장을 위해 서로 다른 전략을 사용한 결과를 비교합니다. YOLOv7 모델의 확장 전략은 계산 블록의 깊이를 1.5배 확장하고 너비를 1.25배 확장합니다. 

깊이만 확장하는 모델과 비교할 때 YOLOv7 모델은 더 적은 매개 변수와 계산 능력을 사용하면서 0.5% 더 나은 성능을 보입니다. 반면 깊이만 확장한 모델과 비교했을 때 YOLOv7의 정확도는 0.2% 향상되었지만 매개 변수 수는 2.9%, 계산은 1.2% 확장해야 합니다. 

제안된 계획된 재매개변수화 모델

제안된 재매개변수화된 모델의 일반성을 검증하기 위해 YOLOv7 알고리즘은 잔차 기반 및 검증을 위한 연결 기반 모델에서 사용합니다.. 검증 프로세스를 위해 YOLOv7 알고리즘은 다음을 사용합니다. 3단 ELAN 연결 기반 모델의 경우 CSPDarknet, 잔차 기반 모델의 경우. 

연결 기반 모델의 경우 알고리즘은 3-스택 ELAN의 3×3 컨벌루션 레이어를 RepConv로 대체합니다. 아래 그림은 Planned RepConv 및 3-stacked ELAN의 세부 구성을 보여줍니다. 

또한 잔차 기반 모델을 다룰 때 YOLOv7 알고리즘은 원래의 다크 블록에 3×3 컨볼루션 블록이 없기 때문에 반전된 다크 블록을 사용합니다. 아래 그림은 3×3 및 1×1 컨볼루션 레이어의 위치를 ​​반전시키는 Reversed CSPDarknet의 아키텍처를 보여줍니다. 

보조 헤드에 대해 제안된 보조 손실

보조 헤드에 대한 보조 손실의 경우 YOLOv7 모델은 보조 헤드 및 리드 헤드 방법에 대한 독립 레이블 할당을 비교합니다. 

위의 그림은 제안된 보조 헤드에 대한 연구 결과를 담고 있다. 조수 손실이 증가함에 따라 모델의 전반적인 성능이 증가함을 알 수 있다. 또한 YOLOv7 모델에서 제안한 리드 가이드 레이블 할당은 독립적인 리드 할당 전략보다 더 나은 성능을 보입니다. 

YOLOv7 결과

위의 실험을 바탕으로 다른 객체 감지 알고리즘과 비교했을 때 YOLov7의 성능 결과는 다음과 같습니다. 

위의 그림은 YOLOv7 모델과 다른 객체 감지 알고리즘을 비교한 것으로, YOLOv7이 다른 객체 감지 모델보다 평균 정밀도(AP) v/s 배치 간섭

또한 아래 그림은 YOLOv7 v/s 다른 실시간 이의 제기 감지 알고리즘의 성능을 비교한 것입니다. 다시 한 번 YOLOv7은 전반적인 성능, 정확성 및 효율성 측면에서 다른 모델을 계승합니다. 

다음은 YOLOv7 결과 및 성능에서 얻은 몇 가지 추가 관찰입니다. 

  1. YOLOv7-Tiny는 YOLO 제품군에서 가장 작은 모델로 6백만 개 이상의 매개변수가 있습니다. YOLOv7-Tiny는 35.2%의 평균 정밀도를 가지며 유사한 매개변수로 YOLOv4-Tiny 모델을 능가합니다. 
  2. YOLOv7 모델에는 37만 개 이상의 매개변수가 있으며 YOLOv4와 같은 매개변수가 더 높은 모델보다 성능이 뛰어납니다. 
  3. YOLOv7 모델은 5~160FPS 범위에서 가장 높은 mAP 및 FPS 속도를 제공합니다. 

결론

YOLO 또는 You Only Look Once는 최신 컴퓨터 비전에서 최첨단 개체 감지 모델입니다. YOLO 알고리즘은 높은 정확도와 효율성으로 유명하며, 그 결과 실시간 물체 감지 산업에서 광범위하게 응용되고 있습니다. 2016년에 첫 번째 YOLO 알고리즘이 소개된 이후로 실험을 통해 개발자는 모델을 지속적으로 개선할 수 있었습니다. 

YOLOv7 모델은 YOLO 제품군에 가장 최근에 추가된 모델이며 현재까지 가장 강력한 YOLo 알고리즘입니다. 이 기사에서는 YOLOv7의 기본 사항에 대해 이야기하고 YOLOv7을 매우 효율적으로 만드는 이유를 설명하려고 했습니다. 

"직업은 엔지니어, 마음은 작가". Kunal은 AI와 ML에 대한 깊은 애정과 이해를 가진 기술 작가로, 매력적이고 유익한 문서를 통해 이 분야의 복잡한 개념을 단순화하는 데 전념하고 있습니다.