Rescale 미팅 예약

AI 101

딥러닝이란?

mm
업데이트 on

딥러닝은 인공지능 분야에서 가장 영향력 있고 가장 빠르게 성장하는 분야 중 하나입니다. 그러나 딥러닝이라는 용어는 다양한 알고리즘과 기술을 다루기 때문에 딥러닝을 직관적으로 이해하는 것이 어려울 수 있습니다. 딥러닝은 일반적으로 머신러닝의 하위 분야이기도 하므로, 딥러닝을 이해하려면 머신러닝이 무엇인지 이해하는 것이 중요합니다.

머신 러닝이란 무엇입니까?

깊은 학습 는 기계 학습에서 비롯된 일부 개념의 확장이므로 기계 학습이 무엇인지 잠깐 설명하겠습니다.

간단히 말해서 머신 러닝은 특정 작업을 수행하는 데 사용되는 알고리즘의 모든 라인을 명시적으로 코딩하지 않고도 컴퓨터가 특정 작업을 수행할 수 있도록 하는 방법입니다. 다양한 기계 학습 알고리즘이 있지만 가장 일반적으로 사용되는 알고리즘 중 하나는 다층 퍼셉트론. 다층 퍼셉트론은 신경망이라고도 하며 함께 연결된 일련의 노드/뉴런으로 구성됩니다. 다중 레이어 퍼셉트론에는 입력 레이어, 숨겨진 레이어 및 출력 레이어의 세 가지 레이어가 있습니다.

입력 계층은 중간/숨겨진 계층의 노드에 의해 조작되는 네트워크로 데이터를 가져옵니다. 숨겨진 계층의 노드는 입력 계층에서 오는 데이터를 조작하여 입력 데이터에서 관련 패턴을 추출할 수 있는 수학 함수입니다. 이것이 신경망이 "학습"하는 방식입니다. 신경망은 인간 두뇌의 구조와 기능에서 영감을 받았다는 사실에서 그 이름을 얻었습니다.

네트워크의 노드 간 연결에는 가중치라는 값이 있습니다. 이러한 값은 본질적으로 한 계층의 데이터가 다음 계층의 데이터와 어떻게 관련되어 있는지에 대한 가정입니다. 네트워크가 훈련됨에 따라 가중치가 조정되며 목표는 데이터에 대한 가중치/가정이 결국 데이터 내의 의미 있는 패턴을 정확하게 나타내는 값으로 수렴하는 것입니다.

활성화 함수는 네트워크의 노드에 있으며 이러한 활성화 함수는 데이터를 비선형 방식으로 변환하여 네트워크가 데이터의 복잡한 표현을 학습할 수 있도록 합니다. 활성화 함수는 입력 값에 가중치 값을 곱하고 바이어스 항을 추가합니다.

딥러닝이란?

딥 러닝은 많은 다층 퍼셉트론을 결합하여 하나의 은닉층이 아니라 많은 은닉층이 있는 기계 학습 아키텍처에 부여된 용어입니다. 심층 신경망이 "깊을수록" 네트워크가 더 정교한 패턴을 학습할 수 있습니다.

뉴런으로 구성된 심층 계층 네트워크는 때때로 완전 연결 네트워크 또는 완전 연결 계층이라고도 하며 주어진 뉴런이 주변의 모든 뉴런과 연결을 유지한다는 사실을 참조합니다. 완전히 연결된 네트워크는 다른 기계 학습 기능과 결합하여 다양한 딥 러닝 아키텍처를 생성할 수 있습니다.

다양한 유형의 딥 러닝

연구원과 엔지니어가 사용하는 다양한 딥 러닝 아키텍처가 있으며 각 아키텍처에는 고유한 특수 사용 사례가 있습니다.

컨볼 루션 신경망

컨볼 루션 신경망, 또는 CNN은 컴퓨터 비전 시스템 생성에 일반적으로 사용되는 신경망 아키텍처입니다. 컨벌루션 신경망의 구조를 통해 이미지 데이터를 해석하고 이를 완전 연결 네트워크가 해석할 수 있는 숫자로 변환할 수 있습니다. CNN에는 네 가지 주요 구성 요소가 있습니다.

  • 컨볼 루션 레이어
  • 서브샘플링/풀링 레이어
  • 활성화 기능
  • 완전히 연결된 계층

컨벌루션 레이어는 이미지를 네트워크에 대한 입력으로 가져와 이미지를 분석하고 픽셀 값을 가져오는 것입니다. 서브샘플링 또는 풀링은 이미지 값을 변환/축소하여 이미지 표현을 단순화하고 노이즈에 대한 이미지 필터의 감도를 줄이는 것입니다. 활성화 함수는 데이터가 한 계층에서 다음 계층으로 흐르는 방식을 제어하고 완전히 연결된 계층은 이미지를 나타내는 값을 분석하고 해당 값에 포함된 패턴을 학습합니다.

RNN/LSTM

순환 신경망, 또는 RNN은 데이터 순서가 중요한 작업, 즉 네트워크가 데이터 시퀀스에 대해 학습해야 하는 작업에 널리 사용됩니다. 문장의 의미를 해독할 때 단어의 순서가 중요하기 때문에 RNN은 일반적으로 자연어 처리와 같은 문제에 적용됩니다. 순환 신경망이라는 용어의 "반복" 부분은 시퀀스의 특정 요소에 대한 출력이 이전 계산과 현재 계산에 따라 달라진다는 사실에서 비롯됩니다. 다른 형태의 심층 신경망과 달리 RNN에는 "메모리"가 있으며 시퀀스의 서로 다른 시간 단계에서 계산된 정보를 사용하여 최종 값을 계산합니다.

항목의 가치를 계산할 때 이전 항목 외에도 시퀀스의 미래 항목을 고려하는 양방향 RNN을 포함하여 여러 유형의 RNN이 있습니다. RNN의 또 다른 유형은 장단기 기억 또는 LSTM, 네트워크. LSTM은 긴 데이터 체인을 처리할 수 있는 RNN 유형입니다. 일반 RNN은 "폭발하는 그래디언트 문제"라는 문제의 희생양이 될 수 있습니다. 이 문제는 입력 데이터 체인이 극도로 길어질 때 발생하지만 LSTM에는 이 문제를 해결할 수 있는 기술이 있습니다.

자동 인코더

지금까지 언급된 대부분의 딥러닝 아키텍처는 비지도 학습 작업이 아닌 지도 학습 문제에 적용됩니다. 오토인코더는 감독되지 않은 데이터를 감독된 형식으로 변환할 수 있으므로 문제에 신경망을 사용할 수 있습니다.

자동 인코더 이상 현상의 특성을 알 수 없기 때문에 감독되지 않은 학습의 예인 데이터 세트에서 이상 징후를 감지하는 데 자주 사용됩니다. 이러한 이상 탐지의 예로는 금융 기관에 대한 사기 탐지가 있습니다. 이러한 맥락에서 오토인코더의 목적은 데이터에서 규칙적인 패턴의 기준선을 결정하고 이상 또는 이상값을 식별하는 것입니다.

오토인코더의 구조는 종종 대칭적이며 네트워크의 출력이 입력과 유사하도록 숨겨진 레이어가 배열되어 있습니다. 자주 사용되는 네 가지 유형의 자동 인코더는 다음과 같습니다.

  • 일반/일반 자동 인코더
  • 다층 인코더
  • 컨벌루션 인코더
  • 정규화된 인코더

일반/일반 자동 인코더는 단일 숨겨진 레이어가 있는 신경망인 반면 다중 레이어 자동 인코더는 둘 이상의 숨겨진 레이어가 있는 심층 네트워크입니다. 컨볼루션 자동 인코더는 완전 연결 레이어 대신 또는 추가로 컨벌루션 레이어를 사용합니다. 정규화된 오토인코더는 신경망이 단순히 입력을 출력에 복사하는 것보다 더 복잡한 기능을 수행할 수 있도록 하는 특정 종류의 손실 기능을 사용합니다.

생성 적 적대 네트워크

GAN (Generative Adversarial Networks) 실제로 하나의 네트워크가 아닌 여러 심층 신경망입니다. 두 개의 딥 러닝 모델이 동시에 훈련되고 해당 출력이 다른 네트워크에 공급됩니다. 네트워크는 서로 경쟁하며 서로의 출력 데이터에 액세스할 수 있기 때문에 둘 다 이 데이터에서 배우고 개선합니다. 두 네트워크는 본질적으로 위조 및 탐지 게임을 하고 있으며 생성 모델은 탐지 모델/판별자를 속일 새로운 인스턴스를 생성하려고 시도합니다. GAN은 컴퓨터 비전 분야에서 대중화되었습니다.

딥 러닝 요약

딥 러닝은 신경망의 원리를 확장하여 복잡한 패턴을 학습하고 이러한 패턴을 미래의 데이터 세트로 일반화할 수 있는 정교한 모델을 생성합니다. 합성곱 신경망은 이미지를 해석하는 데 사용되고 RNN/LSTM은 순차 데이터를 해석하는 데 사용됩니다. 오토인코더는 비지도 학습 작업을 지도 학습 작업으로 변환할 수 있습니다. 마지막으로 GAN은 컴퓨터 비전 작업에 특히 유용한 서로 맞붙은 여러 네트워크입니다.

전문 분야의 블로거 및 프로그래머 기계 학습 깊은 학습 주제. 다니엘은 다른 사람들이 사회적 이익을 위해 AI의 힘을 사용하도록 돕기를 희망합니다.