AI 101

λ”₯ λŸ¬λ‹μ΄λž€ 무엇인가?

mm

딥 러닝은 인공 지능에서 가장 영향력 있는 분야 중 하나이며, 가장 빠르게 성장하고 있는 분야 중 하나입니다. 그러나 딥 러닝에 대한 직관적인 이해를 얻는 것은 어려울 수 있습니다. 왜냐하면 딥 러닝이라는 용어는 다양한 알고리즘과 기술을 포함하기 때문입니다. 딥 러닝은 또한 기계 학습의 하위 분야이므로, 딥 러닝을 이해하기 위해서는 기계 학습이 무엇인지 이해하는 것이 중요합니다.

기계 학습이란 무엇인가?

딥 러닝은 기계 학습에서 기인한 일부 개념의 확장입니다. 따라서 기계 학습이 무엇인지 설명해 보겠습니다.

간단히 말해, 기계 학습은 컴퓨터가 특정 작업을 수행하도록 하는 방법으로, 작업을 수행하는 데 필요한 알고리즘의 모든 줄을 명시적으로 코딩할 필요가 없습니다. 다양한 기계 학습 알고리즘이 있지만, 가장 일반적으로 사용되는 알고리즘 중 하나는 다층 퍼셉트론입니다. 다층 퍼셉트론은 또한 신경 네트워크라고呼ば으며, 노드/뉴런이 연결된 시리즈로 구성됩니다. 다층 퍼셉트론에는 세 가지 다른 계층이 있습니다. 입력 계층, 숨겨진 계층, 출력 계층입니다.

입력 계층은 네트워크에 데이터를 입력받으며, 중간/숨겨진 계층의 노드에 의해 조작됩니다. 숨겨진 계층의 노드는 데이터를 조작하는 수학적 함수이며, 입력 데이터에서 관련 패턴을 추출할 수 있습니다. 이것이 신경 네트워크가 “학습”하는 방법입니다. 신경 네트워크는 인간 뇌의 구조와 기능에서 영감을 받았기 때문에 이러한 이름이 붙여졌습니다.

네트워크의 노드 사이에 가중치라는 값이 있습니다. 이러한 값은 본质적으로 데이터가 한 계층에서 다음 계층으로 관련되는 방식에 대한 가정입니다. 네트워크가 훈련될수록 가중치가 조정되고, 가중치/데이터에 대한 가정은 궁극적으로 데이터 내에 의미 있는 패턴을 정확하게 나타내는 값으로 수렴하는 것이 목표입니다.

활성화 함수는 네트워크의 노드에 존재하며, 이러한 활성화 함수는 데이터를 비선형적으로 변환하여 네트워크가 복잡한 데이터 표현을 학습할 수 있도록 합니다. 활성화 함수는 입력 값을 가중치 값으로 곱하고 편향 값을 추가합니다.

딥 러닝이란 무엇인가?

딥 러닝은 다층 퍼셉트론을 여러 개 결합하여 단 하나의 숨겨진 계층이 아닌 여러 숨겨진 계층을 만드는 기계 학습 아키텍처에 대한 용어입니다. 딥 신경 네트워크가 “더 깊을수록” 네트워크가 학습할 수 있는 패턴이 더 복잡해집니다.

딥 계층 네트워크는 완전 연결 네트워크 또는 완전 연결 계층이라고도呼ば며, 주변의 모든 뉴런에 연결된 뉴런을 참조합니다. 완전 연결 네트워크는 다른 기계 학습 함수와 결합하여 다양한 딥 러닝 아키텍처를 만들 수 있습니다.

딥 러닝의 다양한 유형

연구자와 엔지니어들은 다양한 딥 러닝 아키텍처를 사용하며, 각 아키텍처에는 고유한 특수 사용 사례가 있습니다.

컨볼루션 신경 네트워크

컨볼루션 신경 네트워크 또는 CNN은 컴퓨터 비전 시스템을 만들기 위해 일반적으로 사용되는 신경 네트워크 아키텍처입니다. 컨볼루션 신경 네트워크의 구조는 이미지 데이터를 해석할 수 있으며, 숫자로 변환하여 완전 연결 네트워크가 해석할 수 있습니다. CNN에는 네 가지 주요 구성 요소가 있습니다.

  • 컨볼루션 계층
  • 서브샘플링/풀링 계층
  • 활성화 함수
  • 완전 연결 계층

컨볼루션 계층은 네트워크에 이미지를 입력으로 받아 이미지의 픽셀 값을 분석합니다. 서브샘플링 또는 풀링은 이미지 값을 변환/감소시켜 이미지 필터에 대한 이미지의 표현을 단순화하고 노이즈에 대한 민감도를 줄입니다. 활성화 함수는 데이터가 한 계층에서 다음 계층으로 흐르는 방식을 제어하며, 완전 연결 계층은 이미지의 값을 분석하고 이미지에 포함된 패턴을 학습합니다.

RNNs/LSTMs

순환 신경 네트워크 또는 RNN은 데이터의 순서가 중요한 작업에 일반적으로 사용됩니다. 순환 신경 네트워크는 자연어 처리와 같은 문제에 일반적으로 적용되며, 문장의 의미를 해석할 때 단어의 순서가 중요합니다. 순환 신경 네트워크의 “순환”이라는 용어는 순환 신경 네트워크의 출력이 이전 계산 및 현재 계산 모두에 의존한다는 사실에서 유래합니다. 다른 유형의 딥 신경 네트워크와 달리, RNN에는 “기억”이 있습니다. 시퀀스의 다양한 시간 단계에서 계산된 정보는 최종 값을 계산하는 데 사용됩니다.

순환 신경 네트워크에는 여러 유형이 있습니다. 미래의 항목을 고려하여 현재 항목의 값을 계산하는 양방향 순환 신경 네트워크가 있습니다. 순환 신경 네트워크의 또 다른 유형은 장단기 기억 또는 LSTM 네트워크입니다. LSTM은 긴 데이터 체인을 처리할 수 있습니다. 일반적인 순환 신경 네트워크는 “그라디언트 폭발 문제”에 빠질 수 있습니다. 이 문제는 입력 데이터 체인이非常 길 때 발생합니다. 그러나 LSTM에는 이 문제를 해결하는 기술이 있습니다.

오토인코더

지금까지 언급한 대부분의 딥 러닝 아키텍처는 지도 학습 문제에 적용됩니다. 오토인코더는 비지도 학습 데이터를 지도 학습 형식으로 변환하여 신경 네트워크를 사용할 수 있도록 합니다.

오토인코더는 일반적으로 이상을 감지하는 데 사용됩니다. 예를 들어, 금융 기관의 사기 감지와 같은 이상의 본질은 알려져 있지 않습니다. 이 경우 오토인코더의 목적은 데이터의 정상적인 패턴을 기준으로 하여 이상 또는 아웃라이어를 식별하는 것입니다.

오토인코더의 구조는 일반적으로 대칭적이며, 숨겨진 계층이 배열되어 출력이 입력과 유사하게 됩니다. 오토인코더에는 네 가지 유형이 있습니다.

  • 정규/단순 오토인코더
  • 다층 인코더
  • 컨볼루션 인코더
  • 정규화된 인코더

정규/단순 오토인코더는 단 하나의 숨겨진 계층이 있는 신경 네트워크입니다. 다층 오토인코더는 여러 숨겨진 계층이 있는 깊은 네트워크입니다. 컨볼루션 오토인코더는 완전 연결 계층 대신 또는 추가로 컨볼루션 계층을 사용합니다. 정규화된 오토인코더는 특정 유형의 손실 함수를 사용하여 신경 네트워크가 입력을 출력으로 단순히 복사하는 것 외에 더 복잡한 기능을 수행할 수 있습니다.

생성적 적대 신경 네트워크

생성적 적대 신경 네트워크(GANs)는 실제로 하나의 딥 신경 네트워크가 아닌 두 개의 딥 신경 네트워크입니다. 두 개의 딥 러닝 모델이同时 훈련되며, 각 모델의 출력이 다른 모델에 입력됩니다. 두 모델은 서로 경쟁하며, 서로의 출력 데이터에 접근할 수 있으므로 데이터에서 학습하고 개선합니다. 생성 모델은 새로운 인스턴스를 생성하려고 시도하며, 감지 모델/판별기는 이러한 인스턴스를 감지하려고 시도합니다. GANs는 컴퓨터 비전 분야에서 인기를 얻었습니다.

딥 러닝 요약

딥 러닝은 신경 네트워크의 원리를 확장하여 복잡한 패턴을 학습하고 이러한 패턴을 미래 데이터 세트에 일반화할 수 있는 모델을 만듭니다. 컨볼루션 신경 네트워크는 이미지 해석에 사용되며, RNNs/LSTMs는 순차적 데이터 해석에 사용됩니다. 오토인코더는 비지도 학습 작업을 지도 학습 작업으로 변환할 수 있습니다. 마지막으로, GANs는 컴퓨터 비전 작업에 특히 유용한 여러 네트워크입니다.

λΈ”λ‘œκ±°μ΄μž ν”„λ‘œκ·Έλž˜λ¨Έλ‘œ Machine Learningκ³Ό Deep Learning μ£Όμ œμ— μ „λ¬Έκ°€μž…λ‹ˆλ‹€. λ‹€λ‹ˆμ—˜μ€ λ‹€λ₯Έ μ‚¬λžŒλ“€μ΄ AI의 νž˜μ„ μ‚¬νšŒμ ε–„μœΌλ‘œ μ‚¬μš©ν•˜λŠ” 것을 돕기λ₯Ό ν¬λ§ν•©λ‹ˆλ‹€.