Connect with us

AI 101

신경망이란 무엇인가?

mm

인공 신경망(ANNs)이란?

많은 인공 지능의 발전은 인공 신경망에 의해 주도된다. 인공 신경망(ANNs)은 인간 뇌의 신경망에서 영감을 받은 형식으로 결합된 수학적 함수의 연결이다. 이러한 ANNs는 데이터에서 복잡한 패턴을 추출하고, 이러한 패턴을 보지 못한 데이터에 적용하여 데이터를 분류/인식할 수 있다. 이렇게 하면 기계가 “학습”한다. 이것은 신경망에 대한 간단한 개요이지만, 신경망이 무엇인지 그리고 어떻게 작동하는지 더 잘 이해하기 위해 신경망을 더 자세히 살펴보자.

다층 퍼셉트론 설명

더 복잡한 신경망을 살펴보기 전에, 인공 신경망(ANN)의 간단한 버전인 다층 퍼셉트론(Multi-Layer Perceptron, MLP)을 살펴보자.

공장의 조립 라인을 상상해 보자. 이 조립 라인에서 한 작업자가 아이템을 받고, 약간의 조정을 하고, 다음 작업자에게 전달한다. 이 과정은 마지막 작업자가 아이템에 마무리 작업을 하고, 공장을 빠져나가는 벨트에 올려놓을 때까지 계속된다. 이 비유에서, 여러 “층”이 조립 라인에 존재하며, 제품은 작업자 간에 이동하면서 층을 이동한다. 조립 라인에는 입구와 출구가 있다.

다층 퍼셉트론은 매우 간단한 생산 라인으로 생각할 수 있다. 총 3개의 층으로 구성되어 있다: 입력 층, 은닉 층, 출력 층. 입력 층은 데이터가 MLP에 입력되는 곳이고, 은닉 층에서는 데이터를 처리하는 “작업자”들이 존재한다. 이 작업자들은 노드 또는 뉴런이라고 불리며, 데이터를 처리할 때 일련의 수학적 함수를 통해 조작한다.

네트워크 내에는 노드와 노드를 연결하는 구조가 있으며, 이를 “가중치”라고 한다. 가중치는 데이터 포인트가 네트워크를 통해 이동할 때 관련성이 있는지에 대한 가정이다. 즉, 가중치는 한 뉴런이 다른 뉴런에 미치는 영향의 수준을 반영한다. 가중치는 현재 노드를 떠날 때 “활성화 함수”를 통과한다. 이는 데이터를 변환하는 수학적 함수로, 선형 데이터를 비선형적인 표현으로 변환하여 네트워크가 복잡한 패턴을 분석할 수 있도록 한다.

인공 신경망에서 인간 뇌와의 유사성은 인간 뇌의 뉴런이 인공 신경망의 노드와 유사한 방식으로 연결되어 있기 때문이다.

다층 퍼셉트론은 1940년대부터 존재했지만, 몇 가지 제한으로 인해 특히 유용하지 않았다. 그러나過去 수십 년 동안 “역전파”라는 기술이 개발되어 네트워크가 뉴런의 가중치를 조정하여 더 효과적으로 학습할 수 있게 되었다. 역전파는 네트워크의 가중치를 변경하여 네트워크가 실제 데이터 내의 패턴을 더 잘 포착할 수 있도록 한다.

깊은 신경망

깊은 신경망은 기본적인 다층 퍼셉트론의 형태를 취하고, 중간에 더 많은 은닉 층을 추가하여 더 크게 만든다. 즉, 입력 층, 은닉 층, 출력 층이 아니라, 중간에 여러 개의 은닉 층이 존재하며, 한 은닉 층의 출력이 다음 은닉 층의 입력이 된다. 데이터가 네트워크를 통과하여 반환될 때까지 계속된다.

깊은 신경망의 여러 은닉 층은 전통적인 다층 퍼셉트론보다 더 복잡한 패턴을 해석할 수 있다. 깊은 신경망의 각 층은 데이터의 다른 부분의 패턴을 학습한다. 예를 들어, 입력 데이터가 이미지인 경우, 네트워크의 처음 부분은 픽셀의 밝기 또는 어둡기를 해석할 수 있으며, 나중에 층은 객체를 인식하는 데 사용할 수 있는 모양과 경계를 찾을 수 있다.

신경망의 다른 유형

신경망에는 여러 가지 유형이 있으며, 각 유형의 신경망에는 장단점이 존재한다(따라서 사용 사례도 다르다). 위에서 설명한 깊은 신경망 유형은 가장 일반적인 유형의 신경망이며, 종종 피드포워드 신경망이라고 한다.

신경망의 한 가지 변형은 순환 신경망(RNN)이다. 순환 신경망의 경우, 이전 분석 상태의 정보를 유지하기 위한 루핑 메커니즘이 사용되므로, 순서가 중요한 데이터를 해석할 수 있다. RNN은 순차적/연대기 데이터에서 패턴을 도출하는 데 유용하다. 순환 신경망은 단방향 또는 양방향일 수 있다. 양방향 신경망의 경우, 네트워크는 시퀀스의 나중에 있는 정보뿐만 아니라 이전 부분의 정보도 취할 수 있다. 양방향 RNN은 더 많은 정보를 고려하기 때문에 데이터에서 올바른 패턴을 더 잘 도출할 수 있다.

합성 신경망은 이미지 내의 패턴을 해석하는 데 전문적인 특수한 유형의 신경망이다. CNN은 이미지의 픽셀에 필터를 적용하여 이미지 내의 픽셀에 대한 수치적 표현을 얻은 다음, 이를 분석하여 패턴을 찾는다. CNN은 합성곱 층이 먼저 오고, 실제로 객체를 인식하는 밀접하게 연결된 피드포워드 층이 그 뒤를 따른다.

블로거이자 프로그래머로 Machine Learning Deep Learning 주제에 전문가입니다. 다니엘은 다른 사람들이 AI의 힘을 사회적善으로 사용하는 것을 돕기를 희망합니다.