Stummel Was sind neuronale Netze? - Unite.AI
Vernetzen Sie sich mit uns

AI 101

Was sind neuronale Netze?

mm
Aktualisiert on

Was sind künstliche neuronale Netze (ANNs)?

Viele der größten Fortschritte in der KI sind angetrieben durch künstliche neuronale Netze. Künstliche neuronale Netze (ANNs) sind die Verbindung mathematischer Funktionen, die in einem Format zusammengefügt werden, das von den neuronalen Netzen im menschlichen Gehirn inspiriert ist. Diese ANNs sind in der Lage, komplexe Muster aus Daten zu extrahieren und diese Muster auf unsichtbare Daten anzuwenden, um die Daten zu klassifizieren/erkennen. Auf diese Weise „lernt“ die Maschine. Das ist ein kurzer Überblick über neuronale Netze, aber werfen wir einen genaueren Blick auf neuronale Netze, um besser zu verstehen, was sie sind und wie sie funktionieren.

Mehrschichtiges Perzeptron erklärt

Bevor wir uns komplexere neuronale Netze ansehen, nehmen wir uns einen Moment Zeit und schauen uns eine einfache Version eines KNN an: ein Multi-Layer-Perceptron (MLP).

Stellen Sie sich ein Fließband in einer Fabrik vor. An diesem Fließband nimmt ein Arbeiter einen Artikel entgegen, nimmt einige Anpassungen daran vor und gibt ihn dann an den nächsten Arbeiter am Fließband weiter, der dasselbe tut. Dieser Vorgang wird fortgesetzt, bis der letzte Arbeiter in der Linie dem Artikel den letzten Schliff gibt und ihn auf ein Band legt, das ihn aus der Fabrik transportiert. In dieser Analogie gibt es mehrere „Schichten“ am Fließband, und Produkte bewegen sich zwischen den Schichten, während sie von Arbeiter zu Arbeiter gelangen. Die Montagelinie verfügt außerdem über einen Ein- und Ausstiegspunkt.

Ein mehrschichtiges Perzeptron kann man sich als eine sehr einfache Produktionslinie vorstellen, die aus insgesamt drei Schichten besteht: einer Eingabeschicht, einer verborgenen Schicht und einer Ausgabeschicht. In der Eingabeschicht werden die Daten in den MLP eingespeist, und in der verborgenen Schicht verarbeiten einige „Arbeiter“ die Daten, bevor sie sie an die Ausgabeschicht weitergeben, die das Produkt an die Außenwelt weitergibt. Im Fall eines MLP werden diese Arbeiter „Neuronen“ (manchmal auch Knoten) genannt, und wenn sie mit den Daten umgehen, manipulieren sie diese mithilfe einer Reihe mathematischer Funktionen.

Innerhalb des Netzwerks gibt es Strukturen, die Knoten mit Knoten verbinden und „Gewichte“. Gewichtungen sind eine Annahme darüber, wie Datenpunkte zusammenhängen, während sie sich durch das Netzwerk bewegen. Anders ausgedrückt: Gewichtungen spiegeln den Grad des Einflusses wider, den ein Neuron auf ein anderes Neuron hat. Die Gewichte durchlaufen beim Verlassen des aktuellen Knotens eine „Aktivierungsfunktion“, eine Art mathematische Funktion, die die Daten transformiert. Sie wandeln lineare Daten in nichtlineare Darstellungen um, wodurch das Netzwerk komplexe Muster analysieren kann.

Die mit dem „künstlichen neuronalen Netzwerk“ implizierte Analogie zum menschlichen Gehirn ergibt sich aus der Tatsache, dass die Neuronen, aus denen das menschliche Gehirn besteht, auf ähnliche Weise miteinander verbunden sind, wie Knoten in einem KNN miteinander verbunden sind.

Obwohl es seit den 1940er Jahren mehrschichtige Perzeptrone gibt, gab es eine Reihe von Einschränkungen, die sie daran hinderten, besonders nützlich zu sein. Im Laufe der letzten Jahrzehnte wurde jedoch eine Technik namens „Backpropagation„wurde geschaffen, die es Netzwerken ermöglichte, die Gewichte der Neuronen anzupassen und dadurch viel effektiver zu lernen. Durch Backpropagation werden die Gewichte im neuronalen Netzwerk geändert, sodass das Netzwerk die tatsächlichen Muster in den Daten besser erfassen kann.

Tiefe neuronale Netze

Tiefe neuronale Netze übernehmen die Grundform des MLP und vergrößern es, indem sie in der Mitte des Modells weitere verborgene Schichten hinzufügen. Anstelle einer Eingabeschicht, einer verborgenen Schicht und einer Ausgabeschicht gibt es also viele verborgene Schichten in der Mitte, und die Ausgaben einer verborgenen Schicht werden zu den Eingaben für die nächste verborgene Schicht, bis die Daten den gesamten Weg erreicht haben über das Netzwerk gesendet und zurückgegeben.

Die mehreren verborgenen Schichten eines tiefen neuronalen Netzwerks sind in der Lage, komplexere Muster zu interpretieren als das herkömmliche mehrschichtige Perzeptron. Verschiedene Schichten des tiefen neuronalen Netzwerks lernen die Muster verschiedener Teile der Daten. Wenn die Eingabedaten beispielsweise aus Bildern bestehen, könnte der erste Teil des Netzwerks die Helligkeit oder Dunkelheit von Pixeln interpretieren, während die späteren Schichten Formen und Kanten auswählen, die zur Erkennung von Objekten im Bild verwendet werden können.

Verschiedene Arten neuronaler Netze

Es gibt verschiedene Arten neuronaler Netze, und jeder der verschiedenen neuronalen Netztypen hat seine eigenen Vor- und Nachteile (und daher seine eigenen Anwendungsfälle). Der oben beschriebene Typ eines tiefen neuronalen Netzwerks ist der häufigste Typ eines neuronalen Netzwerks und wird oft als Feedforward-Neuronales Netzwerk bezeichnet.

Eine Variante neuronaler Netze ist das Recurrent Neural Network (RNN). Bei wiederkehrenden neuronalen Netzen werden Schleifenmechanismen verwendet, um Informationen aus früheren Analysezuständen zu speichern, was bedeutet, dass sie Daten dort interpretieren können, wo es auf die Reihenfolge ankommt. RNNs sind nützlich, um Muster aus sequentiellen/chronologischen Daten abzuleiten. Wiederkehrende neuronale Netze können entweder unidirektional oder bidirektional sein. Im Fall eines bidirektionalen neuronalen Netzwerks kann das Netzwerk Informationen sowohl von späteren als auch von früheren Abschnitten der Sequenz übernehmen. Da das bidirektionale RNN mehr Informationen berücksichtigt, ist es besser in der Lage, die richtigen Muster aus den Daten zu ziehen.

Ein Convolutional Neural Network ist eine spezielle Art von neuronalem Netzwerk, das in der Lage ist, die in Bildern gefundenen Muster zu interpretieren. Ein CNN funktioniert, indem es einen Filter über die Pixel des Bildes leitet und eine numerische Darstellung der Pixel innerhalb des Bildes erhält, die es dann auf Muster analysieren kann. Ein CNN ist so strukturiert, dass zuerst die Faltungsschichten kommen, die die Pixel aus dem Bild ziehen, und danach die dicht verbundenen Feed-Forward-Schichten, die tatsächlich lernen, Objekte zu erkennen.

Blogger und Programmierer mit Spezialisierung auf Maschinelles lernen und Tiefes Lernen Themen. Daniel hofft, anderen dabei zu helfen, die Macht der KI für das soziale Wohl zu nutzen.