Connect with us

KI 101

Was sind Neuronale Netze?

mm

Was sind Künstliche Neuronale Netze (ANNs)?

Viele der größten Fortschritte im Bereich KI werden durch künstliche neuronale Netze angetrieben. Künstliche Neuronale Netze (ANNs) sind die Verbindung mathematischer Funktionen, die in einem Format verbunden sind, das von den neuronalen Netzen im menschlichen Gehirn inspiriert ist. Diese ANNs sind in der Lage, komplexe Muster aus Daten zu extrahieren, diese Muster auf unbekannte Daten anzuwenden, um die Daten zu klassifizieren/zu erkennen. Auf diese Weise “lernt” die Maschine. Das ist eine kurze Zusammenfassung über neuronale Netze, aber lassen Sie uns einen genaueren Blick auf neuronale Netze werfen, um besser zu verstehen, was sie sind und wie sie funktionieren.

Multi-Layer-Perceptron Erklärung

Bevor wir uns komplexeren neuronalen Netzen zuwenden, werden wir uns ein einfaches Modell eines ANNs ansehen, den Multi-Layer-Perceptron (MLP).

Stellen Sie sich eine Montagestraße in einer Fabrik vor. Auf dieser Montagestraße erhält ein Arbeiter ein Teil, macht einige Anpassungen daran und gibt es dann an den nächsten Arbeiter in der Straße weiter, der das Gleiche tut. Dieser Prozess wird fortgesetzt, bis der letzte Arbeiter in der Straße das Teil fertigstellt und es auf ein Band legt, das es aus der Fabrik transportiert. In dieser Analogie gibt es mehrere “Schichten” in der Montagestraße, und Produkte bewegen sich zwischen den Schichten, während sie von Arbeiter zu Arbeiter gehen. Die Montagestraße hat auch einen Eingangspunkt und einen Ausgangspunkt.

Ein Multi-Layer-Perceptron kann als eine sehr einfache Produktionslinie betrachtet werden, die aus drei Schichten besteht: einer Eingabeschicht, einer versteckten Schicht und einer Ausgabeschicht. Die Eingabeschicht ist der Ort, an dem die Daten in den MLP eingegeben werden, und in der versteckten Schicht werden die Daten von einer bestimmten Anzahl von “Arbeitern” bearbeitet, bevor sie an die Ausgabeschicht weitergegeben werden, die das Produkt an die Außenwelt liefert. Im Falle eines MLP werden diese Arbeiter “Neuronen” (oder manchmal Knoten) genannt, und wenn sie die Daten bearbeiten, manipulieren sie diese durch eine Reihe mathematischer Funktionen.

Innerhalb des Netzwerks gibt es Strukturen, die von Knoten zu Knoten verbinden, die als “Gewichte” bezeichnet werden. Gewichte sind eine Annahme darüber, wie Datenpunkte miteinander in Beziehung stehen, wenn sie durch das Netzwerk gehen. Um es anders auszudrücken, spiegeln die Gewichte das Maß des Einflusses wider, den ein Neuron auf ein anderes Neuron hat. Die Gewichte gehen durch eine “Aktivierungsfunktion”, wenn sie den aktuellen Knoten verlassen, was eine Art mathematische Funktion ist, die die Daten transformiert. Sie transformieren lineare Daten in nicht-lineare Darstellungen, was es dem Netzwerk ermöglicht, komplexe Muster zu analysieren.

Die Analogie zum menschlichen Gehirn, die durch “künstliches neuronales Netz” impliziert wird, kommt von der Tatsache, dass die Neuronen, die das menschliche Gehirn bilden, auf ähnliche Weise miteinander verbunden sind wie die Knoten in einem ANNs.

Obwohl Multi-Layer-Perceptrone seit den 1940er Jahren existieren, gab es eine Reihe von Einschränkungen, die sie daran hinderten, besonders nützlich zu sein. Allerdings wurde im Laufe der letzten paar Jahrzehnte eine Technik namens “Backpropagation” entwickelt, die es den Netzen ermöglichte, die Gewichte der Neuronen anzupassen und damit viel effektiver zu lernen. Backpropagation ändert die Gewichte im neuronalen Netz, was es dem Netz ermöglicht, die tatsächlichen Muster in den Daten besser zu erfassen.

Tiefe Neuronale Netze

Tiefe neuronale Netze nehmen die grundlegende Form des MLP und machen es größer, indem sie mehr versteckte Schichten in die Mitte des Modells hinzufügen. Anstatt einer Eingabeschicht, einer versteckten Schicht und einer Ausgabeschicht gibt es viele versteckte Schichten in der Mitte, und die Ausgaben einer versteckten Schicht werden die Eingaben für die nächste versteckte Schicht, bis die Daten das gesamte Netz durchlaufen haben und zurückgegeben wurden.

Die mehrfachen versteckten Schichten eines tiefen neuronalen Netzes sind in der Lage, komplexere Muster zu interpretieren als der traditionelle Multi-Layer-Perceptron. Verschiedene Schichten des tiefen neuronalen Netzes lernen die Muster verschiedener Teile der Daten. Wenn beispielsweise die Eingabedaten aus Bildern bestehen, kann der erste Teil des Netzes die Helligkeit oder Dunkelheit der Pixel interpretieren, während die späteren Schichten Formen und Kanten erkennen, die verwendet werden können, um Objekte im Bild zu erkennen.

Unterschiedliche Arten von Neuronalen Netzen

Es gibt verschiedene Arten von neuronalen Netzen, und jede der verschiedenen Arten von neuronalen Netzen hat ihre eigenen Vorteile und Nachteile (und daher ihre eigenen Anwendungsfälle). Die Art von tiefem neuronalen Netz, die oben beschrieben wurde, ist die häufigste Art von neuronalem Netz und wird oft als Feedforward-Neuronales Netz bezeichnet.

Eine Variante von neuronalen Netzen ist das Rekurrente Neuronale Netz (RNN). Im Falle von Rekurrenten Neuronalen Netzen werden Schleifmechanismen verwendet, um Informationen von vorherigen Zuständen der Analyse zu speichern, was bedeutet, dass sie Muster in Daten interpretieren können, bei denen die Reihenfolge wichtig ist. RNNs sind nützlich bei der Ableitung von Mustern aus sequenziellen/chronologischen Daten. Rekurrente Neuronale Netze können entweder einrichtungs- oder bidirektional sein. Im Falle eines bidirektionalen neuronalen Netzes kann das Netz Informationen aus späteren Teilen der Sequenz sowie aus früheren Teilen der Sequenz verwenden. Da das bidirektionale RNN mehr Informationen berücksichtigt, ist es besser in der Lage, die richtigen Muster aus den Daten abzuleiten.

Ein Convolutionales Neuronales Netz ist eine spezielle Art von neuronalem Netz, das darauf spezialisiert ist, die Muster in Bildern zu interpretieren. Ein CNN funktioniert, indem es einen Filter über die Pixel des Bildes legt und eine numerische Darstellung der Pixel im Bild erhält, die es dann auf Muster analysieren kann. Ein CNN ist so strukturiert, dass die konvolutionellen Schichten, die die Pixel aus dem Bild extrahieren, zuerst kommen, und dann die dicht verbundenen Feed-Forward-Schichten kommen, die tatsächlich lernen, Objekte zu erkennen.

Blogger und Programmierer mit Spezialisierungen in Machine Learning und Deep Learning Themen. Daniel hofft, anderen zu helfen, die Macht von KI für das soziale Wohl zu nutzen.