KI 101
Was ist Machine Learning?

Machine Learning ist eines der am schnellsten wachsenden technologischen Felder, aber trotz der Häufigkeit, mit der die Wörter “Machine Learning” verwendet werden, kann es schwierig sein, zu verstehen, was Machine Learning genau ist.
Machine Learning bezieht sich nicht auf nur eine Sache, es ist ein Oberbegriff, der auf viele verschiedene Konzepte und Techniken angewendet werden kann. Das Verständnis von Machine Learning bedeutet, mit verschiedenen Formen der Modellanalyse, Variablen und Algorithmen vertraut zu sein. Lassen Sie uns einen genaueren Blick auf Machine Learning werfen, um besser zu verstehen, was es umfasst.
Was Ist Machine Learning?
Während der Begriff Machine Learning auf viele verschiedene Dinge angewendet werden kann, bezieht er sich im Allgemeinen auf die Fähigkeit, einen Computer dazu zu bringen, Aufgaben ohne explizite schrittweise Anweisungen auszuführen. Ein Machine-Learning-Spezialist muss nicht alle notwendigen Schritte aufschreiben, um das Problem zu lösen, da der Computer in der Lage ist, durch die Analyse von Mustern in den Daten und die Verallgemeinerung dieser Muster auf neue Daten zu “lernen”.
Machine-Learning-Systeme haben drei grundlegende Teile:
- Eingaben
- Algorithmen
- Ausgaben
Die Eingaben sind die Daten, die in das Machine-Learning-System eingegeben werden, und die Eingabedaten können in Labels und Features unterteilt werden. Features sind die relevanten Variablen, die analysiert werden, um Muster zu erkennen und Schlussfolgerungen zu ziehen. Die Labels sind Klassen/Beschreibungen, die den einzelnen Instanzen der Daten zugewiesen werden.
Features und Labels können in zwei verschiedenen Arten von Machine-Learning-Problemen verwendet werden: überwachtem Lernen und unüberwachtem Lernen.
Unüberwachtes vs. Überwachtes Lernen
Bei überwachtem Lernen wird die Eingabedaten von einer Grundwahrheit begleitet. Überwachte Lernprobleme haben die korrekten Ausgabewerte als Teil des Datensatzes, sodass die erwarteten Klassen im Voraus bekannt sind. Dies ermöglicht es dem Datenwissenschaftler, die Leistung des Algorithmus zu überprüfen, indem er die Daten auf einem Testdatensatz testet und sieht, wie viele Elemente korrekt klassifiziert wurden.
Im Gegensatz dazu haben unüberwachte Lernprobleme keine Grundwahrheitslabels. Ein Machine-Learning-Algorithmus, der für die Ausführung von unüberwachten Lernaufgaben trainiert wird, muss in der Lage sein, die relevanten Muster in den Daten selbst zu erkennen.
Überwachte Lernalgorithmen werden typischerweise für Klassifizierungsprobleme verwendet, bei denen ein großer Datensatz mit Instanzen vorliegt, die in eine der vielen verschiedenen Klassen eingeteilt werden müssen. Eine andere Art von überwachtem Lernen ist eine Regressionsaufgabe, bei der der Ausgabewert des Algorithmus kontinuierlich ist und nicht kategorial.
Unüberwachte Lernalgorithmen werden für Aufgaben wie Dichteschätzung, Clustering und Repräsentationslernen verwendet. Diese drei Aufgaben erfordern, dass das Machine-Learning-Modell die Struktur der Daten ableitet, es gibt keine vordefinierten Klassen, die dem Modell zugewiesen werden.
Lassen Sie uns einen kurzen Blick auf einige der häufigsten Algorithmen werfen, die in überwachtem und unüberwachtem Lernen verwendet werden.
Arten von überwachtem Lernen
Häufige überwachte Lernalgorithmen umfassen:
- Naiver Bayes
- Support-Vektor-Maschinen
- Logistische Regression
- Zufällige Wälder
- Künstliche Neuronale Netze
Support-Vektor-Maschinen sind Algorithmen, die einen Datensatz in verschiedene Klassen unterteilen. Datenpunkte werden in Cluster gruppiert, indem Linien gezogen werden, die die Klassen voneinander trennen. Punkte, die auf einer Seite der Linie gefunden werden, gehören zu einer Klasse, während die Punkte auf der anderen Seite der Linie eine andere Klasse sind. Support-Vektor-Maschinen zielen darauf ab, den Abstand zwischen der Linie und den Punkten auf beiden Seiten der Linie zu maximieren, und je größer der Abstand, desto sicherer ist der Klassifizierer, dass der Punkt zu einer Klasse und nicht zu einer anderen Klasse gehört.
Logistische Regression ist ein Algorithmus, der für binäre Klassifizierungsprobleme verwendet wird, bei denen Datenpunkte als gehörend zu einer von zwei Klassen klassifiziert werden müssen. Logistische Regression funktioniert, indem der Datenpunkt entweder mit 1 oder 0 beschriftet wird. Wenn der wahrgenommene Wert des Datenpunkts 0,49 oder niedriger ist, wird er als 0 klassifiziert, während er als 1 klassifiziert wird, wenn er 0,5 oder höher ist.
Entscheidungsbäume funktionieren, indem sie Datensätze in kleinere und kleinere Fragmente unterteilen. Die genauen Kriterien, die zur Unterteilung der Daten verwendet werden, sind dem Machine-Learning-Ingenieur überlassen, aber das Ziel ist es letztendlich, die Daten in einzelne Datenpunkte zu unterteilen, die dann mit einem Schlüssel klassifiziert werden.
Ein Random-Forest-Algorithmus ist im Wesentlichen eine Kombination aus vielen einzelnen Entscheidungsbäumen, die zu einem leistungsfähigeren Klassifizierer verknüpft sind.
Der Naive-Bayes-Klassifizierer berechnet die Wahrscheinlichkeit, dass ein gegebener Datenpunkt auftritt, basierend auf der Wahrscheinlichkeit, dass ein vorheriges Ereignis auftritt. Er basiert auf dem Bayes-Theorem und ordnet die Datenpunkte basierend auf ihrer berechneten Wahrscheinlichkeit Klassen zu. Beim Implementieren eines Naive-Bayes-Klassifizierers wird angenommen, dass alle Prädiktoren den gleichen Einfluss auf das Klassen-Ergebnis haben.
Ein künstliches Neuronales Netz oder ein mehrschichtiges Perzeptron sind Machine-Learning-Algorithmen, die von der Struktur und Funktion des menschlichen Gehirns inspiriert sind. Künstliche Neuronale Netze bestehen aus vielen miteinander verbundenen Knoten/Neuronen. Jedes Neuron manipuliert die Daten mit einer mathematischen Funktion. In künstlichen Neuronalen Netzen gibt es Eingabelayer, versteckte Layer und Ausgabelayer.
Der versteckte Layer des Neuronalen Netzes ist der Ort, an dem die Daten tatsächlich interpretiert und auf Muster analysiert werden. Mit anderen Worten, es ist der Ort, an dem der Algorithmus lernt. Je mehr Neuronen miteinander verbunden sind, desto komplexer sind die Netze und desto komplexer sind die Muster, die sie lernen können.
Arten von unüberwachtem Lernen
Unüberwachte Lernalgorithmen umfassen:
- K-Means-Clustering
- Autoencoder
- Principal-Component-Analyse
K-Means-Clustering ist eine unüberwachte Klassifizierungstechnik und funktioniert, indem Punkte von Daten in Cluster oder Gruppen unterteilt werden, basierend auf ihren Features. K-Means-Clustering analysiert die Features in den Datenpunkten und unterscheidet Muster in ihnen, die die Datenpunkte in einer gegebenen Klasse cluster mehr ähnlich machen als sie es zu Clustern mit anderen Datenpunkten sind. Dies wird erreicht, indem mögliche Zentren für den Cluster oder Zentroide in einem Graphen der Daten platziert und die Position des Zentroids so lange neu zugewiesen wird, bis eine Position gefunden wird, die den Abstand zwischen dem Zentroid und den Punkten, die zu diesem Zentroid gehören, minimiert. Der Forscher kann die gewünschte Anzahl von Clustern angeben.
Principal-Component-Analyse ist eine Technik, die eine große Anzahl von Features/Variablen auf einen kleineren Features-Raum/Variablen reduziert. Die “Hauptkomponenten” der Datenpunkte werden für die Erhaltung ausgewählt, während die anderen Features in eine kleinere Darstellung komprimiert werden. Die Beziehung zwischen den ursprünglichen Datenpunkten wird beibehalten, aber da die Komplexität der Datenpunkte einfacher ist, sind die Daten einfacher zu quantifizieren und zu beschreiben.
Autoencoder sind Versionen von Neuronalen Netzen, die auf unüberwachte Lernaufgaben angewendet werden können. Autoencoder sind in der Lage, unbeschriftete, freie Daten zu nehmen und sie in Daten umzuwandeln, die ein Neuronales Netz verwenden kann, im Wesentlichen eigene beschriftete Trainingsdaten erstellen. Das Ziel eines Autoencoders ist es, die Eingabedaten zu konvertieren und sie so genau wie möglich wieder aufzubauen, sodass es im Interesse des Netzwerks liegt, zu bestimmen, welche Features am wichtigsten sind und sie zu extrahieren.












