Connect with us

Forscher suchen Unterstützung bei Neurowissenschaftlern, um Datensatzverzerrung zu überwinden

Ethik

Forscher suchen Unterstützung bei Neurowissenschaftlern, um Datensatzverzerrung zu überwinden

mm

Ein Team von Forschern an der MIT, der Harvard University und Fujitsu, Ltd. suchte nach Möglichkeiten, wie ein Machine-Learning-Modell Datensatzverzerrung überwinden kann. Sie vertrauten auf einen neuroscientifischen Ansatz, um zu untersuchen, wie Trainingsdaten die Fähigkeit eines künstlichen neuronalen Netzwerks beeinflussen, Objekte zu erkennen, die es noch nie gesehen hat. 

Die Forschung wurde in Nature Machine Intelligence veröffentlicht. 

Vielfalt in Trainingsdaten

Die Ergebnisse der Studie zeigten, dass die Vielfalt in Trainingsdaten die Fähigkeit eines neuronalen Netzwerks beeinflusst, Verzerrung zu überwinden. Allerdings kann Datenvielfalt auch negative Auswirkungen auf die Leistung des Netzwerks haben. Die Forscher zeigten auch, dass die Art und Weise, wie ein neuronales Netzwerk trainiert wird, ebenfalls beeinflusst, ob es eine voreingenommene Datensatz überwinden kann. 

Xavier Boix ist Forschungswissenschaftler in der Abteilung für Hirn- und Kognitionsforschung (BCS) und dem Zentrum für Gehirne, Geister und Maschinen (CBMM). Er ist auch Senior-Autor des Papiers. 

“Ein neuronales Netzwerk kann Datensatzverzerrung überwinden, was ermutigend ist. Aber die wichtigste Erkenntnis hier ist, dass wir die Datenvielfalt berücksichtigen müssen. Wir müssen aufhören, zu denken, dass die bloße Sammlung von Rohdaten uns irgendwohin bringt. Wir müssen sehr vorsichtig sein, wie wir Datensätze von Anfang an entwerfen”, sagt Boix.

Das Team nahm die Denkweise eines Neurowissenschaftlers an, um den neuen Ansatz zu entwickeln. Laut Boix ist es üblich, kontrollierte Datensätze in Experimenten zu verwenden, also baute das Team Datensätze, die Bilder von verschiedenen Objekten in verschiedenen Posen enthielten. Sie kontrollierten die Kombinationen, so dass einige Datensätze vielfältiger waren als andere. Ein Datensatz mit mehr Bildern, die Objekte nur aus einer Perspektive zeigen, ist weniger vielfältig, während ein Datensatz mit mehr Bildern, die Objekte aus mehreren Perspektiven zeigen, vielfältiger ist. 

Die Forscher nahmen diese Datensätze und verwendeten sie, um ein neuronales Netzwerk für die Bilderkennung zu trainieren. Sie untersuchten dann, wie gut es darin war, Objekte aus Perspektiven zu erkennen, die das Netzwerk während des Trainings nicht gesehen hatte. 

Sie fanden heraus, dass vielfältigere Datensätze es dem Netzwerk ermöglichen, neue Bilder oder Perspektiven besser zu generalisieren, und dies ist entscheidend, um Verzerrung zu überwinden. 

“Aber es ist nicht so, dass mehr Datenvielfalt immer besser ist; hier gibt es eine Spannung. Wenn das neuronale Netzwerk besser darin wird, neue Dinge zu erkennen, die es noch nie gesehen hat, dann wird es schwieriger für es, Dinge zu erkennen, die es bereits gesehen hat”, sagt Boix.

Methoden für das Training neuronaler Netzwerke

Das Team fand auch heraus, dass ein Modell, das separat für jede Aufgabe trainiert wird, besser in der Lage ist, Verzerrung zu überwinden, als ein Modell, das für beide Aufgaben zusammen trainiert wird. 

“Die Ergebnisse waren wirklich auffallend. Tatsächlich dachten wir beim ersten Mal, als wir dieses Experiment durchführten, es sei ein Fehler. Es dauerte uns mehrere Wochen, um zu realisieren, dass es ein echtes Ergebnis war, weil es so unerwartet war”, fährt Boix fort.

Eine tiefere Analyse zeigte, dass die Spezialisierung von Neuronen in diesem Prozess involviert ist. Wenn das neuronale Netzwerk trainiert wird, um Objekte in Bildern zu erkennen, entstehen zwei Arten von Neuronen. Ein Neuron spezialisiert sich auf die Erkennung der Objektkategorie, während das andere Neuron sich auf die Erkennung der Perspektive spezialisiert. 

Die spezialisierten Neuronen werden deutlicher, wenn das Netzwerk separat für jede Aufgabe trainiert wird. Wenn jedoch ein Netzwerk trainiert wird, um beide Aufgaben gleichzeitig auszuführen, werden einige Neuronen verwässert. Das bedeutet, dass sie sich nicht auf eine Aufgabe spezialisieren und eher verwirrt werden. 

“Aber die nächste Frage ist jetzt, wie diese Neuronen entstanden sind. Man trainiert das neuronale Netzwerk und sie entstehen aus dem Lernprozess. Niemand hat dem Netzwerk gesagt, diese Arten von Neuronen in seine Architektur aufzunehmen. Das ist das Faszinierende”, sagt Boix.

Die Forscher werden diese Frage in ihrer zukünftigen Arbeit untersuchen und den neuen Ansatz auf komplexere Aufgaben anwenden. 

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.