Stummel Multimodales Lernen wird bei KI-Entwicklern immer wichtiger – Unite.AI
Vernetzen Sie sich mit uns

Artificial Intelligence

Multimodales Lernen wird bei KI-Entwicklern immer wichtiger

mm
Aktualisiert on

Venture Beat (VB) widmete einen seiner wöchentlichen Berichte den Vorteilen multimodalen Lernens bei der Entwicklung künstlicher Intelligenz. Ihre Aufforderung war a berichten by ABI Research zu diesem Thema.

Das Schlüsselkonzept liegt darin, dass „„Datensätze sind grundlegende Bausteine ​​von KI-Systemen“, und ohne Datensätze „können Modelle die Beziehungen, die ihre Vorhersagen beeinflussen, nicht lernen.“ Der ABI-Bericht prognostiziert, dass „die insgesamt installierte Basis an KI-Geräten zwar von 2.69 Milliarden im Jahr 2019 auf 4.47 Milliarden im Jahr 2024 wachsen wird, kurzfristig aber vergleichsweise wenige interoperabel sein werden.“

„Das könnte eine erhebliche Zeit-, Energie- und Ressourcenverschwendung bedeuten“,Anstatt die Gigabytes bis Petabytes an Daten, die durch sie fließen, in einem einzigen KI-Modell oder Framework zusammenzufassen, arbeiten sie unabhängig und heterogen, um die ihnen zugeführten Daten zu verstehen.“

Um dieses Problem zu lösen, schlägt ABI vor Multimodales Lernen, eine Methodik, die konsolidieren könnte Daten „von verschiedenen Sensoren und Eingaben in ein einziges System. Multimodales Lernen kann ergänzende Informationen oder Trends vermitteln, die oft erst sichtbar werden, wenn sie alle in den Lernprozess einbezogen werden.“

VB präsentiert ein praktikables Beispiel, das Bilder und Textbeschriftungen berücksichtigt. „ Wenn unterschiedliche Wörter mit ähnlichen Bildern gepaart werden, werden diese Wörter wahrscheinlich zur Beschreibung derselben Dinge oder Objekte verwendet. Wenn umgekehrt einige Wörter neben verschiedenen Bildern erscheinen, bedeutet dies, dass diese Bilder dasselbe Objekt darstellen. Vor diesem Hintergrund sollte es einem KI-Modell möglich sein, Bildobjekte aus Textbeschreibungen vorherzusagen, und tatsächlich hat eine Reihe wissenschaftlicher Literatur dies bewiesen.“

Trotz der möglichen Vorteile stellt ABI fest, dass sogar Technologiegiganten es mögen  IBM, Microsoft, Amazon und Google konzentrieren sich weiterhin überwiegend auf unimodale Systeme. Einer der Gründe dafür sind die Herausforderungen, die ein solcher Wechsel mit sich bringen würde.

Dennoch gehen die ABI-Forscher davon aus, dass „Die Gesamtzahl der ausgelieferten Geräte wird von 3.94 Millionen im Jahr 2017 auf 514.12 Millionen im Jahr 2023 steigen, angetrieben durch die Akzeptanz in den Segmenten Robotik, Verbraucher, Gesundheitswesen sowie Medien und Unterhaltung.“ Als Beispiele nennen sie Unternehmen, die bereits multimodales Lernen implementieren Waymo das solche Ansätze nutzt, um „hyperbewusste selbstfahrende Fahrzeuge“ zu bauen und Intel Labs, wo das Ingenieurteam des Unternehmens „Techniken für die Erfassung von Sensordaten in realen Umgebungen untersucht“.

Omesh Tickoo, Chefingenieur von Intel Labs, erklärte dies gegenüber VB „Wir haben mithilfe von Techniken zur Ermittlung von Kontexten wie der Tageszeit ein System entwickelt, das Ihnen mitteilt, wenn die Daten eines Sensors nicht von höchster Qualität sind. Angesichts dieses Konfidenzwerts werden verschiedene Sensoren in unterschiedlichen Abständen gegeneinander abgewogen und die richtige Mischung ausgewählt, um uns die Antwort zu geben, nach der wir suchen.“

VB bemerkt das Unimodales Lernen wird weiterhin dort vorherrschen, wo es sehr effektiv ist – bei Anwendungen wie der Bilderkennung und der Verarbeitung natürlicher Sprache. Gleichzeitig wird prognostiziert, dass „multimodales Lernen wahrscheinlich nur noch an Bedeutung gewinnen wird, wenn die Elektronik billiger und die Rechenleistung skalierbarer wird“.

Ehemaliger Diplomat und Übersetzer für die UN, derzeit freiberuflicher Journalist/Autor/Forscher mit den Schwerpunkten moderne Technologie, künstliche Intelligenz und moderne Kultur.