Augmented Reality

Die Zukunft von AR-Brillen ist künstlich intelligente gesteuert

mm

Fortschritte in der künstlichen Intelligenz dominieren das Mainstream-Gespräch. Anwendungen von KI scheinen endlos – und es ist kein Wunder, dass sie unsere Welt und unsere Interaktion mit ihr verändern werden. Neben vielen anderen Branchen gilt dies insbesondere für die erweiterte Realität.

KI-Modelle werden bereits verwendet, um immersive AR-Erfahrungen zu erstellen – insbesondere in Mobile-Device-Apps. Die Bereiche erweiterte Realität und künstliche Intelligenz arbeiten zusammen, um intuitive, einzigartige Erfahrungen zu schaffen, die die reale und digitale Welt noch besser verbinden. Die nächste Grenze in der Entwicklung von KI und AR ist die Implementierung fortschrittlicher KI-Fähigkeiten in Consumer-AR-Brillen, um die Möglichkeiten der immersiven Interaktion zu erweitern.

Generative KI wird die Erstellung von 3D-Welten beschleunigen und unbegrenzte Möglichkeiten für Träger schaffen, um ihre eigenen Realitäten zu erstellen

Generative KI umfasst Fortschritte in Algorithmen, Sprachmodellen und der erhöhten Rechenleistung, die erforderlich ist, um die notwendigen Berechnungen durchzuführen, um die physische Welt zu kartieren und zu interagieren.

Bisher gibt es Einschränkungen bei 3D-Modellen in AR-Brillen, da sie im Wesentlichen manuell sind. Generative KI würde diese jedoch sehr schnell und autonom erstellen. Generative KI in AR-Brillen wird dazu beitragen, 3D-Modelle schneller zu erstellen und das volle Potenzial von AR zu entfalten. Die Erstellung der digitalen Welt, um die physische Welt zu überlagern, wird schneller, vollständiger und immersiver, ohne dass intensive manuelle Arbeit erforderlich ist.

Generative KI wird auch die Benutzeroberfläche und die Interaktion mit dem physischen Raum verändern. Mit Generative-KI-fähigen AR-Brillen können Träger ihre Vorstellungen buchstäblich in die reale Welt übertragen. Ohne zu coden, können Träger die Spracherkennung verwenden, um ihre Bilder und 3D-Objekte durch ihre AR-Brillen genau so zu “sprechen”, wie sie es wollen. Sie könnten sagen: “Stell dir vor, es gibt einen Delfin, der durch den Raum schwimmt” – und er würde vor ihnen erscheinen. Die Möglichkeiten für diese Immersion sind virtuell unbegrenzt für Unterhaltung, Arbeit und darüber hinaus.

AR-Brillen, die Generative KI verwenden, werden auch die Gaming-Welt verändern, um ein noch immersiveres und personalisierteres Gaming-Erlebnis zu schaffen. Mit ChatGPT wird es beispielsweise einfacher, realistischere Charaktere zu erstellen und neue Quests oder Gaming-Welten hinzuzufügen. Es könnte auch verwendet werden, um das Gaming-Erlebnis zu verbessern, indem es das Verhalten der Spieler analysiert und das Spiel in Echtzeit einfacher oder herausfordernder für den Spieler macht, und das Erlebnis autonom anpasst.

KI-gestützte Übersetzung von Sprache + geschriebenem Text wird Sprachbarrieren reduzieren

Automatische Spracherkennung (ASR) verwendet neuronale Netze für audiovisuelle Spracherkennung (einen Algorithmus, der auf Bildverarbeitung basiert, um Text zu extrahieren). Dies kann geschriebenen Text – wie den auf einem Menü in einem fremden Land – in Echtzeit in die Muttersprache übersetzen.

Wenn es in AR-Brillen angewendet wird, kann es Echtzeit-Untertitel in der Muttersprache anzeigen, während jemand in einer anderen Sprache spricht – alles innerhalb der Rahmen der AR-Brillen. Dies eliminiert die Frustration von Touristen und Geschäftsleuten, die versuchen, in der lokalen Sprache zu kommunizieren, und fördert eine kommunikativere und kooperativere Welt.

Texterkennung und -übersetzung kombinieren KI-Optical-Character-Recognition-(OCR)-Techniken mit Text-zu-Text-Übersetzungsmotoren wie DeepL. KI-Engines wie Stable Diffusion können auch die Kommunikation mit Animationen oder anderen visuellen Hilfsmitteln ergänzen, die komplexe oder detaillierte Konzepte vermitteln können. Dies vertieft die Interaktion des Benutzers: Ein Paar AR-Brillen, das diese KI verwendet, kann ein entsprechendes Bild oder Video in Echtzeit anzeigen, das relevant für das ist, was der Benutzer vor einem Panel oder einer Präsentation sagt. Google hat kürzlich angekündigt, AR-Brillen mit dieser Funktionalität zu entwickeln.

Es ermöglicht auch der Gehörlosengemeinschaft, alltägliche Gespräche ohne Lippenlesen oder Augenkontakt zu führen, indem es Audio in Echtzeit in Untertitel umwandelt, die vor den Augen des Trägers angezeigt werden.

KI macht sich in der Gesundheitsversorgung, Bildung und zahlreichen anderen Bereichen bemerkbar. Bald werden wir intelligente AR-Brillen haben, die, wie in der populären Science-Fiction, Menschen in erweiterte oder virtuelle Realitäten transportieren, in denen KI schnell den Raum und die Position des Sprechers kartiert, um virtuelle Kommunikation nahtlos und weniger umständlich zu machen, unabhängig von der Position beider Parteien.

KI hilft AR-Brillen, Objekte in der realen Welt leicht zu erkennen und zu beschriften – und vertieft die Interaktion.

Convolutional Neural Network (CNN)-Algorithmen in der Objekterkennung werden derzeit in mobilen Geräten verwendet, um die Position und den Umfang von Objekten in einer Szene zu schätzen. Sobald es ein Objekt erkennt, kann die AR-Software Text darauf überlagern oder ein anderes Objekt in die physische Welt generieren und eine Interaktion zwischen den beiden erstellen. Objekte, die in die reale Welt übertragen werden, haben viele Anwendungen, einschließlich Anweisungen, Navigation, Ernährung und vielen anderen.

Wenn man ein Paar AR-Brillen mit diesen KI-Fähigkeiten trägt, kann man beispielsweise durch die Straßen einer Stadt gehen und in Echtzeit Informationen über jedes Wahrzeichen erhalten. Die AR-Brillen können das Wahrzeichen identifizieren, beschriften und Informationen über die Stadt und ihre Wahrzeichen liefern – alles durch die Brillen des Trägers. Wenn die Objekterkennungstechnologie verbessert wird, werden Ernährungsdaten wie Kalorien, Protein, Fett und Cholesterin für jedes Lebensmittel und jede Portionsgröße verfügbar sein. In der Zwischenzeit werden einfache QR-Codes auf Produkten die Ernährungsdetails für Benutzer anzeigen.

Außerhalb der reinen Objekterkennung wird auch Gesichtserkennungssoftware für die Erkennung von Menschen immer häufiger eingesetzt. Gesichtserkennung ist bereits im Flugzeugbau im Aufschwung, da immer mehr Flüge diese Technologie verwenden, um die Identität eines Passagiers zu bestätigen – und damit eine zusätzliche Sicherheitsebene hinzufügen und den Boardvorgang beschleunigen. Gesichtserkennung kann, wenn sie in AR-Brillen eingesetzt wird, dem Träger die Fähigkeit geben, Menschen überall zu erkennen. Beispielsweise können Sie in naher Zukunft mit AR-Brillen andere auf sozialen Medien treffen und ihre Hintergrundinformationen sofort erhalten, bevor Sie entscheiden, ob Sie sie “freunden” oder verbinden möchten.

KI-gestützte AR-Brillen verändern unser Leben und ihre visuellen und technischen Fähigkeiten werden weiter verbessert. In unserer immer mehr vernetzten Welt vereinfachen sie Aufgaben und brechen Barrieren, die vor nur wenigen Jahren undurchdringlich schienen. KI-Fortschritte kommen so schnell voran, dass KI in den nächsten 10 Jahren mehr Fortschritte machen wird als in den 50 Jahren davor. Ob es sich um die Regierung, das Geschäft oder eine persönliche Umgebung handelt, KI wird bald mit AR-Brillen verschmelzen, um unsere physische und digitale Umgebung zu verbinden.

Ari Grobman ist der CEO bei Lumus. Ari ist ein AR-Branchen-Veteran mit fast 15 Jahren Erfahrung in der Kommerzialisierung von Lumus-Optik. In seiner vorherigen Rolle bei Lumus als VP Business Development stellte Ari Lumus führenden Tech-Unternehmen auf der ganzen Welt vor. Er bringt eine Tiefe an AR-Branchenwissen in das Unternehmen.