Connect with us

Augmented reality

Fremtiden for AR-briller er AI-aktiveret

mm

Fremgang i kunstig intelligens dominerer den mainstream-samtale. Anvendelser af AI synes ubegrænsede – og det er ikke overraskende, at det vil forandre vores verden og hvordan vi interagerer med den. Sammen med mange andre industrier, gælder det især for forstærket virkelighed.

AI-modeller bruges allerede til at opbygge immersive AR-oplevelser – især på mobile enhedsapps. Områderne for forstærket virkelighed og kunstig intelligens arbejder sammen om at skabe intuitive, unikke oplevelser, der mere fuldstændigt blander den virkelige og digitale verden. Den næste front i AI- og AR-udvikling er at implementere avancerede AI-funktioner i forbruger-AR-briller for at udvide mulighederne for immersive engagement.

Generativ AI vil accelerere skabelsen af 3D-verdener, og skabe ubegrænsede muligheder for brugere at skabe deres egne realiteter

Generativ AI indebærer fremgang i algoritmer, sprogmodeller og den øgede proceskraft, der er til rådighed for at køre de nødvendige beregninger for at kortlægge og interagere med den fysiske verden.

Indtil dato, er der begrænsninger på 3D-modeller i AR-briller, fordi de i virkeligheden er manuelle. Men Generativ AI ville skabe disse meget hurtigt og autonomt. Generativ AI i AR-briller vil hjælpe med at bygge 3D-modeller hurtigere, og låse den fulde potentiale af AR op. Skabelsen af den digitale verden for at overlagre den fysiske verden, vil være hurtigere, mere fuldstændig og immersiv uden intensiv manuel arbejdskraft, der er nødvendig.

Generativ AI vil også forandre brugeroplevelsen og hvordan vi interagerer med fysisk rum. Med Generativ AI-aktiverede AR-briller, kan brugere bogstaveligt talt overføre deres forestillinger til den virkelige verden. Uden at skulle kode, kan brugere bruge talegenkendelse til at ‘sige’ deres billeder og 3D-objekter gennem deres AR-briller præcis, som de ønsker det. De kunne sige: “Forestil dig, at der er en delfin, der svømmer gennem rummet” – og det ville dukke op foran dem. Mulighederne for denne immersion er næsten ubegrænsede for underholdning, arbejde og andet.

AR-briller, der anvender Generativ AI, vil også forandre spilverdenen for at skabe en langt mere immersiv og personlig spiloplevelse. For eksempel, med ChatGPT, vil det være nemmere at skabe mere realistiske karakterer og tilføje nye quests eller spilverdener. Det kunne også bruges til at forbedre spiloplevelsen ved at analysere spilleradfærd og gøre spillet lettere eller mere udfordrende for spilleren i realtid, og tilpasse oplevelsen autonomt.

AI-aktiveret oversættelse af tale + skrevet tekst vil reducere sprogbarrierer

Automatisk talegenkendelse (ASR) bruger neurale netværksaudiovisuel talegenkendelse (en algoritme, der afhænger af billedbehandling til at trække tekst ud). Dette kan oversætte skrevet tekst – som på en menu i et fremmed land – til din modersmål i realtid.

Når det anvendes i AR-briller, kan det give realtids-undertekster på dit modersmål, mens nogen taler på et andet sprog – alt inden for rammerne af dine AR-briller. Dette eliminerer frustrationen hos turister og forretningsfolk, der forsøger at kommunikere på det lokale sprog, og skaber således en mere kommunikativ og samarbejdende verden.

Tekstgenkendelse og oversættelse kombinerer AI-optisk tegnkendelse (OCR)-teknikker med tekst-til-tekst-oversættelsesmotorer som DeepL. AI-motorer som Stable Diffusion kan også udvide kommunikationen med animationer eller andre visuelle hjælpemidler, der kan hjælpe med at overføre komplekse eller detaljerede begreber. Dette dykker brugerens engagement: et par AR-briller, der anvender denne AI, kan vise en relevant billed- eller video i realtid, der er relevant for, hvad brugeren siger foran dem på en panelet eller præsentation. Google har nyligt teaset udvikling af AR-briller med denne funktionalitet.

Det aktiverer også døve samfundet til at deltage i hverdagslige samtaler uden at skulle læse på læber eller opretholde øjenkontakt ved at omdanne lyd til undertekster, der vises foran brugerens øjne.

AI er ved at gøre sin tilstedeværelse kendt i sundhedssektoren, uddannelsessektoren og mange andre områder. Snart vil vi have smarte AR-briller, der, ligesom populær science fiction, vil transportere mennesker ind i forstærkede eller virtuelle realitetsmiljøer, hvor AI hurtigt kortlægger rummet og talerens position for at gøre virtuel kommunikation problemfri og mindre besværlig, uanset hvor begge parter er placeret.

AI hjælper AR-briller med at lette og mærke objekter i den virkelige verden – dybere engagement.

Konvolutionsneurale netværksalgoritmer (CNN) i objektgenkendelse bruges i øjeblikket i mobile enheder til at estimere positionen og omfanget af objekter inden for en scene. Når det genkender et objekt, kan AR-software overlagre tekst på det eller generere et andet objekt ind i den fysiske verden og skabe en interaktion mellem de to. Objekter, der overføres ind i den virkelige verden, har mange anvendelser, herunder instruktion, navigation, kost og ernæring, og mange andre.

Når man bærer et par AR-briller med disse AI-funktioner, kan brugeren for eksempel gå gennem gaderne i en hvilken som helst by og lære om enhver vartegn i realtid, når de ser på det. AR-brillerne kan identificere, mærke og give information om byen og dets vartegn – alt gennem brugerens rammer. Da objektgenkendelsesteknologien forbedres, vil næringsdata som kalorier, protein, fedt og kolesterol for enhver mad og portion være tilgængelig. I mellemtiden vil simple QR-koder på produkter fremkalde næringsdetaljer for brugere.

Uden for rent objektgenkendelse er ansigtsgenkendelsessoftware også ved at blive almindelig for menneskegenkendelse. Allerede nu tager ansigtsgenkendelse af i flyindustrien, da flere fly bruger teknologien til at bekræfte en passagers identitet – og tilføjer således et ekstra sikkerhedslag og accelererer boardingprocessen. Ansigtsgenkendelse, når det anvendes i AR-briller, kunne give genkendelsesevnen til brugere overalt. For eksempel kan man i nærmeste fremtid med AR-briller mødes med andre på sociale medier og modtage deres baggrundsinformation øjeblikkeligt, før man beslutter, om man vil ‘venne’ eller forbinde sig med dem.

Ari Grobman er CEO hos Lumus. Ari er en AR-industri-veteran med næsten 15 års erfaring med at commercialisere Lumus-optik. I hans tidligere rolle hos Lumus som VP for forretningsudvikling, introducerede Ari Lumus til førende tech-virksomheder verden over. Han bringer en dybde af AR-industri-kendskab til virksomheden.