Anslut dig till vÄrt nÀtverk!

Tanke ledare

Lokalisering av anvÀndare inomhus med visuell platsigenkÀnning

mm

Visuell platsigenkÀnning Àr en av hörnstenarna i utveckling av datorsyn och robotik. VPR-algoritmernas uppgift Àr att identifiera undersökta platser utifrÄn bilder. Tekniken kan stödja bÄde autonoma robotar och den mÀnskliga arbetskraften, identifiera omgivningar och underlÀtta utförandet av önskade ÄtgÀrder.

Forskare pÄ NeuroSYS anvÀnder datorseendealgoritmer som en del av den utvecklade AR-plattformen, Nsflow, vilket möjliggör interaktiva arbetsinstruktioner och praktisk utbildning för att identifiera anvÀndarpositioner samtidigt som man genomgÄr utbildning pÄ plats. I detta fall leder anvÀndningen av VPR till en betydande acceleration av onboarding- och inlÀrningsprocesser pÄ grund av ett minskat behov av förhandsutbildning och handledning.

Att lokalisera en person eller hitta den önskade platsen med hjĂ€lp av GPS Ă€r redan gamla nyheter. Men vad ska man göra nĂ€r det satellitbaserade navigationssystemet inte fungerar? Inomhuspositioneringssystem (IPS) kommer till undsĂ€ttning. 

NĂ€r du letar efter en nĂ„l i en höstack kan du anvĂ€nda dig av olika tekniker, inklusive beacons, magnetisk positionering, tröghetsmĂ€tenheter (IMU) med accelerometrar och gyroskop, mĂ€tning av rörelse frĂ„n den senast kĂ€nda punkten, wi-fi-baserad positionering, eller helt enkelt – anvĂ€nd visuella markörer. 

Alla ovanstĂ„ende metoder har sina brister (t.ex. behovet av att installera markörer eller beacons, IMU ökar mĂ€tfelet över tid och krĂ€ver ompositionering), som uppvĂ€ger deras fördelar. Lösningen som svarar pĂ„ det avgörande problemet – allmĂ€n anvĂ€ndares vistelseort med noggrannhet till nĂ€rmaste nĂ„gra meter – visar sig ligga inom algoritmernas ansvarsomrĂ„de. 

Ocuco-landskapet processen att kĂ€nna igen platser bygger pĂ„ en tvĂ„stegsprocedur som skapar tvĂ„ databaser. Inledningsvis fotograferas mĂ„lplatsen och vissa föremĂ„l, nyckelpunkter, markeras av en funktionsdetektor för att identifiera karakteristiska delar av omrĂ„det. EfterĂ„t jĂ€mförs de mĂ€rkta punkterna med en referensbild. NĂ€r de bedömda nyckelpunkterna bedöms vara tillrĂ€ckligt lika av en funktionsmatchare, kvalificerar bilden sig som att visa samma plats. 

Ocuco-landskapet bilddatabas kombinerar bilder av mĂ„lplatser, i det hĂ€r fallet, arbetsytor, och en uppsĂ€ttning av deras egenskaper inklusive unika identifierare, följt av lokala och globala beskrivningar. Den andra uppsĂ€ttningen, den rumsdatabas, matchar singulĂ€ra nyckelpunkter med vissa omrĂ„den i det betraktade utrymmet. 

Med hjĂ€lp av SuperPoint, SuperGlue och netVLAD neurala nĂ€tverk frĂ„n det visuella platsigenkĂ€nningsfĂ€ltet, anvĂ€nde forskare ovanstĂ„ende process i anvĂ€ndarlokalisering. De djupa neurala nĂ€tverken, SuperPoint och SuperGlue, samarbetar i funktionsdetektering och matchning och extraherar information frĂ„n databaserna. 

De globala deskriptorerna kommer in pÄ scenen

Processen krĂ€ver globala deskriptorer, som fungerar som vektorer som sĂ€rskiljer platsen, identifierar omrĂ„den pĂ„ ett sĂ€tt som inte uppvisar nĂ„gra oklarheter. För att uppfylla sin roll bör vektorerna vara belysnings- och synvinkelagnostiska – oavsett perspektiv och ljusförhĂ„llanden bör de globala deskriptorerna inte lĂ€mna nĂ„gra tvivel nĂ€r de sĂ€rskiljer platser i olika bilder. 

Dessutom bör variabla objekt som finns i omrĂ„det av intresse inte vara bundna av globala deskriptorer som egenskaper som sĂ€rskiljer platser. FöremĂ„l som möbler och utrustning Ă€r benĂ€gna att förĂ€ndras (ominredning, demontering), vilket innebĂ€r att de inte kan definiera omrĂ„den genom sin nĂ€rvaro. 

Datorvisionsdriven platsigenkĂ€nning förlitar sig pĂ„ permanenta delar av undersökta platser, som dörrar, fönster, trappor och andra utmĂ€rkande föremĂ„l av lĂ„ngvarig natur. Under den aktuella forskningen anvĂ€ndes det djupa neurala nĂ€tverket NetVLAD för berĂ€kningar och presenterade, som ett resultat, vektorer som uppfyller de uppstĂ€llda kraven. I processen med global deskriptormatchning bearbetas bilder av de mest lika vektorerna, efter berĂ€kningar av avstĂ„ndet mellan varje karakteristisk ankarpunkt. 

Vid bearbetning av tvĂ„ databaser – rumsdatabasen och den andra, som innehĂ„ller nyckelpunkter och globala deskriptorer – hanterar systemet bilders attribut. Efter att ha utfört likheterna och uppskattningen av kortaste avstĂ„nd, identifierar det andra neurala nĂ€tverket, SuperGlue, platsbilder. Systemet som anvĂ€nder VPR tillĂ„ter anvĂ€ndarlokalisering baserat, kort sagt, pĂ„ antalet matchande nyckelpunkter. 

Algoritmerna hittade applikationen i AI & AR-plattform, vilket hjĂ€lper anvĂ€ndare att utföra utbildning utrustad med smarta glasögon. VPR möjliggör lokalisering av praktikanter pĂ„ arbetsplatsen, lanserar lĂ€mpliga handledningar och guider tilldelade specifika platser, förbĂ€ttrar sĂ€kerheten och minskar behovet av direkt handledning. 

Projekt medfinansierat frÄn Europeiska unionens fonder under Europeiska regionala utvecklingsfonderna som en del av det operativa programmet för smart tillvÀxt. Projekt genomfört som en del av Nationellt centrum för forskning och utveckling: Fast Track.

Jowita Kessler Àr en polsk baserad teknikafficionado som arbetar som innehÄllsmarknadsföringsspecialist pÄ NeuroSYS. TvÄngsmÀssig lÀsare och författare, dedikerad till att utplÄna barriÀren mellan humaniora och teknik. Privat: dagdrömmare och nattvandrare, ett fan av katter och fladdermöss.