Kunsmatige Intelligensie
NeRF: Opleiding van drones in neurale uitstralingsomgewings
Navorsers van Stanford Universiteit het 'n nuwe manier bedink om hommeltuie op te lei om fotorealistiese en hoogs akkurate omgewings te navigeer, deur gebruik te maak van die onlangse stortvloed van belang in Neural Radiance Fields (NeRF).
Die metode bied die moontlikheid vir interaktiewe opleiding van hommeltuie (of ander soorte voorwerpe) in virtuele scenario's wat outomaties volume-inligting insluit (om botsingsvermyding te bereken), tekstuur wat direk vanaf werklike foto's getrek word (om hommeltuie se beeldherkenningsnetwerke te help oplei in 'n meer realistiese manier), en werklike beligting (om te verseker dat 'n verskeidenheid beligtingscenario's in die netwerk opgelei word, en vermy oorpassing of ooroptimalisering van die oorspronklike momentopname van die toneel).
Tipiese NeRF-implementerings het nie trajekmeganismes nie, aangesien die meeste van die rits NeRF-projekte die afgelope 18 maande op ander uitdagings gekonsentreer het, soos bv. toneel herverligting, weerkaatsing, compositing en ontknoping van vasgelegde elemente. Daarom is die nuwe koerant se primêre innovasie om 'n NeRF-omgewing as 'n bevaarbare ruimte te implementeer, sonder die uitgebreide toerusting en moeisame prosedures wat nodig sou wees om dit as 'n 3D-omgewing te modelleer gebaseer op sensorvaslegging en CGI-rekonstruksie.
NeRF as VR/AR
Die nuwe papier is getiteld Visie-alleen robotnavigasie in 'n neurale uitstralingswêreld, en is 'n samewerking tussen drie Stanford-departemente: Lugvaartkunde en Ruimtevaartkunde, Meganiese Ingenieurswese en Rekenaarwetenskap.
Die werk stel 'n navigasieraamwerk voor wat 'n robot voorsien van 'n vooraf-opgeleide NeRF-omgewing, waarvan die volumedigtheid moontlike paaie vir die toestel afbaken. Dit sluit ook 'n filter in om te skat waar die robot in die virtuele omgewing is, gebaseer op beeldherkenning van die robot se RGB-kamera aan boord. Op hierdie manier is 'n hommeltuig of robot in staat om meer akkuraat te 'hallusineer' wat hy kan verwag om in 'n gegewe omgewing te sien.
Omdat 'n NeRF-omgewing volledig gemodelleerde okklusies bevat, kan die hommeltuig leer om obstruksies makliker te bereken, aangesien die neurale netwerk agter die NeRF die verhouding tussen verstoppings en die manier waarop die hommeltuig se visie-gebaseerde navigasiestelsels aan boord die omgewing waarneem, kan karteer. Die geoutomatiseerde NeRF-generasie-pyplyn bied 'n relatief onbenullige metode om hiper-regte opleidingsruimtes met slegs 'n paar foto's te skep.
Die Stanford-inisiatief is van die eerstes wat die moontlikhede oorweeg om 'n NeRF-ruimte te verken in die konteks van 'n bevaarbare en meeslepende VR-styl omgewing. Neural Radiance-velde is 'n opkomende tegnologie, en tans onderhewig aan veelvuldige akademiese pogings om hul hoë rekenaarhulpbronvereistes te optimaliseer, sowel as om die vasgelegde elemente te ontwrig.
Nerf is nie (regtig) CGI nie
Omdat 'n NeRF-omgewing 'n navigeerbare 3D-toneel is, het dit 'n misverstaan tegnologie geword sedert die ontstaan daarvan in 2020, wat dikwels algemeen beskou word as 'n metode om die skepping van maas en teksture te outomatiseer, eerder as om 3D-omgewings te vervang wat bekend is aan kykers van Hollywood VFX-afdelings en die fantastiese tonele van Augmented Reality en Virtual Reality omgewings.
Trouens, die NeRF-omgewing is meer soos 'n 'lewendige' weergawe-ruimte, waar 'n samesmelting van pixel- en beligtingsinligting behou en navigeer word in 'n aktiewe en lopende neurale netwerk.
Die sleutel tot NeRF se potensiaal is dat dit slegs 'n beperkte aantal beelde benodig om omgewings te herskep, en dat die gegenereerde omgewings alle nodige inligting bevat vir 'n hoë-getrou rekonstruksie, sonder die behoefte aan die dienste van modelbouers, tekstuurkunstenaars, beligting spesialiste en die hordes ander bydraers tot 'tradisionele' CGI.
Semantiese segmentering
Selfs al is NeRF effektief 'Rekenaar-gegenereerde beelde' (CGI), bied dit 'n heeltemal ander metodologie, en 'n hoogs-outomatiese pyplyn. Daarbenewens kan NeRF bewegende dele van 'n toneel isoleer en 'inkapsuleer', sodat hulle bygevoeg, verwyder, bespoedig kan word en in die algemeen as diskrete fasette in 'n virtuele omgewing kan funksioneer – 'n vermoë wat ver verby die huidige toestand van- die kuns in 'n 'Hollywood'-interpretasie van wat CGI is.
Negatief, NeRF se argitektuur is 'n bietjie van 'n 'black box'; dit is nie tans moontlik om 'n voorwerp uit 'n NeRF-omgewing te onttrek en dit direk te manipuleer met tradisionele maas- en beeldgebaseerde gereedskap nie, alhoewel 'n aantal navorsingspogings begin om deurbrake te maak in die dekonstruering van die matriks agter NeRF se neurale netwerk lewendige lewering omgewings.