stubbur Intel Labs þróar tölvusjón með tveimur nýjum gervigreindum gerðum - Unite.AI
Tengja við okkur

Tilkynningar

Intel Labs þróar tölvusjón með tveimur nýjum gervigreindum gerðum

mm

Útgefið

 on

VI-Depth 1.0 og MiDaS 3.1 opinn gervigreind líkön bæta dýptarmat fyrir tölvusjón.

Dýptarmat er krefjandi tölvusjónarverkefni sem þarf til að búa til fjölbreytt úrval af forritum í vélfærafræði, auknum veruleika (AR) og sýndarveruleika (VR). Núverandi lausnir eiga oft í erfiðleikum með að áætla fjarlægðir rétt, sem er afgerandi þáttur í því að hjálpa til við að skipuleggja hreyfingu og forðast hindranir þegar kemur að sjónrænum siglingum. Vísindamenn hjá Intel Labs takast á við þetta mál með því að gefa út tvö gervigreind líkön fyrir einlaga dýptarmat: eitt fyrir sjón-tregðu dýptarmat og eitt fyrir öflugt hlutfallslegt dýptarmat (RDE).

Nýjasta RDE líkanið, MiDaS útgáfa 3.1, spáir fyrir um sterka hlutfallslega dýpt með því að nota aðeins eina mynd sem inntak. Vegna þjálfunar sinnar á stóru og fjölbreyttu gagnasafni getur það á skilvirkan hátt framkvæmt fjölbreyttari verkefni og umhverfi. Nýjasta útgáfan af MiDaS bætir módelnákvæmni fyrir RDE um um 30% með stærra þjálfunarsetti og uppfærðum kóðunarstoð.

MiDaS hefur verið fellt inn í mörg verkefni, einkum Stable Diffusion 2.0, þar sem það gerir dýpt-til-mynd eiginleikann kleift sem ályktar um dýpt inntaksmyndar og býr síðan til nýjar myndir með því að nota bæði texta og dýptarupplýsingar. Til dæmis, stafrænn skapari Scottie Fox notaði blöndu af Stable Diffusion og MiDaS til að búa til 360 gráðu VR umhverfi. Þessi tækni gæti leitt til nýrra sýndarforrita, þar á meðal enduruppbyggingu glæpavettvangs fyrir dómsmál, lækningaumhverfi fyrir heilsugæslu og yfirgripsmikla leikjaupplifun.

Þó að RDE hafi góða alhæfanleika og sé gagnlegt, minnkar skortur á mælikvarða notagildi þess fyrir verkefni sem krefjast mælikvarða dýpt, svo sem kortlagningu, áætlanagerð, siglingar, hlutgreiningu, þrívíddaruppbyggingu og myndvinnslu. Vísindamenn hjá Intel Labs takast á við þetta mál með því að gefa út VI-Depth, annað gervigreind líkan sem veitir nákvæma dýptarmat.

VI-Depth er sjón-tregðu dýptarmatsleiðslu sem samþættir einlaga dýptarmat og sjón-tregðumælingar (VIO) til að framleiða þétt dýptarmat með mælikvarða. Þessi nálgun veitir nákvæma dýptarmat, sem getur aðstoðað við endurgerð vettvangs, kortlagningu og meðhöndlun hluta.

Innlimun tregðugagna getur hjálpað til við að leysa mælikvarða tvíræðni. Flest fartæki innihalda nú þegar tregðumælingareiningar (IMU). Alþjóðleg jöfnun ákvarðar viðeigandi hnattræna mælikvarða, en þéttur mælikvarði (SML) starfar á staðnum og ýtir eða togar svæði í átt að réttri mælikvarða. SML netið nýtir MiDaS sem burðarás fyrir kóðara. Í mátapípunni sameinar VI-Depth gagnadrifið dýptarmat við MiDaS hlutfallslegt dýptarspálíkan, ásamt IMU skynjara mælieiningunni. Samsetning gagnagjafa gerir VI-dýpt kleift að búa til áreiðanlegri þéttri mælidýpt fyrir hvern pixla í mynd.

MiDaS 3.1 og VI-dýpt 1.0 eru fáanlegar undir opnu MIT leyfi á GitHub.

Fyrir frekari upplýsingar, sjá „Vision Transformers fyrir þéttar spár"Og"Í átt að traustri einokunardýptarmati: Blöndun gagnasetta fyrir núllskot krossgagnaflutning. "

 

Daniel er mikill talsmaður þess hvernig gervigreind mun að lokum trufla allt. Hann andar að sér tækni og lifir til að prófa nýjar græjur.