cung Stephen Miller, Bashkëthemelues dhe SVP i Inxhinierisë në Fyusion - Seria e Intervistave - Unite.AI
Lidhu me ne

intervistat

Stephen Miller, Bashkëthemelues dhe SVP i Inxhinierisë në Fyusion – Seria e Intervistave

mm

Publikuar

 on

Stephen Miller është bashkëthemeluesi dhe SVP i Inxhinierisë në Fusion, një kompani e imazheve 3D dhe vizionit kompjuterik, pjesë e grupit Cox Automotive. Para themelimit të Fyusion, ai ishte student i doktoraturës në Universitetin Stanford duke studiuar Shkenca Kompjuterike dhe ka punuar në robotikë personale si palosja e rrobave dhe lidhja kirurgjikale e nyjeve gjatë studimeve të tij universitare në UC Berkeley. Ai është një bashkëpunëtor i Google Hertz, i SAP Stanford Graduate Fellow dhe i diplomuar në NSF Fellow.

A mund të shpjegoni se çfarë është Fyusion dhe si mundëson kapjen dhe vizualizimin e lehtë të të dhënave 3D?

Fusion është një kompani e vizionit kompjuterik që ofron përvoja 3D të klientëve të drejtuar nga AI. Ne u mundësojmë njerëzve të kapin imazhe 3D nëpërmjet një aplikacioni të thjeshtë smartphone që funksionon në shumicën e pajisjeve Android dhe iOS. Aplikacioni ka udhëzime hap pas hapi dhe është krijuar për t'u përdorur nga kushdo, pavarësisht nga aftësitë teknike. Duhen një ose dy minuta për të kapur imazhin. Nga atje motori ynë i AI, ALIS, mund të analizojë imazhet 3D dhe t'i kthejë ato të dhëna vizuale në informacione të zbatueshme. Tani për tani ne jemi të fokusuar në përdorimin e imazheve 3D për të diagnostikuar dëmtimet e jashtme të makinave.

A mund të shpjegoni se si algoritmet përdorin formatin e skedarit .fyuse për të mundësuar një kamerë të vetme smartphone për të krijuar imazhe 3d?

Më duket e dobishme të shqyrtoj formatin .fyuse krahas fotove dhe videove. Një foto kap një moment në kohë nga një kënd fiks dhe një video kap një seri të atyre momenteve në një vijë kohore lineare. Në të kundërt, një imazh .fyuse kap atë që ne duam ta quajmë "një moment në hapësirë". Një shikues nuk është i kufizuar në një kënd të vetëm ose në një vijë kohore lineare: ata mund të shohin jo vetëm njërën anë të diçkaje, por edhe rreth saj.

Për të krijuar një imazh .fyuse, fotografi rrethon subjektin e tij në një drejtim me një kamerë celulari. Nga ana tjetër, teknologjia Fyusion është gjithashtu e përputhshme me zgjidhjet e imazhit fiks dhe zgjidhjet jo tradicionale të imazhit si dronët.

Formati ynë i skedarit .fyuse është ai që i jep jetë këtyre imazheve. Është i lehtë dhe mundëson interaktivitet kompleks dhe shumëplanësh. Është gjithashtu plotësisht i pajtueshëm me laptopët, tabletët dhe telefonat inteligjentë që përdoruesi i përditshëm i ka tashmë në arsenalin e tij.

A mund të diskutoni disa nga të dhënat që kapen dhe analizohen me Fyusion?

Me makina, ALIS njeh çdo pjesë të automjetit dhe më pas mund të përcaktojë se ku ka dëmtim, madhësinë dhe ashpërsinë e dëmtimit dhe eliminon efektet e mundshme false, të tilla si papastërtitë e nxjerra nga rruga. Teknologjia që kemi zhvilluar dhe patentuar mund të zgjidhë probleme të tjera, por kjo është ajo në të cilën jemi fokusuar tani.

A mund të diskutoni se çfarë është Paketa e Informacionit Lightfield (ALIS) e bazuar në AI?

ALIS është motori pas çdo produkti Fyusion. Ai mundëson imazhe të lehta 3D dhe kuptim të thellë vizual. Janë tre pjesë që përbëjnë ALIS: Capture, Engine dhe Viewer. Në modulin Capture, aplikacioni celular përmban mësime të integruara dhe flukse pune të personalizueshme që lejojnë përdoruesit të kapin imazhe 3D me cilësi të lartë duke përdorur shumicën e telefonave inteligjentë në treg. Regjistrimi i imazhit të Fyusion mbështet gjithashtu DSLR, drone dhe një mori pajisjesh të tjera.

Në hapin e dytë, Engine, ALIS analizon ato imazhe 3D dhe i kthen ato në informacione vepruese, siç janë llojet e dëmtimeve të kërkuara nga klientët tanë. Ai gjithashtu mund të sigurojë kopje rezervë për gjetjet e tij duke krijuar imazhe 2D me rezolucion të lartë të dëmtimeve që gjen.

Së fundi, Viewer shfaq formatin e skedarit .fyuse. .fyuse është i patentuar dhe i lehtë dhe ofron një përvojë gjithëpërfshirëse 3D me kohë ngarkimi të shpejtë. Ne jemi në gjendje të shtojmë të gjitha llojet e përvojave me një .fyuse, duke përfshirë audio, video dhe sigurisht imazhe 2D.

Fyusion është gati AR dhe VR, sa të mëdha besoni se do të jenë këto aplikacione në të ardhmen?

Realiteti i shtuar është një industri miliarda dollarësh që po bëhet gjithnjë e më e zakonshme dhe është edhe më e lehtë për të kapur mjedisin në 3D falë pajisjeve të reja celulare të fuqishme dhe rrjeteve me vonesë të ulët. Ndërsa këto teknologji kalojnë në rrjedhën kryesore, pritjet e klientëve për përvojat në internet do të rriten aq shpejt sa mund të vazhdojnë krijuesit e përmbajtjes.

Veçanërisht në industrinë e automjeteve, me blerjen e makinave gjithnjë e më shumë në internet, në vitet e ardhshme ne parashikojmë një rritje të interesit për listat e AR, VR dhe 3D. Qëllimi është të transformohet një faqe e thjeshtë e detajeve të automjetit (VDP) në një faqe të përvojës së automjetit (VEP), duke ndihmuar shitësit e mëdhenj dhe të vegjël të automjeteve të vazhdojnë të lulëzojnë. Kjo mund të jetë çdo gjë, nga shtimi i logove 3D dhe etiketave të pasura të mediave në lista, ose lejimi i blerësve që të vendosin virtualisht një grup shkopiqe golfi në bagazhin e një makine për të parë se si përshtaten brenda.

Do të jetë emocionuese të shohësh se si këto lloj aplikacionesh fillojnë të funksionojnë drejt përdorimit të zakonshëm. Nuk mendoj se do të jetë një pritje e gjatë.

A mund të diskutoni përmirësimin e shkallës së klikimeve dhe të ardhurave që shihet në tregtinë elektronike nga përdorimi i imazheve 3d kundrejt 2d?

Unë jam më i njohur me shitjet e makinave me shumicë dhe pakicë. Imazhet 3D kanë krijuar një nivel të ri besimi për blerësit në internet, i cili është veçanërisht kritik me artikujt me bileta të mëdha si makinat.

Të dhënat tona të brendshme tregojnë se imazhet 3D rrisin angazhimin e përdoruesit dhe kohën e shpenzuar në faqet e detajeve të automjeteve, gjë që nga ana tjetër është treguar se rrit shitjet e makinave. Sigurimi i një eksperience të gjallë 3D të automjetit gjithashtu ndërton një ndjenjë pozitive ndaj shitësit duke rritur besimin.

Një nga opsionet me Fyusion është përpunimi i të dhënave në nivel lokal ose në cloud, a mund të diskutoni përfitimet e secilit?

Në nivel lokal, Edge AI i detyron zhvilluesit të punojnë brenda kufizimeve të konsiderueshme, veçanërisht për rastin e përdorimit të telefonave celularë. Përveç shqetësimeve standarde për çdo zhvillues të AI - Sa i optimizuar është rrjeti? Sa të besueshme janë rezultatet?—disa shqetësime praktike vendosin tavane të qarta. Presioni i memories, shkarkimi i baterisë, mundësia që procesi juaj të jetë i sfondit nga përdoruesi ose sistemi operativ, etj. Dhe kjo është duke supozuar se CPU dhe GPU të krahasueshme ishin të disponueshme në skaj. Edhe për pajisjet kryesore, kjo ndodh rrallë.

Ju duhet të planifikoni për çdo rast të mundshëm qoshe; ndërsa, në cloud, çdo zgjidhje mund të monitorohet dhe rregullohet mirë.

Por duke folur kolektivisht, inteligjenca artificiale e skajit mund të konsiderohet zgjidhja e përsosur e "përmasave automatike": për çdo përdorues të ri, ju keni një makinë krejtësisht të re në dispozicionin tuaj. Nëse e keni optimizuar rrjetin tuaj që të funksionojë tërësisht në avantazh, po aq lehtë mund t'i shërbeni dy ose dy milionë klientë.

Ndërsa hardueri më i mirë do të ekzistojë gjithmonë në cloud, përgjithësisht pranohet se të dhënat janë mbret. Sa më shumë të dhëna dhe sa më afër të jenë të papërpunuara, aq më mirë. Inteligjenca artificiale në skaj ka qasje në të dhëna hyrëse të papërpunuara, të papërpunuara, pa kufizime. Ndërsa për një zgjidhje të AI në cloud, të dhënat hyrëse ose duhet të përpunohen (të ngjeshura, të pjesshme) ose të mëdha, në të cilën pikë gjerësia e brezit bëhet një shqetësim serioz.

Për shkak se është më afër përdoruesit, Edge AI hap një sërë mundësish që Cloud AI nuk e bën. Nëse është e optimizuar për të ekzekutuar në kohë reale, mund të japë reagime në kohë reale. Që do të thotë që ju mund të ndërtoni zgjidhje që jo vetëm thithin të dhëna, por inkurajojnë përdoruesit t'i ofrojnë më mirë të dhënave.

Si do të mundësojë 5G rritje të shpejtë në aplikacionet e teknologjisë së vizionit kompjuterik?

Me shpejtësi më të shpejta të lidhjes, mund të zhvendosni më shumë përpunime në cloud, gjë që hap mundësi për të gjitha llojet e aplikacioneve të reja të vizionit kompjuterik. Sidoqoftë, varet vërtet nga aplikacioni dhe sa gjerësisht do të miratohet.

5G mund të ketë një ndikim të fragmentuar dhe më tej ndarjen dixhitale, pasi disa pjesë të botës kanë lidhje më të shpejtë dhe më të shpejtë, ndërsa zona të tjera do të vazhdojnë të kenë lidhje të ngadaltë. Aplikacionet e fokusuara te njerëzit me akses në 5G padyshim do të përfitojnë. Por aplikacionet e miratuara më gjerësisht mund të duhet të zgjedhin midis shpenzimit të kohës dhe parave për atë që në thelb do të bëhet dy versione të të njëjtit aplikacion, ose të qëndrojnë me një version që është më pak i fuqishëm, por që mund të funksionojë në pothuajse çdo lidhje.

Çfarë hapash po ndërmerr Fyusion për të përfituar nga prezantimi i ardhshëm i 5G?

Dua ta parathaj këtë duke thënë se Fyusion ka shpenzuar kohë të konsiderueshme për t'u siguruar që klientët mund të kenë akses në aplikacionet tona edhe në telefonat e vjetër me disponueshmëri të dobët të brezit. Vetëm me Manheim, teknologjia jonë ka imazhuar mbi një milion makina dhe ne nuk do ta kishim arritur ndryshe.

Thënë kështu, ne jemi shumë të emocionuar nga ajo që po shohim tani – është një trifekt i rritjes së shpejtësisë së përpunimit, lidhjes 5G dhe asgjë më pak se një revolucion në telefonat me kamera. Mblidhini të gjitha së bashku dhe do të merrni disa zhvillime të reja që fatkeqësisht nuk mund t'i ndaj me ju ende.

A ka ndonjë gjë tjetër që dëshironi të ndani për Fyusion?

Është një kohë shumë emocionuese për të punuar në vizionin kompjuterik – si një disiplinë që ne po kalojmë në rrjedhën kryesore pas shumë vitesh që flitet për të si një teknologji e së ardhmes. Fyusion po rritet me shpejtësi dhe ne po punësojmë shkencëtarë të vizionit kompjuterik nga e gjithë bota. Anëtarët e ekipit tonë mund të punojnë nga kudo, por ata janë gjithmonë të mirëpritur në zyrat tona në Potrero Hill.

Faleminderit për intervistën e mrekullueshme, lexuesit që dëshirojnë të mësojnë më shumë duhet ta vizitojnë Fyusion.

Një partner themelues i unite.AI dhe një anëtar i Këshilli i Teknologjisë i Forbes, Antoine është një futurist i cili është i apasionuar pas të ardhmes së AI dhe robotikës.

Ai është gjithashtu Themeluesi i Letrat me vlerë.io, një faqe interneti që fokusohet në investimin në teknologjinë përçarëse.