stubbur Yashar Behzadi, forstjóri Synthesis AI - Interview Series - Unite.AI
Tengja við okkur

viðtöl

Yashar Behzadi, forstjóri Synthesis AI – Interview Series

mm

Útgefið

 on

Yashar Behzadi PhD er forstjóri og stofnandi Synthesis AI. Hann er reyndur frumkvöðull sem hefur byggt upp umbreytandi fyrirtæki á gervigreindartækni, lækningatækni og IoT mörkuðum. Hann hefur eytt síðustu 14 árum í Silicon Valley að byggja upp og stækka gagnamiðuð tæknifyrirtæki. Yashar hefur yfir 30 einkaleyfi og einkaleyfi í bið og doktorsgráðu. frá UCSD með áherslu á tímabundin líkan af virkri heilamyndgreiningu.

Synthesis AI er sprotafyrirtæki á mótum djúpnáms og CGI, sem skapar nýja hugmyndafræði fyrir þróun tölvusjónlíkana. Þeir gera viðskiptavinum kleift að þróa betri líkön á broti af tíma og kostnaði við hefðbundnar aðferðir sem byggja á mannskýringum.

Hvernig tók þú upphaflega þátt í tölvunarfræði og gervigreind?

Ég vann Ph.D. frá UCSD árið 2006 með áherslu á tölvusjón og staðbundna og tímabundna líkanagerð á heilamyndagerð. Ég vann síðan í Silicon Valley á mótum skynjara, gagna og vélanáms þvert á atvinnugreinar næstu 16 árin. Mér finnst ég mjög heppinn að fá tækifæri til að vinna að ótrúlegri tækni og ég er með yfir 30 einkaleyfi sem gefin eru út eða lögð inn með áherslu á merkjavinnslu, vélanám og gagnafræði.

Gætirðu deilt tilurð sögu Synthesis AI?

Áður en ég stofnaði Synthesis AI árið 2019 leiddi ég alþjóðlegt gervigreindarþjónustufyrirtæki sem einbeitti sér að því að þróa tölvusjónarlíkön fyrir leiðandi tæknifyrirtæki. Sama stærð fyrirtækisins fann ég að við vorum mjög takmörkuð af gæðum og magni merktra þjálfunargagna. Eftir því sem fyrirtæki stækkuðu landfræðilega, stækkuðu viðskiptavinahópinn eða þróuðu nýjar gerðir og nýjan vélbúnað, var þörf á nýjum þjálfunargögnum til að tryggja að líkön virkuðu á fullnægjandi hátt. Það varð líka ljóst að framtíð tölvusjónar myndi ekki verða farsæl með hugmyndafræði mannkyns-í-lykkjunnar í dag. Ný tölvusjónforrit í sjálfræði, vélfærafræði og AR/VR/metaverse forritum krefjast ríkulegs setts af þrívíddarmerkjum, dýptarupplýsingum, efniseiginleikum, nákvæmri skiptingu osfrv., sem menn geta ekki merkt. Það var þörf á nýrri hugmyndafræði til að útvega nauðsynlega ríku merkimiða til að þjálfa þessar nýju gerðir. Auk tæknilegra ökumanna sáum við aukið eftirlit neytenda og reglugerða í kringum siðferðileg atriði sem tengjast hlutdrægni líkana og friðhelgi einkalífs neytenda.

Ég stofnaði Synthesis AI og ætlaði að umbreyta hugmyndafræði tölvusjónar. Tilbúið gagnaframleiðsluvettvangur fyrirtækisins gerir kleift að búa til eftirspurn ljósraunsæ myndgögn með stækkuðu setti af 3D pixla-fullkomnum merkjum. Markmið okkar er að vera brautryðjandi tilbúinna gagnatækni til að leyfa siðferðilega þróun hæfari líkana.

Fyrir lesendur sem ekki þekkja þetta hugtak, gætirðu skilgreint hvað tilbúið gögn eru?

Tilbúin gögn eru tölvugerð gögn sem þjóna sem valkostur við raunveruleg gögn. Tilbúið gögn eru búin til í hermum stafrænum heimum frekar en þeim er safnað úr eða mæld í hinum raunverulega heimi. Með því að sameina verkfæri úr heimi sjónrænna áhrifa og CGI með skapandi gervigreindarlíkönum, gerir Synthesis AI fyrirtækjum kleift að búa til mikið magn af ljósraunsæjum, fjölbreyttum gögnum á eftirspurn til að þjálfa tölvusjónlíkön. Gagnavinnsluvettvangur fyrirtækisins dró úr kostnaði og hraða til að fá hágæða myndgögn í stærðargráðum á sama tíma og friðhelgi einkalífsins var varðveitt.

Gætirðu rætt hvernig tilbúið gögn verða til?

Tilbúið gagnasett er búið til á tilbúnum stað frekar en með raunverulegum gögnum. Tækni frá sjónbrellaiðnaðinum er ásamt skapandi tauganetum til að búa til víðtæk, fjölbreytt og ljósraunsæ merkt myndgögn. Tilbúin gögn gera kleift að búa til þjálfunargögn á broti af kostnaði og tíma núverandi aðferða.

Hvernig skapar það samkeppnisforskot að nýta tilbúið gögn?

Eins og er nýta flest gervigreind kerfi „stýrt nám“ þar sem menn merkja lykil sem er eignaður í myndum og þjálfa síðan gervigreind reiknirit til að túlka myndir. Þetta er auðlind og tímafrekt ferli og takmarkast af því sem menn geta merkt nákvæmlega. Að auki hafa áhyggjur af lýðfræðilegri hlutdrægni gervigreindar og friðhelgi einkalífs neytenda aukist, sem gerir það sífellt erfiðara að fá dæmigerð mannleg gögn.

Nálgun okkar er að búa til ljósraunsæja stafræna heima sem búa til flókin myndgögn. Þar sem við búum til gögnin vitum við allt um atriðin, þar á meðal aldrei áður tiltækar upplýsingar um þrívíddarstaðsetningu hluta og flókin samskipti þeirra við hvert annað og umhverfið. Að afla og merkja þetta magn af gögnum með núverandi aðferðum myndi taka mánuði, ef ekki ár. Þessi nýja hugmyndafræði mun gera 3x aukningu á skilvirkni og kostnaði kleift og knýja nýjan flokk af hæfari gerðum.

Þar sem tilbúið gögn eru búin til á tilbúnum hætti, útilokar þetta margar hlutdrægni og persónuverndaráhyggjur með hefðbundinni söfnun gagnasetta frá hinum raunverulega heimi.

Hvernig gerir gagnaframleiðsla á eftirspurn kleift að hraða mælikvarða?

Að safna og undirbúa raunveruleg gögn fyrir líkanaþjálfun er langt og leiðinlegt ferli. Notkun nauðsynlegs vélbúnaðar getur verið óheyrilega dýr fyrir flókin tölvusjónkerfi eins og sjálfstýrð farartæki, vélfærafræði eða gervihnattamyndir. Þegar gögnin hafa verið tekin merkja menn og skrifa athugasemdir við mikilvæga eiginleika. Þetta ferli er viðkvæmt fyrir mistökum og menn eru takmarkaðir í getu sinni til að merkja lykilupplýsingar eins og þrívíddarstöðu sem þarf fyrir mörg forrit.

Tilbúin gögn eru stærðargráður hraðar og ódýrari en hefðbundnar mannskráðar raunverulegar gagnaaðferðir og munu flýta fyrir dreifingu nýrra og hæfari líkana á milli atvinnugreina.

Hvernig gera tilbúin gögn kleift að draga úr eða koma í veg fyrir hlutdrægni gervigreindar?

Gervigreind kerfi eru alls staðar til staðar en geta innihaldið innbyggða hlutdrægni sem getur haft áhrif á hópa fólks. Gagnasöfn geta verið í ójafnvægi við ákveðna flokka gagna og annað hvort yfir eða vanfulltrúa hópa fólks. Að byggja upp mannmiðuð kerfi getur oft leitt til kynja, þjóðernis og aldurshlutdrægni. Aftur á móti eru hönnunarmynduð þjálfunargögn rétt í jafnvægi og skortir mannlega hlutdrægni.

Tilbúin gögn gætu orðið öflug lausn við að leysa hlutdrægni gervigreindarvandamálsins. Tilbúin gögn eru mynduð að hluta eða að öllu leyti á tilbúnum stað frekar en mæld eða dregin út úr raunverulegum atburðum eða fyrirbærum. Ef gagnasafnið er ekki nógu fjölbreytt eða nógu stórt geta gervigreind gögn fyllt upp í götin og myndað óhlutdrægt gagnasafn. Besti hlutinn? Að búa til þessi gagnasett handvirkt getur tekið lið nokkra mánuði eða ár að klára. Þegar hannað er með tilbúnum gögnum er hægt að gera það á einni nóttu.

Fyrir utan tölvusjón, hver eru önnur hugsanleg notkunartilvik í framtíðinni fyrir tilbúin gögn?

Til viðbótar við fjöldann allan af notkunartilfellum fyrir tölvusjón sem tengjast neytendavörum, sjálfræði, vélfærafræði, AR/VR/metaverse og fleira, munu tilbúin gögn einnig hafa áhrif á aðrar gagnaaðferðir. Við erum nú þegar að sjá fyrirtæki nýta tilbúnar gagnaaðferðir fyrir skipulögð töflugögn, radd- og náttúrulega málvinnslu. Undirliggjandi tækni og kynslóðarleiðslur eru mismunandi fyrir hverja aðferð og í náinni framtíð gerum við ráð fyrir að sjá fjölþætt kerfi (td myndband + rödd).

Er eitthvað annað sem þú vilt deila um Synthesis AI?

Seint á síðasta ári gáfum við út HumanAPI, veruleg stækkun á gervigagnagetu Synthesis AI sem gerir forritunarlegri kynslóð milljóna einstakra, hágæða 3D stafrænna manna kleift. Þessi tilkynning kemur mánuðum eftir kynningu á FaceAPI tilbúnu gagna-sem-þjónustu vörunni, sem hefur skilað yfir 10M merktum andlitsmyndum fyrir leiðandi snjallsíma-, fjarfunda-, bíla- og tæknifyrirtæki. HumanAPI er næsta skref á vegferð fyrirtækisins til að styðja við háþróaða tölvusjón gervigreind (AI) forrit.

HumanAPI gerir einnig mýgrút af nýjum tækifærum fyrir viðskiptavini okkar, þar á meðal snjalla gervigreindaraðstoðarmenn, sýndarhæfniþjálfara og auðvitað heiminn af metaverse forritum.

Með því að búa til stafrænan tvöfaldan af hinum raunverulega heimi mun metaverse gera ný forrit kleift, allt frá endurmynduðum samfélagsnetum, afþreyingarupplifunum, fjarfundum, leikjum og fleira. Tölvusjón AI mun vera grundvallaratriði í því hvernig raunverulegur heimur er tekinn og endurskapaður með mikilli tryggð á stafrænu sviði. Ljósraunsæir, svipmiklir og hegðunarfræðilegir nákvæmir menn verða mikilvægur þáttur í framtíð tölvusjónaforrita. HumanAPI er fyrsta varan sem gerir fyrirtækjum kleift að búa til gríðarstór magn af fullkomlega merktum heildarlíkamsgögnum á eftirspurn til að byggja upp hæfari gervigreindarlíkön, þar á meðal stellingarmat, tilfinningagreiningu, virkni og hegðun, endurbyggingu andlits og fleira.

Þakka þér fyrir frábært viðtal, lesendur sem vilja læra meira ættu að heimsækja Synthesis AI.

Stofnfélagi unite.AI og meðlimur í Forbes tækniráð, Antoine er a framúrstefnu sem hefur brennandi áhuga á framtíð gervigreindar og vélfærafræði.

Hann er einnig stofnandi Verðbréf.io, vefsíða sem leggur áherslu á að fjárfesta í truflandi tækni.