cung Doug Fuller, VP i Inxhinierisë Softuerike në Cornelis Networks - Seria e Intervistave
Lidhu me ne

intervistat

Doug Fuller, VP i Inxhinierisë Softuerike në Cornelis Networks – Seria e Intervistave

mm

Publikuar

 on

Si Zëvendës President i Inxhinierisë së Softuerit, Doug është përgjegjës për të gjitha aspektet e Rrjetet CornelisSkema e softuerit, duke përfshirë drejtuesit e Omni-Path Architecture, softuerin e mesazheve dhe sistemet e kontrollit të pajisjes së integruar. Përpara se t'i bashkohej Cornelis Networks, Doug drejtoi ekipet e inxhinierisë softuerike në Red Hat në ruajtjen e cloud dhe shërbimet e të dhënave. Karriera e Doug në HPC dhe informatikë në cloud filloi në Laboratorin e Llogaritjes së Shkallëshme të Laboratorit Kombëtar Ames. Pas disa roleve në informatikë kërkimore universitare, Doug iu bashkua Laboratorit Kombëtar të Departamentit të Energjisë të SHBA-së në Oak Ridge në 2009, ku ai zhvilloi dhe integroi teknologji të reja në Leadership Computing Facility të klasit botëror Oak Ridge.

Cornelis Networks është një lider teknologjik që ofron pëlhura me performancë të lartë të ndërtuara për qëllime për llogaritjen e performancës së lartë (HPC), analitikën e të dhënave me performancë të lartë (HPDA) dhe inteligjencën artificiale (AI) për organizatat kryesore tregtare, shkencore, akademike dhe qeveritare.

Çfarë ju tërhoqi fillimisht nga shkenca kompjuterike?

Thjesht dukej se më pëlqente të punoja me teknologjinë. Më pëlqente të punoja me kompjuterë duke u rritur; ne kishim një modem në shkollën tonë që më la të provoja internetin dhe më dukej interesant. Si studente e parë në kolegj, takova një shkencëtar kompjuterik të USDOE ndërsa isha vullnetar për National Science Bowl. Ai më ftoi të vizitoja laboratorin e tij të HPC dhe unë u fiksova. Unë kam qenë një superkompjuter që atëherë.

Ju keni punuar në Red Hat nga viti 2015 deri në 2019, cilat ishin disa nga projektet në të cilat keni punuar dhe pikat tuaja kryesore nga kjo përvojë?

Projekti im kryesor në Red Hat ishte ruajtja e shpërndarë në Ceph. Më parë isha fokusuar tërësisht në HPC dhe kjo më dha një mundësi për të punuar në teknologjitë që ishin kritike për infrastrukturën cloud. Ajo rimon. Shumë nga parimet e shkallëzueshmërisë, menaxhueshmërisë dhe besueshmërisë janë jashtëzakonisht të ngjashme edhe pse ato synojnë të zgjidhin probleme paksa të ndryshme. Për sa i përket teknologjisë, pika ime më e rëndësishme ishte se cloud dhe HPC kanë shumë për të mësuar nga njëri-tjetri. Ne po ndërtojmë gjithnjë e më shumë projekte të ndryshme me të njëjtin grup Lego. Me të vërtetë më ndihmoi të kuptoj se si teknologjitë e aktivizimit, duke përfshirë pëlhurat, mund të zbatohen në aplikacionet HPC, cloud dhe AI. Është gjithashtu vendi ku arrita të kuptoj vlerën e Open Source dhe si të ekzekutoj filozofinë e zhvillimit të softuerit të parë me Burim të Hapur, që solla me vete në Cornelis Networks. Personalisht, Red Hat ishte vendi ku u rrita dhe u maturova si lider.

Aktualisht jeni Zëvendës President i Inxhinierisë Softuerike në Cornelis Networks, cilat janë disa nga përgjegjësitë tuaja dhe si duket dita juaj mesatare?

Si Zëvendës President i Inxhinierisë së Softuerit, unë jam përgjegjës për të gjitha aspektet e grumbullit të softuerit të Cornelis Networks, duke përfshirë drejtuesit e Omni-Path Architecture, softuerin e mesazheve, menaxhimin e pëlhurave dhe sistemet e kontrollit të pajisjes së integruar. Cornelis Networks është një vend emocionues për të qenë, veçanërisht në këtë moment dhe këtë treg. Për shkak të kësaj, nuk jam i sigurt se kam një ditë "mesatare". Disa ditë po punoj me ekipin tim për të zgjidhur sfidën më të fundit të teknologjisë. Ditët e tjera po ndërveproj me arkitektët tanë të harduerit për t'u siguruar që produktet tona të gjeneratës së ardhshme do të ofrojnë për klientët tanë. Unë jam shpesh në terren duke u takuar me komunitetin tonë të mahnitshëm të klientëve dhe bashkëpunëtorëve duke u siguruar që ne i kuptojmë dhe parashikojmë nevojat e tyre.

Cornelis Networks ofron rrjetëzim të gjeneratës së ardhshme për aplikacionet e llogaritjes me performancë të lartë dhe AI, a mund të ndani disa detaje mbi harduerin që ofrohet?

Pajisja jonë përbëhet nga një zgjidhje pëlhure rrjeti të tipit pëlhurë të ndërruar me performancë të lartë. Për këtë qëllim, ne ofrojmë të gjitha pajisjet e nevojshme për të integruar plotësisht pëlhurat HPC, cloud dhe AI. Ndërfaqja Omni-Path Host-Fabric (HFI) është një kartë PCIe me profil të ulët për pajisjet e pikës fundore. Ne prodhojmë gjithashtu një ndërprerës 48U me 1 porta "top-of-rack". Për vendosje më të mëdha, ne bëjmë dy ndërprerës të "klasit të drejtorit" plotësisht të integruar; një që paketon 288 porte në 7U dhe një pajisje me 1152 porte, 20U.

A mund të diskutoni softuerin që menaxhon këtë infrastrukturë dhe se si është projektuar për të ulet vonesa?

Së pari, platforma jonë e integruar e menaxhimit ofron instalim dhe konfigurim të lehtë, si dhe akses në një shumëllojshmëri të gjerë të metrikave të performancës dhe konfigurimit të prodhuara nga ASIC-et tona të ndërprerësit.

Softueri ynë drejtues është zhvilluar si pjesë e kernelit Linux. Në fakt, ne i dorëzojmë të gjitha arnimet tona të softuerit drejtpërdrejt në komunitetin e kernelit Linux. Kjo siguron që të gjithë klientët tanë të gëzojnë përputhshmëri maksimale në shpërndarjet Linux dhe integrim të lehtë me softuer të tjerë si Lustre. Ndërsa nuk është në shtegun e vonesës, të kesh një drejtues në pemë redukton në mënyrë dramatike kompleksitetin e instalimit.

Menaxheri i rrobave Omni-Path (FM) konfiguron dhe drejton një pëlhurë Omni-Path. Duke optimizuar rrugët e trafikut dhe duke u rikuperuar shpejt nga defektet, FM ofron performancë dhe besueshmëri lider në industri në pëlhura nga dhjetëra në mijëra nyje.

Omni-Path Express (OPX) është softueri ynë i mesazheve me performancë të lartë, i lëshuar së fundmi në nëntor 2022. Ai u krijua posaçërisht për të reduktuar vonesën në krahasim me softuerin tonë të mëparshëm të mesazheve. Kemi kryer simulime të sakta sipas cikleve të shtigjeve tona të kodit të dërgimit dhe marrjes në mënyrë që të minimizojmë numrin e instruksioneve dhe përdorimin e cache-it. Kjo prodhoi rezultate dramatike: kur je në regjimin e mikrosekondës, çdo cikël ka rëndësi!

Ne gjithashtu u integruam me Ndërfaqet OpenFabrics (OFI), një standard i hapur i prodhuar nga OpenFabrics Alliance. Arkitektura modulare e OFI ndihmon në minimizimin e vonesës duke lejuar softuerin e nivelit më të lartë, si MPI, të shfrytëzojë veçoritë e rrobave pa thirrje funksionesh shtesë.

I gjithë rrjeti është krijuar gjithashtu për të rritur shkallëzimin, a mund të ndani disa detaje se si është në gjendje të shkallëzohet kaq mirë?

Shkallueshmëria është në thelb të parimeve të projektimit të Omni-Path. Në nivelet më të ulëta, ne përdorim teknologjinë e shtresës së lidhjes Cray për të korrigjuar gabimet e lidhjeve pa ndikim latente. Kjo prek pëlhurat në të gjitha shkallët, por është veçanërisht e rëndësishme për pëlhurat në shkallë të gjerë, të cilat natyrisht përjetojnë më shumë gabime në lidhje. Menaxheri ynë i pëlhurës është i përqendruar si në programimin e tabelave optimale të rrugëtimit ashtu edhe në kryerjen e kësaj në një mënyrë të shpejtë. Kjo siguron që rrugëtimi edhe për pëlhurat më të mëdha mund të përfundojë në një kohë minimale.

Shkallueshmëria është gjithashtu një komponent kritik i OPX. Minimizimi i përdorimit të cache-it përmirëson shkallëzueshmërinë në nyjet individuale me numërim të madh të bërthamave. Minimizimi i vonesës përmirëson gjithashtu shkallëzueshmërinë duke përmirësuar kohën deri në përfundim për algoritmet kolektive. Përdorimi i burimeve tona të ndërfaqes host-fabric në mënyrë më efikase mundëson që çdo bërthamë të komunikojë me më shumë kolegë të largët. Zgjedhja strategjike e libfabric na lejon të shfrytëzojmë veçoritë e softuerit si pikat fundore të shkallëzueshme duke përdorur ndërfaqe standarde.

A mund të ndani disa detaje se si AI është përfshirë në disa nga fluksi i punës në Cornelis Networks?

Ne nuk jemi plotësisht të gatshëm të flasim nga jashtë për përdorimet tona të brendshme dhe planet për AI. Thënë kështu, ne hamë ushqimin tonë të qenve, kështu që mund të përfitojmë nga vonesat dhe përmirësimet e shkallëzimit që i kemi bërë Omni-Path për të mbështetur ngarkesat e punës së AI. Na bën edhe më të entuziazmuar t'i ndajmë ato përfitime me klientët dhe partnerët tanë. Sigurisht që kemi vërejtur se, si në HPC tradicionale, përshkallëzimi i infrastrukturës është e vetmja rrugë përpara, por sfida është se performanca e rrjetit mbytet lehtësisht nga Ethernet dhe rrjete të tjera tradicionale.

Cilat janë disa ndryshime që parashikoni në industri me ardhjen e AI gjeneruese?

Së pari, përdorimi i AI gjeneruese do t'i bëjë njerëzit më produktivë - asnjë teknologji në histori nuk i ka bërë qeniet njerëzore të vjetëruara. Çdo evolucion dhe revolucion i teknologjisë që kemi pasur nga pambuku deri te tezgjahja automatike te telefoni, interneti dhe më gjerë kanë bërë disa punë më efikase, por ne nuk e kemi shfuqizuar njerëzimin.

Nëpërmjet aplikimit të AI gjeneruese, unë besoj se kompanitë do të avancojnë teknologjikisht me një ritëm më të shpejtë sepse ata që drejtojnë kompaninë do të kenë më shumë kohë të lirë për t'u fokusuar në ato avancime. Për shembull, nëse AI gjeneruese ofron parashikime, raportime, planifikime, etj. më të sakta – kompanitë mund të fokusohen në inovacionin në fushën e tyre të ekspertizës

Unë veçanërisht mendoj se AI do ta bëjë secilin prej nesh një ekspert multidisiplinar. Për shembull, si një ekspert i softuerit të shkallëzuar, unë i kuptoj lidhjet midis aplikacioneve HPC, të dhënave të mëdha, cloud dhe AI ​​që i drejtojnë ata drejt zgjidhjeve si Omni-Path. I pajisur me një asistent gjenerues të AI, mund të gërmoj më thellë në të kuptim të aplikacioneve të përdorura nga klientët tanë. Nuk kam asnjë dyshim se kjo do të na ndihmojë të krijojmë harduer dhe softuer edhe më efektiv për tregjet dhe klientët që u shërbejmë.

Parashikoj gjithashtu një përmirësim të përgjithshëm në cilësinë e softuerit. AI mund të funksionojë në mënyrë efektive si "një grup tjetër sysh" për të analizuar në mënyrë statike kodin dhe për të zhvilluar njohuri mbi defektet dhe problemet e performancës. Kjo do të jetë veçanërisht interesante në shkallë të gjerë ku problemet e performancës mund të jenë veçanërisht të vështira për t'u dalluar dhe të shtrenjta për t'u riprodhuar.

Së fundi, shpresoj dhe besoj se AI gjeneruese do të ndihmojë industrinë tonë të trajnojë dhe të futë më shumë profesionistë të softuerit pa përvojë të mëparshme në AI dhe HPC. Fusha jonë mund të duket e frikshme për shumë njerëz dhe mund të duhet kohë për të mësuar "të mendojmë paralelisht". Në thelb, ashtu si makinat e bënë më të lehtë prodhimin e gjërave, AI gjeneruese do ta bëjë më të lehtë shqyrtimin dhe arsyetimin rreth koncepteve.

A ka ndonjë gjë tjetër që dëshironi të ndani për punën tuaj ose Cornelis Networks në përgjithësi?

Do të doja të inkurajoja këdo që është i interesuar të ndjekë një karrierë në informatikë, veçanërisht në HPC dhe AI. Në këtë fushë, ne jemi të pajisur me burimet më të fuqishme kompjuterike të ndërtuara ndonjëherë dhe i sjellim ato në përballje me sfidat më të mëdha të njerëzimit. Është një vend emocionues për të qenë dhe unë e kam shijuar atë në çdo hap të rrugës. Inteligjenca artificiale gjeneruese e çon fushën tonë në lartësi edhe më të reja pasi kërkesa për rritjen e aftësive rritet në mënyrë drastike. Mezi pres të shoh se ku do të shkojmë më pas.

Faleminderit për intervistën e mrekullueshme, lexuesit që dëshirojnë të mësojnë më shumë duhet ta vizitojnë Rrjetet Cornelis.

Një partner themelues i unite.AI dhe një anëtar i Këshilli i Teknologjisë i Forbes, Antoine është një futurist i cili është i apasionuar pas të ardhmes së AI dhe robotikës.

Ai është gjithashtu Themeluesi i Letrat me vlerë.io, një faqe interneti që fokusohet në investimin në teknologjinë përçarëse.