քոթուկ Դագ Ֆուլեր, Cornelis Networks-ի ծրագրային ապահովման ճարտարագիտության փոխնախագահ - հարցազրույցների շարք
Միացեք մեզ

Հարցազրույցներ

Դագ Ֆուլեր, Cornelis Networks-ի ծրագրային ապահովման ճարտարագիտության փոխնախագահ – հարցազրույցների շարք

mm

Հրատարակված է

 on

Որպես ծրագրային ապահովման ճարտարագիտության փոխնախագահ, Դագը պատասխանատու է բոլոր ասպեկտների համար Cornelis NetworksԾրագրային փաթեթը, ներառյալ Omni-Path Architecture-ի դրայվերները, հաղորդագրությունների ծրագրակազմը և ներկառուցված սարքերի կառավարման համակարգերը: Մինչ Cornelis Networks-ին միանալը, Դագը ղեկավարում էր Red Hat-ի ծրագրային ապահովման ինժեներական թիմերը ամպային պահեստավորման և տվյալների ծառայությունների ոլորտում: Դագի կարիերան HPC-ի և ամպային հաշվիչների ոլորտում սկսվեց Էյմս ազգային լաբորատորիայի Scalable Computing Laboratory-ում: Համալսարանական հետազոտական ​​հաշվարկում մի քանի դերերից հետո Դագը 2009թ.-ին միացավ ԱՄՆ-ի Էներգետիկայի դեպարտամենտի Oak Ridge ազգային լաբորատորիայում, որտեղ նա մշակեց և ինտեգրեց նոր տեխնոլոգիաներ համաշխարհային կարգի Oak Ridge Առաջնորդական Հաշվողական Հաստատությունում:

Cornelis Networks-ը տեխնոլոգիական առաջատարն է, որը մատակարարում է բարձր արդյունավետության գործվածքներ բարձր կատարողական հաշվարկների (HPC), բարձր կատարողական տվյալների վերլուծության (HPDA) և արհեստական ​​ինտելեկտի (AI) առաջատար առևտրային, գիտական, ակադեմիական և պետական ​​կազմակերպություններին:

Ի՞նչը ձեզ սկզբում գրավեց համակարգչային գիտության մեջ:

Ինձ թվում էր պարզապես հաճույք է պատճառում տեխնոլոգիայի հետ աշխատելը: Ինձ դուր եկավ համակարգիչների հետ աշխատելը մեծանալիս. մենք ունեինք մոդեմ մեր դպրոցում, որը թույլ տվեց ինձ փորձել ինտերնետը, և այն ինձ համար հետաքրքիր էր: Որպես քոլեջի առաջին կուրսեցի, ես հանդիպեցի USDOE-ի հաշվողական գիտնականի, երբ կամավոր աշխատել էի National Science Bowl-ում: Նա ինձ հրավիրեց շրջելու իր HPC լաբորատորիայում, և ես հուզված էի: Այդ ժամանակվանից ես սուպերհամակարգչային վարպետ եմ:

Դուք աշխատել եք Red Hat-ում 2015-ից 2019 թվականներին, որո՞նք էին ձեր աշխատած նախագծերից մի քանիսը և ձեր հիմնական արդյունքները այս փորձից:

Red Hat-ում իմ հիմնական նախագիծը Ceph-ի բաշխված պահեստն էր: Ես նախկինում ամբողջությամբ կենտրոնացել էի HPC-ի վրա, և դա ինձ հնարավորություն տվեց աշխատելու տեխնոլոգիաների վրա, որոնք կարևոր են ամպային ենթակառուցվածքի համար: Այն հանգավորում է: Ընդարձակելիության, կառավարելիության և հուսալիության սկզբունքներից շատերը չափազանց նման են, թեև դրանք ուղղված են մի փոքր տարբեր խնդիրների լուծմանը: Տեխնոլոգիայի առումով իմ ամենակարևոր բանն այն էր, որ ամպը և HPC-ն շատ բան ունեն սովորելու միմյանցից: Մենք ավելի ու ավելի ենք կառուցում տարբեր նախագծեր նույն Lego հավաքածուով: Դա իսկապես օգնեց ինձ հասկանալ, թե ինչպես կարող են թույլատրող տեխնոլոգիաները, ներառյալ գործվածքները, կիրառել HPC-ի, ամպի և AI հավելվածների վրա: Այստեղ ես իսկապես հասկացա Open Source-ի արժեքը և ինչպես իրականացնել Open Source-ը, առաջին հերթին ծրագրային ապահովման մշակման փիլիսոփայությունը, որը ես ինձ հետ բերեցի Cornelis Networks: Անձամբ Red Hat-ն այնտեղ էր, որտեղ ես իսկապես մեծացա և հասունացա որպես առաջնորդ:

Դուք ներկայումս Cornelis Networks-ի Ծրագրային ճարտարագիտության գծով փոխնախագահն եք, որո՞նք են ձեր պարտականություններից մի քանիսը և ինչպիսի՞ն է ձեր միջին օրը:

Որպես Ծրագրային ապահովման ճարտարագիտության փոխնախագահ՝ ես պատասխանատու եմ Cornelis Networks-ի ծրագրային փաթեթի բոլոր ասպեկտների համար, ներառյալ Omni-Path Architecture դրայվերները, հաղորդագրությունների ծրագրակազմը, գործվածքների կառավարումը և ներկառուցված սարքերի կառավարման համակարգերը: Cornelis Networks-ը հետաքրքիր վայր է, հատկապես այս պահին և այս շուկայում: Այդ պատճառով ես վստահ չեմ, որ «միջին» օր ունեմ: Մի քանի օր ես աշխատում եմ իմ թիմի հետ՝ լուծելու վերջին տեխնոլոգիական մարտահրավերը: Այլ օրերին ես շփվում եմ մեր ապարատային ճարտարապետների հետ՝ համոզվելու համար, որ մեր հաջորդ սերնդի արտադրանքը կմատուցի մեր հաճախորդներին: Ես հաճախ հանդիպում եմ մեր հաճախորդների և գործընկերների զարմանալի համայնքի հետ՝ համոզվելով, որ մենք հասկանում և ակնկալում ենք նրանց կարիքները:

Cornelis Networks-ն առաջարկում է հաջորդ սերնդի ցանցային ցանց բարձր արդյունավետության հաշվարկման և AI հավելվածների համար, կարո՞ղ եք կիսվել որոշ մանրամասներ առաջարկվող սարքաշարի վերաբերյալ:

Մեր սարքաշարը բաղկացած է բարձր արդյունավետությամբ անջատված գործվածքների ցանցային գործվածքների լուծումից: Այդ նպատակով մենք տրամադրում ենք բոլոր անհրաժեշտ սարքերը՝ HPC-ի, ամպի և AI-ի գործվածքները լիովին ինտեգրելու համար: Omni-Path Host-Fabric Interface-ը (HFI) ցածր պրոֆիլի PCIe քարտ է վերջնական կետի սարքերի համար: Մենք նաև արտադրում ենք 48 պորտով 1U «վերևից դարակ» անջատիչ: Ավելի մեծ տեղակայման համար մենք պատրաստում ենք երկու լիովին ինտեգրված «դիրեկտորային դասի» անջատիչներ. մեկը, որը փաթեթավորում է 288 նավահանգիստ 7U-ում և 1152 նավահանգիստ, 20U սարք:

Կարո՞ղ եք քննարկել այս ենթակառուցվածքը կառավարող ծրագրակազմը և ինչպես է այն նախատեսված նվազեցնել հետաձգումը.

Նախ, մեր ներկառուցված կառավարման հարթակը ապահովում է հեշտ տեղադրում և կազմաձևում, ինչպես նաև հասանելի է մեր անջատիչ ASIC-ների կողմից արտադրված կատարողականի և կազմաձևման ցուցանիշների լայն տեսականի:

Մեր վարորդական ծրագիրը մշակված է որպես Linux միջուկի մաս: Փաստորեն, մենք մեր ծրագրային ապահովման բոլոր պատչերը ուղղակիորեն ներկայացնում ենք Linux միջուկի համայնքին: Դա ապահովում է, որ մեր բոլոր հաճախորդները վայելեն առավելագույն համատեղելիությունը Linux բաշխումների և հեշտ ինտեգրման այլ ծրագրերի հետ, ինչպիսին է Lustre-ը: Թեև ուշացման ճանապարհին չէ, ծառի մեջ դրայվեր ունենալը կտրուկ նվազեցնում է տեղադրման բարդությունը:

Omni-Path գործվածքների կառավարիչը (FM) կարգավորում և ուղղորդում է Omni-Path գործվածքը: Օպտիմիզացնելով երթևեկության երթուղիները և արագ վերականգնվելով անսարքություններից՝ FM-ն ապահովում է արդյունաբերության մեջ առաջատար կատարողականություն և հուսալիություն տասնյակից մինչև հազարավոր հանգույցների գործվածքների վրա:

Omni-Path Express-ը (OPX) մեր բարձր արդյունավետությամբ հաղորդագրությունների ծրագրակազմն է, որը վերջերս թողարկվել է 2022 թվականի նոյեմբերին: Այն հատուկ նախագծված է նվազեցնելու հետաձգումը, համեմատած մեր նախկին հաղորդագրությունների ծրագրաշարի հետ: Մենք գործարկեցինք մեր ուղարկման և ստացման կոդերի ցիկլային ճշգրիտ սիմուլյացիաներ, որպեսզի նվազագույնի հասցնենք հրահանգների քանակը և քեշի օգտագործումը: Սա կտրուկ արդյունքներ տվեց. երբ դուք միկրովայրկյան ռեժիմում եք, յուրաքանչյուր ցիկլը կարևոր է:

Մենք նաև ինտեգրվել ենք OpenFabrics ինտերֆեյս (OFI), բաց ստանդարտ՝ արտադրված OpenFabrics Alliance-ի կողմից: OFI-ի մոդուլային ճարտարապետությունն օգնում է նվազագույնի հասցնել ուշացումը՝ թույլ տալով ավելի բարձր մակարդակի ծրագրերին, ինչպիսիք են MPI-ն, օգտագործել գործվածքների գործառույթները՝ առանց լրացուցիչ գործառույթների կանչերի:

Ամբողջ ցանցը նախագծված է նաև մասշտաբայնությունը մեծացնելու համար, կարո՞ղ եք կիսվել որոշ մանրամասներով, թե ինչպես է այն կարողանում այդքան լավ մասշտաբել:

Scalability-ը Omni-Path-ի նախագծման սկզբունքների հիմքում է: Ամենացածր մակարդակներում մենք օգտագործում ենք Cray link-layer տեխնոլոգիան՝ առանց հապաղման ազդեցության շտկելու կապի սխալները: Սա ազդում է գործվածքների վրա բոլոր մասշտաբներով, բայց հատկապես կարևոր է լայնածավալ գործվածքների համար, որոնք, բնականաբար, ավելի շատ կապի սխալներ են ունենում: Մեր գործվածքների մենեջերը կենտրոնացած է ինչպես օպտիմալ երթուղային աղյուսակների ծրագրավորման վրա, այնպես էլ դա արագորեն անելու վրա: Սա երաշխավորում է, որ նույնիսկ ամենամեծ գործվածքների երթուղին կարող է ավարտվել նվազագույն ժամանակում:

Scalability-ը նաև OPX-ի կարևոր բաղադրիչ է: Քեշի օգտագործումը նվազագույնի հասցնելը բարելավում է լայնածավալությունը առանձին հանգույցների վրա, որոնց հիմնական քանակությունը մեծ է: Լատենտությունը նվազագույնի հասցնելը նաև բարելավում է մասշտաբայնությունը՝ բարելավելով կոլեկտիվ ալգորիթմների ավարտի ժամանակը: Հոսթ-գործվածքի մեր ինտերֆեյսի ռեսուրսների ավելի արդյունավետ օգտագործումը հնարավորություն է տալիս յուրաքանչյուր միջուկին շփվել ավելի հեռավոր հասակակիցների հետ: libfabric-ի ռազմավարական ընտրությունը թույլ է տալիս մեզ օգտագործել ծրագրային ապահովման առանձնահատկությունները, ինչպիսիք են մասշտաբային վերջնակետերը՝ օգտագործելով ստանդարտ միջերեսներ:

Կարո՞ղ եք կիսվել որոշ մանրամասներով, թե ինչպես է AI-ն ներառված Cornelis Networks-ի որոշ աշխատանքային հոսքի մեջ:

Մենք այնքան էլ պատրաստ չենք արտաքինից խոսել AI-ի մեր ներքին օգտագործման և պլանների մասին: Ասել է թե՝ մենք իսկապես ուտում ենք մեր սեփական շան կերակուրը, ուստի կարող ենք օգտվել Omni-Path-ի հետաձգման և մասշտաբայնության բարելավումներից՝ AI-ի աշխատանքային ծանրաբեռնվածությունն աջակցելու համար: Դա մեզ ավելի է ոգևորում այդ առավելությունները կիսել մեր հաճախորդների և գործընկերների հետ: Մենք, անշուշտ, նկատել ենք, որ, ինչպես ավանդական HPC-ում, ենթակառուցվածքների ընդլայնումը միակ ճանապարհն է, բայց խնդիրն այն է, որ ցանցի աշխատանքը հեշտությամբ խեղդվում է Ethernet-ի և այլ ավանդական ցանցերի կողմից:

Ի՞նչ փոփոխություններ եք կանխատեսում արդյունաբերության մեջ գեներատիվ AI-ի գալուստով:

Նախ, գեներատիվ AI-ի օգտագործումը մարդկանց ավելի արդյունավետ կդարձնի. պատմության մեջ ոչ մի տեխնոլոգիա մարդկանց հնացած չի դարձրել: Յուրաքանչյուր տեխնոլոգիական էվոլյուցիա և հեղափոխություն, որը մենք ունեցել ենք՝ բամբակյա ջուլհակից մինչև ավտոմատ ջուլհակը, հեռախոսը, ինտերնետը և ավելին, որոշ աշխատանքներ ավելի արդյունավետ են դարձրել, բայց մենք չենք ոչնչացրել մարդկությանը:

Գեներատիվ AI-ի կիրառման միջոցով, ես կարծում եմ, որ ընկերությունները տեխնոլոգիապես ավելի արագ կզարգանան, քանի որ ընկերությունը ղեկավարողները ավելի շատ ազատ ժամանակ կունենան այդ առաջընթացի վրա կենտրոնանալու համար: Օրինակ, եթե գեներատիվ AI-ն ապահովում է ավելի ճշգրիտ կանխատեսումներ, հաշվետվություններ, պլանավորում և այլն, ընկերությունները կարող են կենտրոնանալ նորարարությունների վրա իրենց փորձագիտական ​​ոլորտում:

Ես հատկապես զգում եմ, որ AI-ն մեզանից յուրաքանչյուրին կդարձնի բազմամասնագիտական ​​փորձագետ: Օրինակ, որպես մասշտաբային ծրագրային ապահովման փորձագետ, ես հասկանում եմ կապերը HPC-ի, մեծ տվյալների, ամպի և AI հավելվածների միջև, որոնք նրանց մղում են դեպի լուծումներ, ինչպիսին է Omni-Path-ը: Հագեցած լինելով արհեստական ​​ինտելեկտի գեներացնող օգնականով, ես կարող եմ ավելի խորանալ դրա մեջ իմաստ մեր հաճախորդների կողմից օգտագործվող հավելվածներից: Ես կասկած չունեմ, որ դա կօգնի մեզ նախագծել էլ ավելի արդյունավետ սարքավորումներ և ծրագրային ապահովում շուկաների և հաճախորդների համար, որոնց մենք սպասարկում ենք:

Ես նաև կանխատեսում եմ ծրագրային ապահովման որակի ընդհանուր բարելավում: AI-ն կարող է արդյունավետորեն գործել որպես «աչքերի մեկ այլ խումբ»՝ ստատիկ կերպով վերլուծելու կոդը և զարգացնելու սխալների և կատարողական խնդիրների մասին պատկերացումները: Սա հատկապես հետաքրքիր կլինի մեծ մասշտաբներով, որտեղ կատարողականի խնդիրները կարող են հատկապես դժվար նկատել և թանկ լինել՝ վերարտադրելը:

Վերջապես, ես հուսով եմ և հավատում եմ, որ գեներատիվ AI-ն կօգնի մեր ոլորտին պատրաստել և ներգրավել ավելի շատ ծրագրային ապահովման մասնագետների՝ առանց AI-ի և HPC-ի նախկին փորձի: Մեր ոլորտը կարող է շատերին սարսափելի թվալ, և կարող է ժամանակ պահանջվել «զուգահեռ մտածել» սովորելու համար։ Սկզբունքորեն, ճիշտ այնպես, ինչպես մեքենաներն են հեշտացրել իրերի արտադրությունը, գեներատիվ AI-ն ավելի հեշտ կդարձնի հայեցակարգերի քննարկումն ու տրամաբանությունը:

Կա՞ որևէ այլ բան, որը կցանկանայիք կիսվել ձեր աշխատանքի կամ ընդհանրապես Cornelis Networks-ի մասին:

Ես կցանկանայի խրախուսել բոլորին, ովքեր հետաքրքրված են, որ կարիերան շարունակեն համակարգչային ոլորտում, հատկապես HPC-ի և AI-ի ոլորտում: Այս ոլորտում մենք համալրված ենք երբևէ ստեղծված ամենահզոր հաշվողական ռեսուրսներով և դրանք դիմակայում ենք մարդկության ամենամեծ մարտահրավերներին: Դա հուզիչ վայր է, և ես վայելել եմ այն ​​ամեն քայլափոխի: Generative AI-ն մեր ոլորտն ավելի նոր բարձունքների է հասցնում, քանի որ կարողությունների աճի պահանջարկը կտրուկ մեծանում է: Ես չեմ կարող սպասել, թե ուր ենք գնալու հաջորդը:

Շնորհակալություն հիանալի հարցազրույցի համար, այն ընթերցողները, ովքեր ցանկանում են ավելին իմանալ, պետք է այցելեն Cornelis Networks.

unite.AI-ի հիմնադիր գործընկեր և անդամ Forbes-ի տեխնոլոգիական խորհուրդը, Անտուանը ա ֆուտուրիստ ով կրքոտ է AI-ի և ռոբոտաշինության ապագայով:

Նա նաև հիմնադիրն է Securities.io, վեբկայք, որը կենտրոնանում է խանգարող տեխնոլոգիայի մեջ ներդրումներ կատարելու վրա: