քոթուկ The Future of Generative AI is the Edge - Unite.AI
Միացեք մեզ

Մտքի առաջնորդներ

Generative AI-ի ապագան ծայր է

mm

Հրատարակված է

 on

ChatGPT-ի գալուստը և Գեներատիվ AI ընդհանուր առմամբ, ջրբաժան է տեխնոլոգիայի պատմության մեջ և նմանեցվում է ինտերնետի և սմարթֆոնի արշալույսին: Generative AI-ն անսահման ներուժ է ցույց տվել խելացի խոսակցություններ վարելու, քննություններ հանձնելու, բարդ ծրագրեր/կոդեր ստեղծելու և գրավիչ պատկերներ և տեսանյութեր ստեղծելու ունակությամբ: Թեև GPU-ներն աշխատում են Gen AI մոդելների մեծամասնությունը ամպի մեջ՝ և՛ ուսուցման, և՛ եզրակացությունների համար, սա երկարաժամկետ մասշտաբային լուծում չէ, հատկապես եզրակացության համար՝ հաշվի առնելով այն գործոնները, որոնք ներառում են ծախսը, հզորությունը, հետաձգումը, գաղտնիությունը և անվտանգությունը: Այս հոդվածը անդրադառնում է այս գործոններից յուրաքանչյուրին, ինչպես նաև ոգեշնչող օրինակներ՝ Gen AI-ի հաշվարկային ծանրաբեռնվածությունը եզրին տեղափոխելու համար:

Հավելվածների մեծ մասն աշխատում է բարձր արդյունավետությամբ պրոցեսորների վրա՝ կամ սարքի վրա (օրինակ՝ սմարթֆոններ, աշխատասեղաններ, նոութբուքեր) կամ տվյալների կենտրոններում: Քանի որ AI-ն օգտագործող հավելվածների մասնաբաժինը մեծանում է, միայն պրոցեսորներով այս պրոցեսորները անբավարար են: Ավելին, Generative AI-ի աշխատանքային ծանրաբեռնվածության արագ ընդլայնումը առաջացնում է AI-ով միացված սերվերների էքսպոնենցիալ պահանջարկ՝ թանկարժեք, էներգիա պահանջող GPU-ներով, ինչը, իր հերթին, բարձրացնում է ենթակառուցվածքի ծախսերը: Այս AI սերվերները կարող են արժենալ ավելի քան 7X, քան սովորական սերվերի գինը, իսկ GPU-ները կազմում են այս ավելացված արժեքի 80%-ը:

Բացի այդ, ամպի վրա հիմնված սերվերը սպառում է 500W-ից մինչև 2000W, մինչդեռ AI-ի վրա աշխատող սերվերը սպառում է 2000W-ից մինչև 8000W՝ 4 անգամ ավելի: Այս սերվերներին աջակցելու համար տվյալների կենտրոններին անհրաժեշտ են լրացուցիչ հովացման մոդուլներ և ենթակառուցվածքների արդիականացումներ, որոնք կարող են նույնիսկ ավելի բարձր լինել, քան հաշվարկային ներդրումները: Տվյալների կենտրոններն արդեն սպառում են տարեկան 300 TWH, ամբողջ աշխարհում էլեկտրաէներգիայի սպառման գրեթե 1%-ը Եթե ​​AI-ի ընդունման միտումները շարունակվեն, ապա մինչև 5 թվականը համաշխարհային էներգիայի 2030%-ը կարող է օգտագործվել տվյալների կենտրոնների կողմից: Բացի այդ, աննախադեպ ներդրումներ կան Generative AI տվյալների կենտրոններում: Ենթադրվում է, որ տվյալների կենտրոնները կսպառեն մինչև 500 մլրդ դոլար կապիտալ ծախսերի համար մինչև 2027թ, հիմնականում սնվում է AI ենթակառուցվածքի պահանջներից:

Տվյալների կենտրոնների էլեկտրաէներգիայի սպառումը, որն արդեն 300 TwH է, զգալիորեն կբարձրանա գեներատիվ AI-ի ընդունմամբ:

AI-ի հաշվարկային արժեքը, ինչպես նաև էներգիայի սպառումը կխոչընդոտեն Generative AI-ի զանգվածային ընդունմանը: Սանդղակի մեծացման մարտահրավերները կարող են հաղթահարվել՝ AI-ի հաշվարկը հասցնելով եզրին և օգտագործելով AI-ի ծանրաբեռնվածության համար օպտիմիզացված մշակման լուծումներ: Այս մոտեցմամբ հաճախորդին ձեռք են բերում նաև այլ առավելություններ, ներառյալ ուշացումը, գաղտնիությունը, հուսալիությունը, ինչպես նաև կարողությունների բարձրացումը:

Հաշվարկը հետևում է տվյալներին դեպի Edge

Դեռ մեկ տասնամյակ առաջ, երբ AI-ն ի հայտ եկավ ակադեմիական աշխարհից, արհեստական ​​ինտելեկտի մոդելների ուսուցումն ու եզրակացությունը տեղի ունեցավ ամպի/տվյալների կենտրոնում: Քանի որ տվյալների մեծ մասը ստեղծվում և սպառվում է ծայրամասում, հատկապես՝ վիդեո, տրամաբանական է միայն տվյալների եզրակացությունը տեղափոխել եզրին՝ դրանով իսկ բարելավելով ձեռնարկությունների սեփականության ընդհանուր արժեքը (TCO)՝ ցանցի և հաշվարկային ծախսերի կրճատման պատճառով: Մինչ ամպի վրա AI եզրակացության ծախսերը կրկնվում են, եզրին եզրակացության արժեքը միանգամյա ապարատային ծախս է: Ըստ էության, Edge AI պրոցեսորով համակարգի ընդլայնումը նվազեցնում է ընդհանուր գործառնական ծախսերը: Ինչպես սովորական արհեստական ​​ինտելեկտի աշխատանքային բեռների տեղափոխումը դեպի Edge (օրինակ՝ սարքավորում, սարք), այնպես էլ Generative AI-ի աշխատանքային բեռները կհետևեն օրինակին: Սա զգալի խնայողություններ կբերի ձեռնարկություններին և սպառողներին։

Եզրակացության գործառույթները կատարելու համար արդյունավետ արհեստական ​​ինտելեկտի արագացուցիչով զուգակցված եզրագծին անցնելը նաև այլ առավելություններ է տալիս: Դրանցից գլխավորը ուշացումն է: Օրինակ, խաղային հավելվածներում ոչ խաղացող կերպարները (NPC) կարող են կառավարվել և ավելացվել՝ օգտագործելով գեներատիվ AI: Օգտագործելով LLM մոդելներ, որոնք աշխատում են խաղային վահանակի կամ ԱՀ-ի եզրային AI արագացուցիչների վրա, խաղացողները կարող են այս կերպարներին տալ հատուկ նպատակներ, որպեսզի նրանք կարողանան իմաստալից մասնակցել պատմությանը: Տեղական եզրային եզրակացության ցածր հետաձգումը թույլ կտա NPC-ի խոսքին և շարժումներին իրական ժամանակում արձագանքել խաղացողների հրամաններին և գործողություններին: Սա կապահովի խաղերի շատ ընկղմված փորձ՝ ծախսարդյունավետ և էներգաարդյունավետ եղանակով:

Այնպիսի ծրագրերում, ինչպիսիք են առողջապահությունը, գաղտնիությունը և հուսալիությունը չափազանց կարևոր են (օրինակ՝ հիվանդների գնահատումը, դեղերի վերաբերյալ առաջարկությունները): Տվյալները և հարակից Gen AI մոդելները պետք է լինեն տեղում՝ հիվանդի տվյալները (գաղտնիությունը) պաշտպանելու համար, և ցանցի ցանկացած խափանում, որը արգելափակում է ամպային արհեստական ​​ինտելեկտի մոդելների մուտքը, կարող է աղետալի լինել: Edge AI սարքը, որն աշխատում է Gen AI մոդելի նպատակներով, որը ստեղծվել է յուրաքանչյուր ձեռնարկության հաճախորդի համար, այս դեպքում՝ առողջապահական ծառայություններ մատուցողի համար, կարող է անխափան լուծել գաղտնիության և հուսալիության խնդիրները՝ միաժամանակ ապահովելով ավելի ցածր ուշացում և ծախս:

Ծայրամասային սարքերի վրա գեներատիվ AI-ն կապահովի խաղերի ցածր ուշացում և կպահպանի հիվանդների տվյալները և կբարելավի առողջության պահպանման հուսալիությունը:

Շատ Gen AI մոդելներ, որոնք աշխատում են ամպի վրա, կարող են լինել մոտ տրիլիոն պարամետր. այս մոդելները կարող են արդյունավետորեն լուծել ընդհանուր նշանակության հարցումները: Այնուամենայնիվ, ձեռնարկության հատուկ ծրագրերը պահանջում են, որ մոդելները տրամադրեն արդյունքներ, որոնք վերաբերում են օգտագործման դեպքին: Վերցրեք Gen AI-ի վրա հիմնված օգնականը, որը ստեղծվել է արագ սննդի ռեստորանում պատվերներ ընդունելու համար. որպեսզի այս համակարգը հաճախորդների հետ անխափան փոխազդեցություն ունենա, Gen AI-ի հիմքում ընկած մոդելը պետք է վերապատրաստվի ռեստորանի մենյուի տարրերի վերաբերյալ՝ նաև իմանալով ալերգենների և բաղադրիչների մասին: . Մոդելի չափը կարող է օպտիմիզացվել՝ օգտագործելով սուպերսեթ Large Language Model (LLM)՝ համեմատաբար փոքր, 10-30 միլիարդ պարամետրով LLM վարժեցնելու համար, այնուհետև օգտագործեք լրացուցիչ ճշգրտում հաճախորդի հատուկ տվյալների հետ: Նման մոդելը կարող է արդյունքներ տալ բարձր ճշգրտությամբ և կարողությամբ: Եվ հաշվի առնելով մոդելի ավելի փոքր չափը, այն կարող է արդյունավետ կերպով տեղակայվել Edge-ում գտնվող AI արագացուցիչի վրա:

Gen AI կհաղթի Եզրում

Միշտ կլինի Gen AI-ի կարիքը, որն աշխատում է ամպում, հատկապես ընդհանուր նշանակության հավելվածների համար, ինչպիսիք են ChatGPT-ն և Claude-ը: Բայց երբ խոսքը վերաբերում է ձեռնարկություններին հատուկ հավելվածներին, ինչպիսիք են Adobe Photoshop-ի գեներատիվ լրացումը կամ Github-ի համալրումը, Generative AI-ն Edge-ում ոչ միայն ապագան է, այլև ներկան: Նպատակով կառուցված AI արագացուցիչները դա հնարավոր դարձնելու բանալին են:

Որպես Սիլիկոնյան հովտի վետերան և գործադիր տնօրեն Kinara IncRavi Annavajjhala-ն բերում է ավելի քան 20 տարվա փորձ՝ ընդգրկելով բիզնեսի զարգացումը, մարքեթինգը և ճարտարագիտությունը, ստեղծելով առաջատար տեխնոլոգիական արտադրանք և
դրանք շուկա բերելով։ Իր ներկայիս պաշտոնում՝ որպես Deep Vision-ի գլխավոր գործադիր տնօրեն, Ռավին ծառայում է
նրա տնօրենների խորհուրդը և հավաքել է $50 մլն՝ ընկերության Ara-1 պրոցեսորը նախասիլիկոնից հասցնելով մինչև
լայնածավալ արտադրություն և 2-րդ սերնդի պրոցեսորի՝ Ara-2-ի ծավալը բարձրացնելու համար։ Նախքան միանալը
Deep Vision-ը Ռավին զբաղեցրել է գործադիր ղեկավար պաշտոններ Intel-ում և SanDisk-ում, որտեղ նա խաղացել է հիմնական դերեր
եկամուտների աճի խթանման, ռազմավարական գործընկերության զարգացման և արտադրանքի ճանապարհային քարտեզների մշակման գործում
Առաջնորդեց արդյունաբերությունը առաջադեմ առանձնահատկություններով և հնարավորություններով: