քոթուկ Ավանդական մեքենայական ուսուցումը դեռ տեղին է: - Միացեք.AI
Միացեք մեզ

Արհեստական ​​բանականություն

Ավանդական մեքենայական ուսուցումը դեռ տեղին է:

mm

Հրատարակված է

 on

Ավանդական մեքենայական ուսուցումը դեռ տեղին է:

Վերջին տարիներին Generative AI-ն խոստումնալից արդյունքներ է ցույց տվել AI-ի բարդ խնդիրների լուծման գործում: Ժամանակակից AI մոդելները, ինչպիսիք են Զրուցարան GPT, Բարդ, Զանգեր, DALL-E.3, եւ SAM ցուցադրել են ուշագրավ կարողություններ բազմամասնագիտական ​​խնդիրների լուծման գործում, ինչպիսիք են տեսողական հարցերի պատասխանը, հատվածավորումը, պատճառաբանությունը և բովանդակության ստեղծումը:

Ավելին, Մուլտիմոդալ AI ի հայտ են եկել տեխնիկա, որոնք կարող են միաժամանակ մշակել տվյալների բազմաթիվ եղանակներ, այսինքն՝ տեքստ, պատկերներ, աուդիո և տեսանյութեր միաժամանակ: Այս առաջընթացներով բնական է մտածել ավանդական մեքենայական ուսուցում (ML)?

Այս հոդվածում մենք կանդրադառնանք մեքենայական ուսուցման ավանդական լանդշաֆտի վիճակին ժամանակակից գեներատիվ AI նորարարությունների վերաբերյալ:

Ի՞նչ է ավանդական մեքենայական ուսուցումը: - Որո՞նք են դրա սահմանափակումները:

Ավանդական մեքենայական ուսուցումը լայն տերմին է, որն ընդգրկում է ալգորիթմների լայն տեսականի, որոնք հիմնականում պայմանավորված են վիճակագրությամբ: Ավանդական ML ալգորիթմների երկու հիմնական տեսակներն են վերահսկվող և չվերահսկվող. Այս ալգորիթմները նախատեսված են կառուցվածքային տվյալների հավաքածուներից մոդելներ մշակելու համար:

Ստանդարտ ավանդական մեքենայական ուսուցման ալգորիթմները ներառում են.

  • Ռեգրեսիայի ալգորիթմներ, ինչպիսիք են գծային, լասո և սրածայր:
  • K-նշանակում է Clustering.
  • Հիմնական բաղադրիչի վերլուծություն (PCA):
  • Աջակցող վեկտորային մեքենաներ (SVM):
  • Ծառերի վրա հիմնված ալգորիթմներ, ինչպիսիք են որոշման ծառերը և պատահական անտառները:
  • Խթանող մոդելներ, ինչպիսիք են գրադիենտ խթանումը և XGBoost.

Ավանդական մեքենայական ուսուցման սահմանափակումները

Ավանդական ML-ն ունի հետևյալ սահմանափակումները.

  1. Սահմանափակ մասշտաբայնություն. Այս մոդելները հաճախ օգնության կարիք ունեն՝ մեծ և բազմազան տվյալների հավաքածուներով մասշտաբավորելու համար:
  2. Տվյալների նախնական մշակում և առանձնահատկությունների ճարտարագիտություն. Ավանդական ML-ը պահանջում է լայնածավալ նախնական մշակում՝ տվյալների հավաքածուները փոխակերպելու համար՝ ըստ մոդելի պահանջների: Նաև առանձնահատկությունների ճարտարագիտությունը կարող է ժամանակատար լինել և պահանջում է բազմակի կրկնություններ՝ տվյալների առանձնահատկությունների միջև բարդ հարաբերությունները գրավելու համար:
  3. Բարձրաչափ և չկառուցված տվյալներ. Ավանդական ML-ը պայքարում է տվյալների բարդ տեսակների հետ, ինչպիսիք են պատկերները, աուդիոները, տեսանյութերը և փաստաթղթերը:
  4. Հարմարվողականություն չտեսնված տվյալներին. Այս մոդելները կարող են լավ չհարմարվել իրական աշխարհի տվյալներին, որոնք դրանց մաս չեն կազմել վերապատրաստման տվյալները.

Նյարդային ցանց. մեքենայական ուսուցումից անցում դեպի խորը ուսուցում և ավելին

Նյարդային ցանց. մեքենայական ուսուցումից անցում դեպի խորը ուսուցում և ավելին

Նյարդային ցանցի (NN) մոդելները շատ ավելի բարդ են, քան մեքենայական ուսուցման ավանդական մոդելները: Ամենապարզ NN – Բազմաշերտ պերցեպտրոն (MLP) բաղկացած է մի քանի նեյրոններից, որոնք միացված են իրար՝ տեղեկատվությունը հասկանալու և առաջադրանքներ կատարելու համար, որոնք նման են մարդու ուղեղի աշխատանքին:

Նյարդային ցանցերի տեխնիկայի առաջընթացը հիմք է հանդիսացել անցման համար մեքենայական ուսուցում մինչև խորը ուսուցում. Օրինակ, համակարգչային տեսողության առաջադրանքների համար օգտագործվող NN (օբյեկտների հայտնաբերում և պատկերի հատվածավորում) կոչվում են կոնվոլյուցիոն նեյրոնային ցանցեր (CNN), Օրինակ, AlexNet, ResNet, եւ YOLO.

Այսօր գեներատիվ AI տեխնոլոգիան մեկ քայլ առաջ է տանում նեյրոնային ցանցի տեխնիկան՝ թույլ տալով նրան գերազանցել AI տարբեր տիրույթներում: Օրինակ, բնական լեզվի մշակման առաջադրանքների համար օգտագործվող նեյրոնային ցանցերը (օրինակ՝ տեքստի ամփոփումը, հարցերի պատասխանը և թարգմանությունը) հայտնի են որպես. փոխակերպվող խաղալիքներ. Տրանսֆորմատորների նշանավոր մոդելները ներառում են ԲԵՐՏ, GPT-4, եւ T5. Այս մոդելները ազդեցություն են թողնում ոլորտների վրա՝ սկսած առողջապահությունից, մանրածախ առևտրից, մարքեթինգից, ֆինանսավորելԵւ այլն:

Արդյո՞ք մեզ դեռ պետք են ավանդական մեքենայական ուսուցման ալգորիթմներ:

Արդյո՞ք մեզ դեռ պետք են ավանդական մեքենայական ուսուցման ալգորիթմներ:

Մինչ նեյրոնային ցանցերը և դրանց ժամանակակից տարբերակները, ինչպիսիք են տրանսֆորմատորները, մեծ ուշադրության են արժանացել, ավանդական ML մեթոդները մնում են կարևոր: Եկեք նայենք, թե ինչու են դրանք դեռ արդիական:

1. Տվյալների ավելի պարզ պահանջներ

Նյարդային ցանցերը վերապատրաստման համար պահանջում են տվյալների մեծ հավաքածուներ, մինչդեռ ML մոդելները կարող են զգալի արդյունքների հասնել ավելի փոքր և պարզ տվյալների հավաքածուներով: Այսպիսով, ML-ն նախընտրելի է խորը ուսուցման նկատմամբ ավելի փոքր կառուցվածքային տվյալների հավաքածուների համար և հակառակը:

2. Պարզություն և մեկնաբանելիություն

Ավանդական մեքենայական ուսուցման մոդելները կառուցված են ավելի պարզ վիճակագրական և հավանականության մոդելների վրա: Օրինակ՝ լավագույնս հարմարեցված գիծը գծային հետընթաց հաստատում է մուտք-ելք հարաբերությունները՝ օգտագործելով նվազագույն քառակուսիների մեթոդը՝ վիճակագրական գործողություն:

Նմանապես, որոշումների ծառերը օգտագործում են հավանականության սկզբունքները տվյալների դասակարգման համար: Նման սկզբունքների օգտագործումն առաջարկում է մեկնաբանելիություն և հեշտացնում է արհեստական ​​ինտելեկտի պրակտիկանտների համար ML ալգորիթմների աշխատանքը:

Ժամանակակից NN ճարտարապետությունները, ինչպիսիք են տրանսֆորմատորները և դիֆուզիոն մոդելները (սովորաբար օգտագործվում են նման պատկերների ստեղծման համար Կայուն դիֆուզիոն or Միջին ճանապարհորդություն) ունեն բարդ բազմաշերտ ցանցային կառուցվածք: Նման ցանցերի ըմբռնումը պահանջում է առաջադեմ մաթեմատիկական հասկացությունների ըմբռնում: Այդ իսկ պատճառով դրանք կոչվում են նաև «Սև արկղեր»:

3. Ռեսուրսների արդյունավետություն

Ժամանակակից նեյրոնային ցանցերը, ինչպիսիք են Large Language Models (LLMs) մոդելները, վերապատրաստվում են թանկարժեք GPU-ների կլաստերների վրա՝ ըստ իրենց հաշվողական պահանջների: Օրինակ, GPT4-ի վրա, ըստ տեղեկությունների, վերապատրաստվել է 25000 Nvidia GPU 90-ից 100 օրվա ընթացքում:

Այնուամենայնիվ, թանկարժեք սարքավորումները և երկար ուսուցման ժամանակը հնարավոր չէ յուրաքանչյուր պրակտիկանտի կամ AI թիմի համար: Մյուս կողմից, ավանդական մեքենայական ուսուցման ալգորիթմների հաշվողական արդյունավետությունը թույլ է տալիս պրակտիկանտներին հասնել իմաստալից արդյունքների նույնիսկ սահմանափակ ռեսուրսների դեպքում:

4. Ոչ բոլոր խնդիրները խորը ուսուցման կարիք ունեն

Խորը ուսուցում բոլոր խնդիրների բացարձակ լուծումը չէ: Կան որոշակի սցենարներ, երբ ML-ն գերազանցում է խորը ուսուցմանը:

Օրինակ, ներս բժշկական ախտորոշում և կանխատեսում սահմանափակ տվյալների հետ, ML ալգորիթմ համար անոմալիաների հայտնաբերում REMED-ի նման ավելի լավ արդյունքներ է տալիս, քան խորը ուսուցումը: Նմանապես, ավանդական մեքենայական ուսուցումը նշանակալի է ցածր հաշվողական հզորությամբ սցենարներում, որպես ա ճկուն և արդյունավետ լուծում.

Նախևառաջ, ցանկացած խնդրի համար լավագույն մոդելի ընտրությունը կախված է կազմակերպության կամ պրակտիկ մասնագետի կարիքներից և առկա խնդրի բնույթից:

Մեքենայի ուսուցում 2023 թ

Մեքենայի ուսուցում 2023 թ

Պատկերը ստեղծվել է օգտագործելով Լեոնարդո Ա.Ի

2023 թվականին ավանդական մեքենայական ուսուցումը շարունակում է զարգանալ և մրցակցել խորը ուսուցման և գեներատիվ AI-ի հետ: Այն ունի մի քանի կիրառություն արդյունաբերության մեջ, մասնավորապես, երբ գործ ունենք կառուցվածքային տվյալների հավաքածուների հետ:

Օրինակ՝ շատերը Արագ շարժվող սպառողական ապրանքներ (FMCG) ընկերությունները զբաղվում են աղյուսակային տվյալների մեծ մասի հետ՝ հիմնվելով ML ալգորիթմների վրա՝ կարևոր առաջադրանքների համար, ինչպիսիք են անհատականացված արտադրանքի առաջարկությունները, գների օպտիմալացումը, գույքագրման կառավարումը և մատակարարման շղթայի օպտիմալացումը:

Ավելին, շատերը տեսողության և լեզվի մոդելներ դեռևս հիմնված են ավանդական տեխնիկայի վրա՝ առաջարկելով լուծումներ հիբրիդային մոտեցումներում և առաջացող հավելվածներում: Օրինակ, վերջերս մի ուսումնասիրություն վերնագրված «Արդյո՞ք մեզ իսկապես անհրաժեշտ են խորը ուսուցման մոդելներ ժամանակային շարքերի կանխատեսման համար:Քննարկվել է, թե ինչպես են գրադիենտ խթանող ռեգրեսիոն ծառերը (GBRT) ավելի արդյունավետ ժամանակային շարքերի կանխատեսում քան խորը նյարդային ցանցերը:

ML-ի մեկնաբանելիությունը մնում է շատ արժեքավոր այնպիսի մեթոդների հետ, ինչպիսիք են SHAP (Shapley Additive Explanations) և ԼԱՅՆ (Տեղական մեկնաբանելի մոդել-ագնոստիկ բացատրություններ): Այս տեխնիկան բացատրում է ML-ի բարդ մոդելները և տալիս է պատկերացում դրանց կանխատեսումների մասին՝ այդպիսով օգնելով ՄԼ պրակտիկանտներին ավելի լավ հասկանալ իրենց մոդելները:

Ի վերջո, ավանդական մեքենայական ուսուցումը մնում է կայուն լուծում տարբեր ոլորտների համար, որոնք վերաբերում են մասշտաբայնությանը, տվյալների բարդությանը և ռեսուրսների սահմանափակումներին: Այս ալգորիթմներն անփոխարինելի են տվյալների վերլուծության և կանխատեսող մոդելավորման համար և կշարունակեն լինել տվյալների գիտնականի զինանոցը.

Եթե ​​նման թեմաները ձեզ հետաքրքրում են, ուսումնասիրեք Միավորել AI-ն հետագա պատկերացումների համար: