- Տերմինաբանություն (Ա-ից Դ)
- AI կարողությունների վերահսկում
- AI Ops
- ալբոմներ
- Ակտիվների կատարողականը
- Ավտոկոդավորիչ
- Հետ տարածում
- Բեյսի թեորեմ
- Մեծ Data
- Chatbot: Սկսնակների ուղեցույց
- Հաշվարկային մտածողություն
- Համակարգչային տեսլականը
- Շփոթության մատրիցա
- Convolutional նյարդային ցանցեր
- Cybersecurity- ը
- Տվյալների գործվածք
- Տվյալների Պատմություն
- Data Science
- Տվյալների պահպանում
- Որոշման ծառ
- Deepfakes
- Խորը ուսուցում
- Deep Reinforcement Learning
- Devops
- DevSecOps
- Դիֆուզիոն մոդելներ
- Թվային երկվորյակներ
- Չափերի կրճատում
- Տերմինաբանություն (E-ից K)
- Edge AI
- Զգացմունք AI
- Համույթի ուսուցում
- Էթիկական հակերություն
- ETL
- Բացատրելի AI
- Դաշնային ուսուցում
- Եզրաշերտ
- Գեներատիվ AI
- Generative Adversarial Network
- Գեներատիվ ընդդեմ խտրական
- Գրադիենտի բարձրացում
- Գրադիենտ ծագում
- Few-Shot ուսուցում
- Պատկերների դասակարգում
- ՏՏ գործառնություններ (ITOs)
- Միջադեպերի ավտոմատացում
- Ազդեցության ճարտարագիտություն
- K-Means Clustering
- K-Մոտակա հարևանները
- Տերմինաբանություն (L-ից Q)
- Տերմինաբանություն (R-ից Z)
- Ամրապնդման ուսուցում
- Պատասխանատու AI
- RLHF
- Ռոբոտների գործընթացների ավտոմատացում
- Structured vs Unstructured
- Զգայականության վերլուծություն
- Վերահսկվող vs Չվերահսկվող
- Աջակցեք վեկտորային մեքենաներին
- Սինթետիկ տվյալներ
- Սինթետիկ մեդիա
- Տեքստի դասակարգում
- TinyML
- Տրանսֆերային ուսուցում
- Տրանսֆորմատորային նեյրոնային ցանցեր
- Turing Test
- Վեկտորի նմանության որոնում
AI 101 թ
Արտահերթ ընդդեմ մեքենայական ուսուցման հատուկ մոդելների:
Հրատարակված է
3 տարի առաջon
By
Ջոշ ՄիրամանտԲովանդակություն
Ե՞րբ է շինարարությունն ավելի լավ, քան վաճառվող լուծում գնելը:
Ընկերությունները կարող են ներգրավվել մոդելի մշակման տարբեր մոտեցումներով: Ամբողջությամբ կառավարվող ML ծառայություններից մինչև հատուկ մոդելներ: Կախված բիզնեսի պահանջներից, առկա փորձագիտությունից և պլանավորման սահմանափակումներից՝ նրանք պետք է ընտրություն կատարեն՝ արդյո՞ք զրոյից մշակեն անհատական լուծումներ: Թե՞ նրանք պետք է ընտրեն առանց խանութի ծառայություն:
ML աշխատանքային ծանրաբեռնվածության բոլոր փուլերի համար պետք է որոշում կայացվի, թե ինչպես են տարբեր գլուխկոտրուկները կհամապատասխանեն միմյանց: Տվյալների հավաքագրումից, պատրաստումից և վիզուալիզացիայից մինչև ճարտարագիտություն, մոդելների ուսուցում և գնահատում, մեքենայական ուսուցման ինժեներները բազմիցս իրենց տալիս են նույն հարցը. Թե՞ դա կլինի անվճար ծառայություն:
Բայց ե՞րբ է շինարարությունն ավելի լավ, քան վաճառվող լուծում գնելը: Հիմնական տարբերակիչ գործոնները երկու մոտեցումների միջև՝ նախնական մշակման ջանքեր, զարգացման արագություն և անհրաժեշտ փորձաքննություն:
Ինչի՞ մասին պետք է հաշվի առնել, երբ որոշել եք օգտագործել մեքենայական ուսուցման մոդելներ, որոնք նախատեսված են վաճառակետում:
Նախամշակման ջանքեր
ML նախագծերը բախվում են բոլոր տեսակի մարտահրավերների, բայց, հավանաբար, ամենամեծ մարտահրավերը վերապատրաստման տվյալների հասանելիությունն է: Վերապատրաստման տվյալների բացակայությունը կարող է դադարեցնել նախագիծը նախքան այն սկսելը: Նախքան նախագիծը սկսելը, այն կարող է զգալի նախամշակման ծախսեր ունենալ՝ տվյալների հավաքագրման, տվյալների պիտակավորման, մաքրման և նախնական մշակման ջանքերից: Սա այն հայտնի ծուղակն է, որում շատ ML նախագծեր ձախողվում են. նախնական մշակումն ավարտվում է հատկացված ռեսուրսների 80%-ով, մինչդեռ իրական մոդելի վերապատրաստման և գնահատման համար քիչ ռեսուրսներ են մնացել:
Արտադրված լուծումները թեթևացնում են նախնական մշակման ջանքերի լարումն ու ցավը: Դրանք կառուցված են ամենատարածված գործողությունները կատարելու համար՝ պահանջվող միայն մի փոքր կոնֆիգուրացիայով: Դրանցից ամենալավն այն է, որ վաճառվող լուծումները գոյություն ունեն ML աշխատանքային ծանրաբեռնվածության բոլոր փուլերի համար:
Մյուս կողմից, պատվերով պատրաստված իրականացումները սովորաբար պահանջում են ավելի շատ նախամշակման ջանքեր: Դա չի նշանակում, որ դրանք պետք է ամբողջությամբ հեռացվեն. նրանցից դեռ պահանջվում է ճշգրտել ՓԼ-ի որոշակի փուլը լուծվող խնդրի առանձնահատկություններին: Հատկապես կեղտոտ տվյալների բազան կարող է պահանջել մաքրման հատուկ կանոններ: Միևնույն ժամանակ, հատուկ առանձնահատկությունների հավաքածուն կարող է պահանջել հատուկ առանձնահատկությունների ճարտարագիտություն, ճիշտ այնպես, ինչպես նեյրոնային ճարտարապետությունը կարող է պահանջել չնչին ճշգրտումներ: Այս դեպքում զրոյից կառուցված մաքսային լուծումները, հավանաբար, կբավարարեն բոլոր կարիքները:
Զարգացման արագություն
Արտահերթ լուծումները կենտրոնանում են ոչ թե իրականացման, այլ կազմաձևման վրա: Փոխանակ ռեսուրսներ հատկացնեն պարզելու համար ինչ պետք է արվի, ՄԼ թիմերը կկենտրոնանան ինչպես Փազլի տարբեր կտորները կհամապատասխանեն միմյանց: Այս մոտեցումը թույլ է տալիս ընկերություններին, հետազոտողներին և ինժեներներին արագորեն իրականացնել նախատիպեր և հայեցակարգի ապացույցներ: Անիվը նորից հայտնագործելու փոխարեն՝ վաճառվող լուծումները հնարավորություն են տալիս օգտագործել առկա գիտելիքները՝ այդպիսով խնայելով զարգացման ժամանակը:
Պատվերով պատրաստված լուծումները, որոնք իրականացվում են զրոյից, հայտնի է, որ դրանք շատ ավելի դանդաղ են մշակման արագությամբ: Դա պայմանավորված է նրանց սպասարկման կարիքների ավելացմամբ. ինժեներները պետք է պարզեն երկուսն էլ ինչ եւ ինչպես լուծմանը։ Նմանապես, որքան ավելի բարդ է լուծումը, այնքան ավելի շատ ժամանակի ռեսուրսներ են պահանջվում արտադրության ընթացքում դրա մասշտաբայնությունն ու հասանելիությունն ապահովելու համար: Այս տեսանկյունից, պատվերով պատրաստված լուծումներն ու ժամանակի ջանքերը ուղիղ համեմատական են. որքան ավելի բարդ է լուծումը, այնքան ավելի շատ ժամանակ կպահանջվի:
Սովորաբար, սակայն, ճշմարտությունն ինչ-որ տեղ մեջտեղում է. գոյություն ունեցող կոդերի բազան կվերագործարկվի և կհարմարեցվի ընթացիկ նախագծի կարիքներին: Այդպիսին է մոդելային ուսուցման հայտնի փոխանցման ուսուցման մոտեցումը:
Փորձաքննություն
Ճիշտ այնպես, ինչպես կան մի քանի շերտեր, որոնցում իրականացվում է մեքենայական ուսուցում, կան նաև փորձաքննության մի քանի մակարդակներ, որոնցում կարող են մշակվել ML մոդելներ՝ սկսած կոդից ազատ միջերեսներից մինչև զրոյից մոդելներ կառուցելը:
Գոյություն ունեն պատրաստի լուծումներ, որոնց համար շատ քիչ մեքենայական ուսուցման փորձ է պահանջվում: Օգտագործելով ինտուիտիվ ինտերֆեյսներ և նույնիսկ քաշել և թողնել մոտեցումները, բոլորի համար (բիզնեսի վերլուծաբաններից մինչև ծրագրային ապահովման ինժեներներ) չափազանց պարզ է դարձել մեքենայական ուսուցման ինչ-որ մոդել ստեղծելն ու տեղակայելը: Թեև մոդելի մշակման այս պարզ մոտեցումը կարող է աշխատել նախատիպային նպատակներով, այն դժվար թե բավարարի արտադրական համակարգերի պահանջները:
Դեռևս պահանջվում է փորձաքննություն՝ արտադրության մեջ առկա լուծումները ճիշտ կարգավորելու, կարգավորելու և պահպանելու համար: Լուծումները, կոդերի տեղադրումը, API-ի տարբեր ինտերֆեյսներին միանալը և տեղակայման հետ կապված խնդիրների լուծումը սովորական առաջադրանքներ են, որոնք անհրաժեշտ են արտադրական միջավայրում մոդելների աշխատանքը ապահովելու համար:
Պատվերով պատրաստված լուծումները սովորաբար իրականացվում են ենթակառուցվածքային մակարդակով, և դա անհնար է. փորձաքննությունը միանշանակ է պահանջվում: Կախված ընկերության չափից և ծրագրի նպատակներից, արտադրական համակարգերը պահպանելու համար կարող են պահանջվել բազմամասնագիտական թիմեր: Տվյալների գիտնականները, ML ինժեներները և բիզնեսի վերլուծաբանները համախմբվում են եզրակացության արդյունքները հասկանալու և արտադրության մոդելները պահպանելու համար:
Ինչ պետք է օգտագործեք. ա պատրաստի, թե՞ հատուկ մեքենայական ուսուցման մոդել:
ML լուծումը կկառուցվի բազմաթիվ առանձին բաղադրիչներից և ծառայություններից, որոնք պետք է միավորվեն որպես համակցված լուծում: Խոսքը երբեք չի վերաբերում 100%-ով պատվերով կամ 100%-ով դուրս գալուն, քանի որ տարբեր բիզնես խնդիրներ պահանջում են տարբեր լուծումներ: Ավելի հաճախ, քան ոչ, ML-ի վրա հիմնված լուծումները ստեղծվում են երկուսի խառնուրդով. վաճառվող ծառայություններ՝ ընդհանուր պատկերացումներ քաղելու համար, համակցված հատուկ մոդելների հետ՝ ճշգրտության բարձրացման և տիրույթի հատուկ գիտելիքների մոդելավորման համար:
Խնդիրն այն է, թե երբ պետք է զրոյից գործադրել հատուկ լուծումներ, և ծրագրի որ մասերը կարող են օգտագործել վաճառվող ծառայությունների առավելությունները: Սա մեծապես կախված է լուծվող խնդրի տեսակից, բիզնեսի պահանջներից, առկա տվյալներից և զարգացման միջավայրի ընդհանուր սահմանափակումներից:
AI-ի և տեխնոլոգիական միտումների մասին ավելին տե՛ս Ջոշ Միրամանտ, Blue Orange Digital-ի տվյալների վրա հիմնված լուծումների գործադիր տնօրեն Supply Chain, Առողջապահական փաստաթղթերի ավտոմատացում, եւ ավելին.
Ձեզ նույնպես կարող է դուր գալ.
Օգտագործեք NLP՝ սոցիալական մեդիայի մեկնաբանությունները դասակարգելու համար
Ինչպես է բարելավվում լեզվի մշակումը Google-ի բաց կոդով BERT մոդելի միջոցով
Ջոշ Միրամանտը գլխավոր տնօրենն է և հիմնադիրը Կապույտ նարնջագույն թվային, տվյալների գիտության և մեքենայական ուսուցման բարձրակարգ գործակալություն՝ գրասենյակներով Նյու Յորքում և Վաշինգտոնում: Miramant-ը հայտնի խոսնակ է, ֆուտուրիստ և ձեռնարկատիրական ընկերությունների և ստարտափների ռազմավարական բիզնեսի և տեխնոլոգիաների խորհրդատու: Նա օգնում է կազմակերպություններին օպտիմալացնել և ավտոմատացնել իրենց բիզնեսը, կիրառել տվյալների վրա հիմնված վերլուծական մեթոդներ և հասկանալ նոր տեխնոլոգիաների ազդեցությունը, ինչպիսիք են արհեստական ինտելեկտը, մեծ տվյալները և իրերի ինտերնետը: