քոթուկ Ապակոդավորման հնարավորություններ և մարտահրավերներ LLM գործակալների համար Generative AI-ում - Unite.AI
Միացեք մեզ

Մտքի առաջնորդներ

Ապակոդավորման հնարավորություններ և մարտահրավերներ LLM գործակալների համար Generative AI-ում

mm

Հրատարակված է

 on

Մենք տեսնում ենք Generative AI հավելվածների առաջընթաց, որոնք սնուցվում են մեծ լեզվական մոդելներով (LLM)՝ հրահանգներից մինչև ընդլայնված սերունդ (RAG) առբերում մինչև գործակալներ: Գործակալների մասին շատ են խոսում արդյունաբերության և հետազոտական ​​շրջանակներում, հիմնականում այն ​​ուժի համար, որ այս տեխնոլոգիան ապահովում է Ձեռնարկությունների հավելվածները փոխակերպելու և հաճախորդների բարձրակարգ փորձառություններ ապահովելու համար: Կան գործակալների կառուցման ընդհանուր օրինաչափություններ, որոնք թույլ են տալիս առաջին քայլերը դեպի արհեստական ​​ընդհանուր ինտելեկտ (AGI):

Իմ նախորդում հոդված, մենք տեսանք օրինաչափությունների ինտելեկտի սանդուղք՝ LLM սնուցվող հավելվածներ ստեղծելու համար: Սկսած հուշումներից, որոնք գրավում են խնդրի տիրույթը և օգտագործում են LLM ներքին հիշողությունը ելք ստեղծելու համար: RAG-ի միջոցով մենք ավելացնում ենք հուշումը վեկտորային տվյալների բազայից որոնված արտաքին գիտելիքներով՝ արդյունքները վերահսկելու համար: Հաջորդը, շղթայելով LLM զանգերը, մենք կարող ենք ստեղծել աշխատանքային հոսքեր՝ բարդ ծրագրեր իրականացնելու համար: Գործակալները դա տեղափոխում են հաջորդ մակարդակ՝ ավտոմատ կերպով որոշելով, թե ինչպես պետք է ձևավորվեն այս LLM շղթաները: Եկեք մանրամասն նայենք.

Գործակալներ – Կափարիչի տակ

Գործակալների հիմնական օրինակն այն է, որ նրանք օգտագործում են LLM-ի լեզվի ըմբռնման հզորությունը՝ պլան կազմելու համար, թե ինչպես լուծել տվյալ խնդիրը: LLM-ը հասկանում է խնդիրը և մեզ տալիս է խնդրի լուծման քայլերի հաջորդականություն: Այնուամենայնիվ, այն չի դադարում դրանով: Գործակալները մաքուր աջակցության համակարգ չեն, որը ձեզ առաջարկություններ կներկայացնի խնդրի լուծման վերաբերյալ, այնուհետև ձեզ կփոխանցի առաջարկվող քայլերը կատարելու էստաֆետը: Գործակալները օժտված են գործիքներով առաջ գնալու և գործողությունները կատարելու համար: Սարսափելի չէ՞

Եթե ​​գործակալին տանք այսպիսի հիմնական հարց.

ՄարդՈ՞ր ընկերությունն է սկսել հեռախոսի գյուտարարը:

Ստորև բերված է մտածողության քայլերի օրինակ, որը կարող է ձեռնարկել գործակալը:

Գործակալ (ՄՏԱԾՈՂ):

  • Միտք. Ես պետք է փնտրեմ հեռախոսի գյուտարարին:
  • գործողությունՈրոնում [հեռախոսի գյուտարար]
  • Դիտարկում՝ Ալեքսանդր Գրեհեմ Բելլ
  • Միտք. Ես պետք է որոնեմ ընկերություն, որը հիմնադրել է Ալեքսանդր Գրեհեմ Բելը
  • գործողությունՈրոնում [ընկերությունը հիմնադրվել է Ալեքսանդր Գրեհեմ Բելի կողմից]
  • Դիտարկում. Ալեքսանդր Գրեհեմ Բելը 1885 թվականին հիմնել է ամերիկյան հեռախոսային և հեռագրական ընկերությունը (AT&T)
  • Միտք. Ես գտել եմ պատասխանը: ես կվերադառնամ։

Գործակալ (ՊԱՏԱՍԽԱՆ): Ալեքսանդր Գրեհեմ Բելը AT&T-ի համահիմնադիրն է 1885 թվականին

Դուք կարող եք տեսնել, որ գործակալը հետևում է խնդիրը ենթախնդիրների բաժանելու մեթոդական ճանապարհին, որոնք կարող են լուծվել կոնկրետ Գործողություններ կատարելով: Գործողությունները այստեղ առաջարկվում են LLM-ի կողմից, և մենք կարող ենք դրանք քարտեզագրել հատուկ գործիքների հետ՝ այս գործողություններն իրականացնելու համար: Մենք կարող ենք ակտիվացնել գործակալի որոնման գործիքը, որպեսզի երբ նա հասկանա, որ LLM-ն տրամադրել է որոնումը որպես գործողություն, նա կանվանի այս գործիքը LLM-ի կողմից տրամադրված պարամետրերով: Այստեղ որոնումը ինտերնետում է, բայց կարող է նաև վերահղվել ներքին գիտելիքների բազայի որոնմանը, ինչպիսին է վեկտորային տվյալների բազան: Համակարգն այժմ դառնում է ինքնաբավ և կարող է պարզել, թե ինչպես լուծել բարդ խնդիրները մի շարք քայլերից հետո: Շրջանակներ, ինչպիսիք են LangChain և LLaMAIndex-ը ձեզ հեշտ ճանապարհ է տալիս ստեղծելու այս գործակալները և միանալու գործիքներին և API-ին: Amazon-ը վերջերս գործարկել է իր Bedrock Agents շրջանակը, որն ապահովում է տեսողական ինտերֆեյս նախագծման գործակալների համար:

Կափարիչի տակ գործակալները հետևում են LLM-ին հուշումներ ուղարկելու հատուկ ոճին, ինչը նրանց ստիպում է ստեղծել գործողությունների ծրագիր: Վերոնշյալ Thought-Action-Observation օրինաչափությունը տարածված է մի տեսակի գործակալի մեջ, որը կոչվում է ReAct (պատճառաբանություն և գործողություն): Գործակալների այլ տեսակներ ներառում են MRKL և Plan & Execute, որոնք հիմնականում տարբերվում են իրենց հուշման ոճով:

Ավելի բարդ գործակալների համար գործողությունները կարող են կապված լինել աղբյուրների համակարգերում փոփոխություններ առաջացնող գործիքների հետ: Օրինակ, մենք կարող ենք գործակալին միացնել մի գործիքի, որը ստուգում է արձակուրդի մնացորդը և դիմում է աշխատողի համար ERP համակարգում արձակուրդ ստանալու համար: Այժմ մենք կարող ենք ստեղծել գեղեցիկ չաթ-բոտ, որը կշփվի օգտատերերի հետ և չաթի հրամանի միջոցով դիմել համակարգից արձակուրդի համար: Այլևս չկան տերևների համար դիմելու բարդ էկրաններ, պարզ միասնական զրույցի ինտերֆեյս: Հուզիչ է հնչում:

Զգուշացումներ և պատասխանատու AI-ի անհրաժեշտություն

Հիմա ինչ, եթե մենք ունենք գործիք, որը կանչում է գործարքներ ֆոնդային առևտրի ժամանակ՝ օգտագործելով նախապես լիազորված API: Դուք ստեղծում եք հավելված, որտեղ գործակալը ուսումնասիրում է բաժնետոմսերի փոփոխությունները (գործիքների միջոցով) և որոշումներ է կայացնում ձեր փոխարեն բաժնետոմսերի գնման և վաճառքի վերաբերյալ: Իսկ եթե գործակալը վաճառի սխալ բաժնետոմս, քանի որ այն հալյուցինացիա է ունեցել և սխալ որոշում է կայացրել: Քանի որ LLM-ը հսկայական մոդելներ են, դժվար է հստակեցնել, թե ինչու են նրանք որոշումներ կայացնում, հետևաբար, հալյուցինացիաները տարածված են պատշաճ պաշտպանիչ բազրիքների բացակայության դեպքում:

Մինչ գործակալները բոլորը հետաքրքրաշարժ են, դուք հավանաբար կռահեիք, թե որքան վտանգավոր կարող են լինել դրանք: Եթե ​​նրանք հալյուցինացիաներ ունենան և կատարեն սխալ գործողություն, որը կարող է հանգեցնել հսկայական ֆինանսական վնասների կամ խոշոր խնդիրների Ձեռնարկությունների համակարգերում: Հետևաբար, պատասխանատու AI-ն դառնում է մեծ նշանակություն LLM-ով աշխատող հավելվածների դարաշրջանում: Պատասխանատու AI-ի սկզբունքները վերարտադրելիության, թափանցիկության և հաշվետվողականության շուրջ, փորձում են պաշտպանիչ գծեր դնել գործակալների կողմից ընդունված որոշումների վրա և առաջարկել ռիսկերի վերլուծություն՝ որոշելու համար, թե որ գործողությունների համար է անհրաժեշտ մարդն անխափան: Քանի որ ավելի բարդ գործակալներ են նախագծվում, նրանք ավելի մանրազննության, թափանցիկության և հաշվետվողականության կարիք ունեն՝ համոզվելու համար, որ մենք գիտենք, թե ինչ են նրանք անում:

Փակող մտքերը

Գործակալների՝ գործողություններով տրամաբանական քայլերի ճանապարհ ստեղծելու ունակությունը նրանց իսկապես մոտեցնում է մարդկային բանականությանը: Ավելի հզոր գործիքներով նրանց հզորացնելը կարող է նրանց գերհզորություն տալ: ReAct-ի նման օրինաչափությունները փորձում են ընդօրինակել, թե ինչպես են մարդիկ լուծում խնդիրը, և մենք կտեսնենք ավելի լավ գործակալների օրինաչափություններ, որոնք կհամապատասխանեն կոնկրետ համատեքստերին և տիրույթներին (բանկ, ապահովագրություն, առողջապահություն, արդյունաբերական և այլն): Ապագան այստեղ է, և գործակալների ետևում գտնվող տեխնոլոգիաները պատրաստ են մեզ օգտագործելու համար: Միևնույն ժամանակ, մենք պետք է մեծ ուշադրություն դարձնենք «Պատասխանատու արհեստական ​​ինտելեկտի» պաշտպանիչ բազրիքներին, որպեսզի համոզվենք, որ մենք Skynet-ը չենք կառուցում:

Դատարաջ Ռաո, տվյալների գլխավոր մասնագետ Մշտական ​​համակարգեր, «Keras to Kubernetes. The Journey of a Machine Learning Model to Production» գրքի հեղինակն է։ Persistent Systems-ում Dattaraj-ը ղեկավարում է AI հետազոտական ​​լաբորատորիան, որն ուսումնասիրում է ժամանակակից ալգորիթմներ համակարգչային տեսողության, բնական լեզվի ըմբռնման, հավանականական ծրագրավորման, ուժեղացման ուսուցման, բացատրելի AI-ի և այլնի մեջ և ցուցադրում է կիրառելիությունը առողջապահության, բանկային և արդյունաբերական ոլորտներում: Dattaraj-ն ունի 11 արտոնագիր Machine Learning-ում և Computer Vision-ում: