stub Beyond ChatGPT; AI agentas: naujas darbuotojų pasaulis – Unite.AI
Susisiekti su mumis

AI įrankiai 101

Beyond ChatGPT; AI agentas: naujas darbuotojų pasaulis

mm

paskelbta

 on

Tobulėjant giluminiam mokymuisi, natūralios kalbos apdorojimui (NLP) ir dirbtiniam intelektui, esame tokiame laikotarpyje, kai AI agentai gali sudaryti didelę pasaulinės darbo jėgos dalį. Šie AI agentai, pranokstantys pokalbių robotus ir balso padėjėjus, formuoja naują paradigmą tiek pramonės šakoms, tiek mūsų kasdieniniam gyvenimui. Bet ką iš tikrųjų reiškia gyventi pasaulyje, kurį papildo šie „darbuotojai“? Šiame straipsnyje gilinamasi į šį besikeičiantį kraštovaizdį, įvertinamos pasekmės, potencialas ir laukiantys iššūkiai.

Trumpa santrauka: AI darbuotojų evoliucija

Prieš suprantant artėjančią revoliuciją, labai svarbu atpažinti jau įvykusią AI skatinamą evoliuciją.

  • Tradicinės skaičiavimo sistemos: Nuo pagrindinių skaičiavimo algoritmų kelionė prasidėjo. Šios sistemos galėtų išspręsti iš anksto nustatytas užduotis, naudodamos fiksuotą taisyklių rinkinį.
  • Pokalbių robotai ir ankstyvieji balso padėjėjai: Tobulėjant technologijoms, keitėsi ir mūsų sąsajos. Tokie įrankiai kaip „Siri“, „Cortana“ ir ankstyvieji pokalbių robotai supaprastino vartotojo AI sąveiką, tačiau turėjo ribotą supratimą ir galimybes.
  • Neuroniniai tinklai ir gilus mokymasis: Neuroniniai tinklai pažymėjo lūžio tašką, imituojantys žmogaus smegenų funkcijas ir vystantis per patirtį. Giluminio mokymosi metodai tai dar labiau sustiprino, suteikdami sudėtingą vaizdo ir kalbos atpažinimą.
  • Transformatoriai ir pažangūs NLP modeliai: Transformatorių architektūros įdiegimas pakeitė NLP kraštovaizdį. Tokios sistemos kaip ChatGPT OpenAI, BERT ir T5 leido pasiekti proveržį žmogaus ir AI komunikacijoje. Turėdami gilų kalbos ir konteksto suvokimą, šie modeliai gali palaikyti prasmingus pokalbius, rašyti turinį ir atsakyti į sudėtingus klausimus precedento neturinčiu tikslumu.

Įveskite AI agentą: daugiau nei tik pokalbis

Šiandienos AI peizažas užsimena apie kažką platesnio nei pokalbio įrankiai. AI agentai, be vien tik pokalbių funkcijų, dabar gali atlikti užduotis, mokytis iš savo aplinkos, priimti sprendimus ir netgi parodyti kūrybiškumą. Jie ne tik atsako į klausimus; jie sprendžia problemas.

Tradiciniai programinės įrangos modeliai veikė aiškiai. Suinteresuotosios šalys išreiškė tikslą programinės įrangos valdytojams, kurie vėliau sukūrė konkretų planą. Inžinieriai šį planą vykdytų naudodami kodo eilutes. Ši programinės įrangos funkcionalumo „pasenusi paradigma“ buvo aiški ir apėmė daugybę žmogaus įsikišimo.

Tačiau AI agentai veikia skirtingai. Agentas:

  1. Turi tikslai ji siekia pasiekti.
  2. galima bendrauti Su savo aplinka.
  3. Suformuluoja a planas remiantis šiais pastebėjimais, kad pasiektų savo tikslą.
  4. Priima būtiną veiksmai, koreguojant savo požiūrį remiantis besikeičiančia aplinkos būsena.

Tai, kas iš tikrųjų išskiria AI agentus nuo tradicinių modelių, yra jų gebėjimas savarankiškai sukurti nuoseklų planą tikslui pasiekti. Iš esmės, nors anksčiau programuotojas pateikdavo planą, šiandieniniai AI agentai nubrėžia savo kursą.

Apsvarstykite kasdienį pavyzdį. Tradicinio programinės įrangos kūrimo atveju programa praneštų vartotojams apie vėluojančias užduotis pagal iš anksto nustatytas sąlygas. Kūrėjai šias sąlygas nustatytų pagal produkto vadovo pateiktas specifikacijas.

AI agento paradigmoje agentas pats nustato, kada ir kaip pranešti vartotojui. Jis įvertina aplinką (vartotojo įpročius, taikymo būseną) ir nusprendžia geriausią veiksmų būdą. Taigi procesas tampa dinamiškesnis, labiau akimirksniu.

„ChatGPT“ pažymėjo nukrypimą nuo tradicinio naudojimo, kai buvo integruoti papildiniai, todėl jis galėjo panaudoti išorinius įrankius kelioms užklausoms atlikti. Tai tapo ankstyvu agento koncepcijos pasireiškimu. Jei atsižvelgsime į paprastą pavyzdį: vartotojas, kuris teiraujasi apie Niujorko orus, „ChatGPT“, naudodamas papildinius, galėtų sąveikauti su išorine orų API, interpretuoti duomenis ir netgi pakoreguoti kursą pagal gautus atsakymus.

Dabartinis AI agentų kraštovaizdis

Dabartinis AI agentų kraštovaizdis

AI agentai, įskaitant Auto-GPT, AgentGPT ir BabyAGI, skelbia naują erą besiplečiančioje AI visatoje. Kol ChatGPT išpopuliarėjo Generatyvinis AI reikalaujant žmogaus indėlio, dirbtinio intelekto agentų vizija yra sudaryti sąlygas dirbtiniam intelektui veikti nepriklausomai, siekiant tikslų be žmogaus įsikišimo arba jo nesikišant. Šį transformacinį potencialą pabrėžė automatinis Auto-GPT kilimas, per šešias savaites nuo jo įkūrimo GitHub surinkęs daugiau nei 107,000 XNUMX žvaigždžių, o tai yra precedento neturintis augimas, palyginti su tokiais žinomais projektais kaip duomenų mokslo paketas „pandos“.

AI agentai prieš „ChatGPT“.

Daugelis pažangių AI agentų, tokių kaip Auto-GPT ir BabyAGI, naudoja GPT architektūrą. Jų pagrindinis tikslas yra sumažinti žmogaus įsikišimo poreikį atliekant AI užduotį. Aprašomieji terminai, tokie kaip „GPT ant kilpos“, apibūdina tokių modelių kaip „AgentGPT“ ir „BabyAGI“ veikimą. Jie veikia kartotiniais ciklais, kad geriau suprastų vartotojų užklausas ir patobulintų jų rezultatus. Tuo tarpu „Auto-GPT“ dar labiau išplečia ribas, įtraukdama interneto prieigą ir kodo vykdymo galimybes, žymiai padidindama problemų sprendimo galimybes.

AI agentų naujovės

  1. Ilgalaikė atmintis: Tradiciniai LLM turi ribotą atmintį ir išlaiko tik naujausius sąveikos segmentus. Atliekant išsamias užduotis, labai svarbu prisiminti visą pokalbį ar net ankstesnius. Norėdami tai įveikti, dirbtinio intelekto agentai įdiegė įterpimo darbo eigas, paverčia tekstinius pokalbius į skaitines masyvas ir siūlo atminties apribojimų sprendimą.
  2. Naršymo internete galimybės: norint gauti naujausius įvykius, „Auto-GPT“ buvo aprūpintas naršymo galimybėmis naudojant „Google“ paieškos API. Tai sukėlė AI bendruomenės diskusijas dėl AI žinių apimties.
  3. Veikimo kodas: Be kodo generavimo, Auto-GPT gali vykdyti ir apvalkalo, ir Python kodus. Ši precedento neturinti galimybė leidžia susieti su kita programine įranga, taip praplečiant jos veikimo sritį.

AI AGENTŲ ARCHITEKTŪRA AUTOGPT, AGENTGPT, LLM, MEMORY ir dar daugiau

Diagrama vizualizuoja AI sistemos, kurią maitina didelės kalbos modelis ir agentai, architektūrą.

  • Įėjimai: sistema gauna duomenis iš įvairių šaltinių: tiesioginių vartotojo komandų, struktūrizuotų duomenų bazių, žiniatinklio turinio ir realaus laiko aplinkos jutiklių.
  • LLM ir agentai: Iš esmės LLM apdoroja šias įvestis, bendradarbiaudama su tokiais specializuotais agentais kaip Auto-GPT minčių grandinėjimui, AgentGPT su žiniatinklio užduotimis, BabyAGI už konkrečias užduotis atliekamiems veiksmams ir HuggingGPT komandiniam apdorojimui.
  • Išėjimai: Apdorota informacija paverčiama patogiu formatu ir perduodama į įrenginius, kurie gali veikti arba paveikti išorinę aplinką.
  • Atminties komponentai: Sistema saugo informaciją tiek laikinai, tiek nuolat, naudodama trumpalaikes talpyklas ir ilgalaikes duomenų bazes.
  • aplinka: Tai išorinė sritis, kuri veikia jutiklius ir yra veikiama sistemos veiksmų.

Pažangūs AI agentai: Auto-GPT, BabyAGI ir kt

AutoGPT ir AgentGPT

AutoGPT2023 m. kovo mėn. GitHub išleistas sumanymas yra išradinga Python pagrindu sukurta programa, kuri išnaudoja GPT, OpenAI transformacinio generavimo modelio, galią. Auto-GPT iš savo pirmtakų skiriasi tuo, kad jis yra savarankiškas – jis sukurtas atlikti užduotis su minimaliu žmogaus nurodymu ir turi unikalią galimybę savarankiškai inicijuoti raginimus. Vartotojams tereikia apibrėžti visa apimantį tikslą, o „Auto-GPT“ parengia reikiamus nurodymus šiam tikslui pasiekti, todėl tai gali būti revoliucinis šuolis link tikro dirbtinio bendrojo intelekto (AGI).

Su funkcijomis, apimančiomis interneto ryšį, atminties valdymą ir failų saugojimo galimybes naudojant GPT-3.5, šis įrankis puikiai tinka įvairioms užduotims atlikti – nuo ​​įprastų, pvz., el. laiškų sudarymo, iki sudėtingų užduočių, kurioms paprastai reikia daug daugiau žmonių.

Kita vertus, Agentas GPT, taip pat sukurta remiantis GPT sistema, yra į vartotoją orientuota sąsaja, kuriai nustatyti ir naudoti nereikia didelių kodavimo žinių. „AgentGPT“ leidžia vartotojams apibrėžti AI tikslus, kuriuos vėliau išskaido į valdomas užduotis.

Agent GPT AI AGENT LLM

AgentGPT vartotojo sąsaja

Be to, AgentGPT išsiskiria savo universalumu. Tai neapsiriboja pokalbių robotų kūrimu. Platforma išplečia savo galimybes kurti įvairias programas, pvz., „Discord“ robotus, ir netgi sklandžiai integruojasi su „Auto-GPT“. Šis metodas užtikrina, kad net tie, kurie neturi plačios kodavimo patirties, gali atlikti tokias užduotis kaip visiškai savarankiškas kodavimas, teksto generavimas, kalbos vertimas ir problemų sprendimas.

LangChain yra sistema, kuri sujungia didelius kalbų modelius (LLM) su įvairiais įrankiais ir naudoja agentus, dažnai suvokiamus kaip „botai“, kad nustatytų ir vykdytų konkrečias užduotis pasirinkus tinkamą įrankį. Šie agentai sklandžiai integruojasi su išoriniais ištekliais, o vektorinė duomenų bazė LangChain saugo nestruktūrizuotus duomenis, palengvindama greitą informacijos gavimą LLM.

KūdikisAGI

Tada yra KūdikisAGI, supaprastintas, bet galingas agentas. Norėdami suprasti BabyAGI galimybes, įsivaizduokite skaitmeninį projektų vadovą, kuris savarankiškai kuria, organizuoja ir vykdo užduotis, sutelkdamas dėmesį į nurodytus tikslus. Nors daugumą AI valdomų platformų riboja iš anksto išmoktos žinios, BabyAGI išsiskiria gebėjimu prisitaikyti ir mokytis iš patirties. Jis turi gilų gebėjimą įžvelgti grįžtamąjį ryšį ir, kaip ir žmonės, pagrįsti sprendimus bandymais ir klaidomis.

Pažymėtina, kad pagrindinė BabyAGI privalumas yra ne tik jos pritaikomumas, bet ir įgūdžiai paleisti kodą konkretiems tikslams. Jis puikiai tinka sudėtingose ​​srityse, tokiose kaip prekyba kriptovaliutomis, robotika ir autonominis vairavimas, todėl tai yra universalus įrankis daugelyje programų.

BABYAGI užduočių valdomas autonominis agentas

https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/

Procesą galima suskirstyti į tris agentus:

  1. Vykdymo agentas: sistemos širdis, šis agentas naudoja OpenAI API užduočių apdorojimui. Atsižvelgiant į tikslą ir užduotį, ji ragina OpenAI API ir nuskaito užduoties rezultatus.
  2. Užduočių kūrimo agentas: Ši funkcija sukuria naujas užduotis pagal ankstesnius rezultatus ir dabartinius tikslus. Į OpenAI API siunčiamas raginimas, kuris grąžina galimas užduotis, suskirstytas į žodynų sąrašą.
  3. Užduočių prioritetų nustatymo agentas: Paskutinis etapas apima užduočių eilės nustatymą pagal prioritetą. Šis agentas naudoja OpenAI API, kad pertvarkytų užduotis ir užtikrintų, kad svarbiausios būtų vykdomos pirmiausia.

Bendradarbiaudama su „OpenAI“ kalbos modeliu, „BabyAGI“ išnaudoja „Pinecone“ galimybes, kad būtų saugomi ir gaunami į kontekstą orientuoti užduočių rezultatai.

Žemiau pateikiamas BabyAGI naudojimo demonstravimas šią nuorodą.

Norėdami pradėti, jums reikės galiojančio OpenAPI rakto. Kad būtų lengviau pasiekti, vartotojo sąsajoje yra nustatymų skyrius, kuriame galima įvesti OpenAPI raktą. Be to, jei norite valdyti išlaidas, nepamirškite nustatyti pakartojimų skaičiaus limito.

Kai sukonfigūravau programą, atlikau nedidelį eksperimentą. „BabyAGI“ paskelbiau raginimą: „Sukurkite glaustą „Twitter“ žinutes, daugiausia dėmesio skiriant asmeninio augimo kelionei, paliečiant gaires, iššūkius ir nuolatinio mokymosi transformuojančią galią.

BabyAGI atsakė gerai apgalvotu planu. Tai buvo ne tik bendras šablonas, bet ir išsamus veiksmų planas, nurodantis, kad pagrindinis AI iš tikrųjų suprato užklausos niuansus.

BABYAGI užduočių valdomas autonominis agentas

Deepnote AI Copilot

Deepnote AI Copilot pertvarko duomenų tyrinėjimo nešiojamuosiuose kompiuteriuose dinamiką. Bet kas jį išskiria?

Iš esmės „Deepnote AI“ siekia išplėsti duomenų mokslininkų darbo eigą. Kai pateikiate elementarias instrukcijas, AI pradeda veikti, kuria strategijas, vykdo SQL užklausas, vizualizuoja duomenis naudodami Python ir aiškiai pateikia savo išvadas.

Viena iš „Deepnote AI“ privalumų yra visapusiškas jūsų darbo vietos suvokimas. Suprasdama integravimo schemas ir failų sistemas, ji puikiai suderina savo vykdymo planus su organizacijos kontekstu, užtikrindama, kad jos įžvalgos visada būtų aktualios.

AI integracija su nešiojamojo kompiuterio laikmenomis sukuria unikalią grįžtamojo ryšio kilpą. Jis aktyviai vertina kodo išvestis, todėl geba savarankiškai taisyti ir užtikrina, kad rezultatai atitiktų nustatytus tikslus.

„Deepnote AI“ išsiskiria skaidriomis operacijomis ir suteikia aiškių įžvalgų apie procesus. Kodo ir išvesties susipynimas užtikrina, kad jo veiksmai visada būtų atskaitingi ir atkuriami.

CAMEL

CAMEL yra sistema, kuria siekiama skatinti dirbtinio intelekto agentų bendradarbiavimą, siekiant efektyviai atlikti užduotis su minimalia žmogaus priežiūra.

CAMEL AI AGENTAS

https://github.com/camel-ai/camel

Ji skirsto savo veiklą į du pagrindinius agentų tipus:

  • AI vartotojo agentas pateikia instrukcijas.
  • AI Assistant Agent atlieka užduotis pagal pateiktas direktyvas.

Vienas iš CAMEL siekių yra atskleisti AI mąstymo procesų sudėtingumą, siekiant optimizuoti kelių agentų sinergiją. Su tokiomis funkcijomis kaip vaidmenų žaidimas ir raginimas pradėti dirbti, užtikrina, kad dirbtinio intelekto užduotys sklandžiai atitiktų žmogaus tikslus.

Westworld modeliavimas: gyvenimas į AI

Gauta iš įkvėpimo šaltinių, pvz., Unity programinės įrangos ir pritaikyta Python, Vakarų pasaulio modeliavimas yra šuolis į aplinkų, kuriose daug dirbtinio intelekto agentų sąveikauja, modeliavimą ir optimizavimą, beveik kaip skaitmeninėje visuomenėje.

Generatyvieji agentai

Generatyvieji agentai

Šie agentai nėra tik skaitmeniniai subjektai. Jie imituoja tikėtiną žmonių elgesį – nuo ​​kasdienės rutinos iki sudėtingos socialinės sąveikos. Jų architektūra išplečia didelį kalbos modelį, kad būtų galima kaupti patirtį, apmąstyti jas ir panaudoti dinaminiam elgsenos planavimui.

Interaktyvi Westworld smėlio dėžės aplinka, primenanti The Sims, atgaivina miestelį, kuriame gyvena generatyvūs agentai. Čia vartotojai gali bendrauti, stebėti ir vadovauti šiems agentams per dieną, stebėdami atsirandantį elgesį ir sudėtingą socialinę dinamiką.

„Westworld“ modeliavimas iliustruoja darnų skaičiavimo meistriškumo ir į žmogų panašių sudėtingų dalykų susiliejimą. Sujungus didžiulius kalbų modelius su dinaminių agentų modeliavimu, jis nubrėžia kelią į dirbtinio intelekto patirtį, kuri stulbinamai nesiskiria nuo realybės.

Išvada

AI agentai gali būti neįtikėtinai universalūs ir formuoja pramonės šakas, keičia darbo eigą ir įgalina žygdarbius, kurie kažkada atrodė neįmanomi. Tačiau, kaip ir visos novatoriškos naujovės, jos nėra be trūkumų.

Nors jie gali pakeisti mūsų skaitmeninės egzistencijos struktūrą, šie agentai vis dar susiduria su tam tikrais iššūkiais, iš kurių kai kurie yra įgimti žmogiški, pavyzdžiui, suprasti kontekstą niuansuotuose scenarijuose arba spręsti problemas, kurios nepatenka į jų parengtus duomenų rinkinius.

Kitame straipsnyje mes gilinsimės į AutoGPT ir GPT Engineer, nagrinėsime, kaip juos nustatyti ir naudoti. Be to, išnagrinėsime priežastis, dėl kurių šie AI agentai retkarčiais šlubuoja, pvz., įstrigę kilpose, be kitų problemų. Taigi sekite naujienas!

Pastaruosius penkerius metus praleidau pasinerdamas į žavų mašininio mokymosi ir giluminio mokymosi pasaulį. Mano aistra ir patirtis paskatino mane prisidėti prie daugiau nei 50 įvairių programinės įrangos inžinerijos projektų, ypatingą dėmesį skiriant AI/ML. Mano nuolatinis smalsumas taip pat patraukė mane į natūralios kalbos apdorojimą – sritį, kurią noriu tyrinėti toliau.