AI tööriistad 101

Lisaks ChatGPT-le; AI agent: töötajate uus maailm

avaldatud

9 kuud tagasi

August 28, 2023

Tänu süvaõppe, loomuliku keele töötlemise (NLP) ja tehisintellekti arengule oleme jõudnud ajavahemikku, kus tehisintellekti agendid võivad moodustada olulise osa ülemaailmsest tööjõust. Need AI-agendid, kes ületavad vestlusroboteid ja hääleassistente, kujundavad uut paradigmat nii tööstusharude kui ka meie igapäevaelu jaoks. Aga mida see tegelikult tähendab elada maailmas, mida need "töölised" suurendavad? See artikkel sukeldub sügavale sellesse arenevasse maastikku, hinnates eesseisvaid tagajärgi, potentsiaali ja väljakutseid.

Lühikokkuvõte: AI töötajate areng

Enne eelseisva revolutsiooni mõistmist on ülioluline ära tunda juba toimunud AI-põhine areng.

Traditsioonilised arvutisüsteemid: Põhilistest arvutusalgoritmidest algas teekond. Need süsteemid saaksid fikseeritud reeglite kogumi abil lahendada eelnevalt määratletud ülesandeid.
Vestlusbotid ja varajased hääleassistendid: Tehnoloogia arenedes arenesid ka meie liidesed. Sellised tööriistad nagu Siri, Cortana ja varased vestlusrobotid lihtsustasid kasutajate ja tehisintellekti suhtlemist, kuid nende mõistmine ja võimalused olid piiratud.
Närvivõrgud ja süvaõpe: Neuraalvõrgud tähistasid pöördepunkti, jäljendades inimese aju funktsioone ja arenedes läbi kogemuste. Süvaõppe tehnikad täiustasid seda veelgi, võimaldades keerukat pildi- ja kõnetuvastust.
Trafod ja täiustatud NLP-mudelid: Trafoarhitektuuride kasutuselevõtt muutis NLP maastiku pöörde. Süsteemid nagu ChatGPT OpenAI, BERT ja T5 on võimaldanud läbimurdeid inimese ja tehisintellekti suhtluses. Tänu oma sügavale keele- ja kontekstitundmisele suudavad need mudelid pidada sisukaid vestlusi, kirjutada sisu ja vastata keerulistele küsimustele enneolematu täpsusega.

Sisestage AI agent: rohkem kui lihtsalt vestlus

tänane AI maastik vihjab millelegi ulatuslikumale kui vestlustööriistad. Tehisintellekti agendid, peale pelgalt vestlusfunktsioonide, saavad nüüd täita ülesandeid, õppida oma keskkonnast, teha otsuseid ja isegi ilmutada loovust. Nad ei vasta ainult küsimustele; nad lahendavad probleeme.

Traditsioonilised tarkvaramudelid töötasid selgel teel. Sidusrühmad väljendasid eesmärki tarkvarahalduritele, kes seejärel koostasid konkreetse plaani. Insenerid viiksid selle plaani ellu koodiridade kaudu. See tarkvara funktsionaalsuse pärandparadigma oli selge, hõlmates hulgaliselt inimeste sekkumisi.

AI agendid tegutsevad aga erinevalt. Agent:

On eesmärgid see püüab saavutada.
Kas suhelda oma keskkond.
Formuleerib a kava nende tähelepanekute põhjal oma eesmärgi saavutamiseks.
Vajalik on meetmete, kohandades oma lähenemist põhineb keskkonna muutuval olekul.

Tehisintellekti agente eristab traditsioonilistest mudelitest tõeliselt nende võime luua iseseisvalt samm-sammult plaan eesmärgi saavutamiseks. Sisuliselt, kui varem koostas plaani programmeerija, siis tänapäevased tehisintellekti agendid kaardistavad oma kursi.

Mõelge igapäevasele näitele. Traditsioonilise tarkvarakujunduse korral teavitab programm kasutajaid etteantud tingimuste alusel hilinenud ülesannetest. Arendajad seavad need tingimused tootejuhi esitatud spetsifikatsioonide põhjal.

AI agendi paradigmas määrab agent ise, millal ja kuidas kasutajat teavitada. See mõõdab keskkonda (kasutaja harjumusi, rakenduse olekut) ja otsustab parima tegutsemisviisi. Protsess muutub seega dünaamilisemaks, rohkem hetkes.

ChatGPT tähistas kõrvalekaldumist oma tavapärasest kasutusest pistikprogrammide integreerimisega, võimaldades seeläbi kasutada väliseid tööriistu mitme päringu täitmiseks. Sellest sai agendikontseptsiooni varane ilming. Kui võtame arvesse lihtsat näidet: kasutaja, kes uurib New Yorgi ilma, ChatGPT-d, kasutades pistikprogramme, võib suhelda välise ilmateate API-ga, tõlgendada andmeid ja saadud vastuste põhjal isegi kurssi parandada.

AI-agentide praegune maastik

AI agendid, sealhulgas Auto-GPT, AgentGPT ja BabyAGI, kuulutavad uut ajastut laienevas AI universumis. Samal ajal kui ChatGPT populariseeris Generatiivne AI Inimpanust nõudes on tehisintellekti agentide nägemus võimaldada tehisintellektil iseseisvalt toimida, juhtides eesmärke ilma inimese vähese sekkumiseta või ilma inimese sekkumiseta. Seda transformatiivset potentsiaali on rõhutanud Auto-GPT meteoriline tõus, kogudes GitHubis vaid kuue nädala jooksul pärast selle käivitamist üle 107,000 XNUMX tähe, mis on enneolematu kasv võrreldes väljakujunenud projektidega, nagu andmeteaduse pakett "pandas".

AI agendid vs. ChatGPT

Paljud täiustatud AI agendid, nagu Auto-GPT ja BabyAGI, kasutavad GPT arhitektuuri. Nende peamine eesmärk on minimeerida inimese sekkumise vajadust tehisintellekti ülesannete täitmisel. Kirjeldavad terminid, nagu „GPT on loop”, iseloomustavad selliste mudelite nagu AgentGPT ja BabyAGI tööd. Need töötavad iteratiivsete tsüklitena, et paremini mõista kasutaja taotlusi ja täpsustada nende väljundeid. Samal ajal nihutab Auto-GPT piire veelgi, lisades Interneti-juurdepääsu ja koodikäivitusvõimalused, mis laiendab oluliselt selle probleemide lahendamise ulatust.

Tehisintellekti agentide uuendused

Pikaajaline mälu: Traditsioonilistel LLM-idel on piiratud mälu, säilitades ainult hiljutised interaktsioonisegmendid. Põhjalike ülesannete puhul muutub pöördeliseks kogu vestluse või isegi eelnevate meeldetuletamine. Selle ületamiseks on tehisintellekti agendid kasutusele võtnud töövoogude manustamise, teisendades tekstivestlused numbrimassiivideks, pakkudes lahendust mälupiirangutele.
Veebisirvimise võimalused: Hiljutiste sündmustega kursis olemiseks on Auto-GPT varustatud sirvimisvõimalustega, kasutades Google'i otsingu API-t. See on tekitanud tehisintellekti kogukonnas arutelusid tehisintellekti teadmiste ulatuse üle.
Töökood: Lisaks koodi genereerimisele saab Auto-GPT käivitada nii shelli kui ka Pythoni koode. See enneolematu võimalus võimaldab sellel liidestuda muu tarkvaraga, laiendades seeläbi selle tegevusvaldkonda.

Diagramm visualiseerib suure keelemudeli ja agentide toel töötava AI-süsteemi arhitektuuri.

Sisendid: süsteem saab andmeid erinevatest allikatest: otsestest kasutajakäskudest, struktureeritud andmebaasidest, veebisisust ja reaalajas keskkonnaanduritest.
LLM ja agendid: Põhimõtteliselt töötleb LLM neid sisendeid, tehes koostööd selliste spetsialiseeritud agentidega nagu Auto-GPT mõtete aheldamiseks, AgentGPT veebipõhiste ülesannete jaoks, BabyAGI ülesandespetsiifiliste toimingute jaoks ja HuggingGPT meeskonnapõhiseks töötlemiseks.
Väljundid: Pärast töötlemist muudetakse teave kasutajasõbralikku vormingusse ja edastatakse seejärel seadmetele, mis võivad mõjutada või mõjutada väliskeskkonda.
Mälu komponendid: süsteem säilitab teavet nii ajutiselt kui ka püsivalt lühiajaliste vahemälude ja pikaajaliste andmebaaside kaudu.
keskkond: see on väline valdkond, mis mõjutab andureid ja mida mõjutavad süsteemi tegevused.

Täiustatud AI agendid: Auto-GPT, BabyAGI ja palju muud

AutoGPT ja AgentGPT

AutoGPT2023. aasta märtsis GitHubis välja antud vaimusünnitus on geniaalne Pythonil põhinev rakendus, mis kasutab ära OpenAI transformatiivse generatiivse mudeli GPT võimsust. Auto-GPT-d eristab eelkäijatest selle autonoomia – see on loodud täitma ülesandeid minimaalse inimliku juhtimisega ja sellel on ainulaadne võimalus ise algatada viipasid. Kasutajad peavad lihtsalt määratlema üldise eesmärgi ja Auto-GPT koostab selle eesmärgi saavutamiseks vajalikud juhised, muutes selle potentsiaalselt revolutsiooniliseks hüppeks tõelise tehisintellekti (AGI) poole.

Funktsioonidega, mis hõlmavad Interneti-ühendust, mäluhaldust ja failisalvestusvõimalusi, kasutades GPT-3.5, on see tööriist osav paljude ülesannete lahendamiseks, alates tavapärastest ülesannetest, nagu e-kirjade koostamine, kuni keerukate ülesanneteni, mis nõuavad tavaliselt palju rohkem inimeste osalust.

Teiselt poolt, AgentGPT, mis on samuti üles ehitatud GPT raamistikule, on kasutajakeskne liides, mille seadistamine ja kasutamine ei nõua ulatuslikke kodeerimisteadmisi. AgentGPT võimaldab kasutajatel määratleda AI-eesmärke, mis seejärel tükeldatakse hallatavateks ülesanneteks.

AgentGPT kasutajaliides

Lisaks paistab AgentGPT silma oma mitmekülgsuse poolest. See ei piirdu ainult vestlusrobotite loomisega. Platvorm laiendab oma võimalusi, et luua erinevaid rakendusi, nagu Discordi robotid, ja integreerub isegi sujuvalt Auto-GPT-ga. See lähenemisviis tagab, et isegi need, kellel pole ulatuslikku kodeerimistausta, saavad teha selliseid ülesandeid nagu täielikult autonoomne kodeerimine, teksti genereerimine, keele tõlkimine ja probleemide lahendamine.

LangChain on raamistik, mis ühendab suured keelemudelid (LLM) erinevate tööriistadega ja kasutab agente, mida sageli peetakse robotiteks, et määrata ja täita konkreetseid ülesandeid, valides sobiva tööriista. Need agendid integreeruvad sujuvalt väliste ressurssidega, samas kui LangChaini vektorandmebaas salvestab struktureerimata andmeid, hõlbustades LLM-ide kiiret teabeotsingut.

BabyAGI

Siis on BabyAGI, lihtsustatud, kuid võimas agent. BabyAGI võimaluste mõistmiseks kujutage ette digitaalset projektijuhti, kes loob, korraldab ja täidab iseseisvalt ülesandeid, keskendudes teravalt etteantud eesmärkidele. Kui enamiku AI-põhiseid platvorme piiravad nende eelkoolitatud teadmised, siis BabyAGI paistab silma kohanemisvõime ja kogemustest õppimise poolest. Sellel on põhjalik võime tagasisidet eristada ja sarnaselt inimestega teha otsuseid katse-eksituse meetodil.

Eelkõige ei seisne BabyAGI tugevus mitte ainult selle kohanemisvõimes, vaid ka oskuses konkreetsete eesmärkide jaoks koodi käivitada. See paistab silma keerulistes valdkondades, nagu krüptovaluutaga kauplemine, robootika ja autonoomne sõit, muutes selle mitmekülgseks tööriistaks paljudes rakendustes.

https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/

Protsessi võib jagada kolmeks aineks:

Täiteagent: süsteemi süda, see agent kasutab ülesannete töötlemiseks OpenAI API-d. Arvestades eesmärki ja ülesannet, käivitab see OpenAI API ja hangib ülesande tulemused.
Ülesande loomise agent: see funktsioon loob varasemate tulemuste ja praeguste eesmärkide põhjal uusi ülesandeid. OpenAI API-le saadetakse viip, mis seejärel tagastab potentsiaalsed ülesanded sõnastike loendina.
Ülesannete prioriseerimise agent: viimane etapp hõlmab ülesannete järjestamist prioriteedi alusel. See agent kasutab ülesannete ümberjärjestamiseks OpenAI API-d, tagades, et kõige kriitilisemad täidetakse kõigepealt.

Koostöös OpenAI keelemudeliga kasutab BabyAGI Pinecone'i võimalusi kontekstikeskse ülesannete tulemuste salvestamiseks ja otsimiseks.

Allpool on BabyAGI kasutamise esitlus seda linki.

Alustuseks vajate kehtivat OpenAPI võtit. Juurdepääsu hõlbustamiseks on kasutajaliideses seadete jaotis, kuhu saab sisestada OpenAPI võtme. Lisaks, kui soovite kulusid hallata, ärge unustage seada iteratsioonide arvule piirang.

Kui olin rakenduse seadistanud, tegin väikese katse. Postitasin BabyAGI-le üleskutse: "Koostage lühike säutsulõng, mis keskendub isikliku kasvu teekonnale, puudutades verstaposte, väljakutseid ja pideva õppimise ümberkujundavat jõudu."

BabyAGI vastas hästi läbimõeldud plaaniga. See ei olnud lihtsalt üldine mall, vaid põhjalik tegevuskava, mis näitas, et selle aluseks olev tehisintellekt oli tõepoolest mõistnud taotluse nüansse.

Deepnote AI Copilot

Deepnote AI Copilot kujundab ümber sülearvutite andmete uurimise dünaamika. Aga mis eristab seda?

Deepnote AI põhieesmärk on suurendada andmeteadlaste töövoogu. Kohe, kui annate algelise juhise, hakkab AI tegutsema, töötades välja strateegiaid, täites SQL-päringuid, visualiseerides Pythoni abil andmeid ja esitades oma tulemusi selgelt.

Üks Deepnote AI tugevusi on selle igakülgne arusaam teie tööruumist. Mõistes integratsiooniskeeme ja failisüsteeme, joondab see oma täitmisplaanid ideaalselt organisatsiooni kontekstiga, tagades, et selle ülevaated on alati asjakohased.

AI integreerimine sülearvutite meediumidega loob ainulaadse tagasisideahela. See hindab aktiivselt koodiväljundeid, muutes selle iseparandusteks ja tagades tulemuste vastavuse seatud eesmärkidele.

Deepnote AI paistab silma läbipaistvate toimingute poolest, pakkudes selget ülevaadet selle protsessidest. Koodi ja väljundite põimumine tagab, et selle tegevused on alati vastutustundlikud ja reprodutseeritavad.

CAMEL

CAMEL on raamistik, mille eesmärk on edendada koostööd tehisintellekti agentide vahel, mille eesmärk on ülesannete tõhus täitmine minimaalse inimjärelevalvega.

https://github.com/camel-ai/camel

See jagab oma tegevuse kaheks peamiseks agenditüübiks:

AI kasutajaagent esitab juhised.
AI assistent täidab ülesandeid etteantud juhiste alusel.

Üks CAMELi püüdlusi on lahti harutada tehisintellekti mõtlemisprotsesside keerukus, eesmärgiga optimeerida sünergiat mitme agendi vahel. Tänu sellistele funktsioonidele nagu rollimäng ja algatusviip tagab see tehisintellekti ülesannete sujuva vastavuse inimlike eesmärkidega.

Westworld Simulation: Life into AI

Tuletatud inspiratsiooniallikatest nagu Unity tarkvara ja kohandatud Pythonis, Westworldi simulatsioon on hüpe selliste keskkondade simuleerimisel ja optimeerimisel, kus mitmed tehisintellekti agendid suhtlevad peaaegu nagu digitaalses ühiskonnas.

Generatiivsed agendid

Need agendid ei ole ainult digitaalsed üksused. Nad simuleerivad usutavat inimeste käitumist, alates igapäevastest rutiinidest kuni keerukate sotsiaalsete suhtlusteni. Nende arhitektuur laiendab suurt keelemudelit, et salvestada kogemusi, neid kajastada ja kasutada neid dünaamilise käitumise planeerimiseks.

Westworldi interaktiivne liivakastikeskkond, mis meenutab The Simsi, äratab ellu generatiivsete agentidega asustatud linna. Siin saavad kasutajad neid agente oma päeva jooksul suhelda, vaadata ja juhendada, jälgides esilekerkivat käitumist ja keerulist sotsiaalset dünaamikat.

Westworldi simulatsioon illustreerib arvutusvõime ja inimlike keerukuse harmoonilist sulandumist. Segades tohutuid keelemudeleid dünaamiliste agentide simulatsioonidega, loob see tee AI-kogemuste loomisele, mis on reaalsusest silmatorkavalt eristamatud.

Järeldus

Tehisintellekti agendid võivad olla uskumatult mitmekülgsed ja kujundavad tööstusi, muudavad töövoogusid ja võimaldavad kunagi võimatuna tundunud saavutusi. Kuid nagu kõik murrangulised uuendused, pole ka neil puudusi.

Kuigi neil on võim meie digitaalse eksistentsi struktuuri ümber kujundada, maadlevad need agendid siiski teatud väljakutsetega, millest mõned on kaasasündinud inimlikud, nagu näiteks konteksti mõistmine nüansirikaste stsenaariumide puhul või probleemide lahendamine, mis jäävad väljaspool nende koolitatud andmekogumeid.

Järgmises artiklis käsitleme üksikasjalikumalt AutoGPT-d ja GPT Engineerit ning uurime, kuidas neid seadistada ja kasutada. Lisaks uurime põhjuseid, miks need tehisintellekti agendid aeg-ajalt kõiguvad, nagu näiteks ahelatesse lõksu jäämine. Nii et püsige lainel!

Järgmisena

Flick Review: parim Instagrami räsimärgi tööriist katvuse suurendamiseks

Ära jäta

SaneBoxi ülevaade: tühjendage oma e-kirjad ja suurendage tootlikkust

Aayush Mittal

Olen viimased viis aastat veetnud masinõppe ja süvaõppe põnevasse maailma sukeldudes. Minu kirg ja teadmised on pannud mind panustama enam kui 50 erinevasse tarkvaratehnoloogia projekti, keskendudes eelkõige AI/ML-ile. Minu jätkuv uudishimu on tõmmanud mind ka loomuliku keele töötlemise poole, valdkonda, mida ma innukalt edasi uurin.

Ühendage.AI

Lisaks ChatGPT-le; AI agent: töötajate uus maailm

AI tööriistad 101

Lisaks ChatGPT-le; AI agent: töötajate uus maailm

Sisukord

Lühikokkuvõte: AI töötajate areng

Sisestage AI agent: rohkem kui lihtsalt vestlus

AI agendid vs. ChatGPT

Tehisintellekti agentide uuendused