stomp Voorbij ChatGPT; AI Agent: een nieuwe wereld van werknemers - Unite.AI
Verbind je met ons

AI-tools 101

Voorbij ChatGPT; AI Agent: een nieuwe wereld van werknemers

mm

gepubliceerd

 on

Met de vooruitgang op het gebied van deep learning, natuurlijke taalverwerking (NLP) en AI bevinden we ons in een tijdsperiode waarin AI-agenten een aanzienlijk deel van de mondiale beroepsbevolking zouden kunnen vormen. Deze AI-agenten, die chatbots en stemassistenten overstijgen, geven vorm aan een nieuw paradigma voor zowel industrieën als ons dagelijks leven. Maar wat betekent het werkelijk om te leven in een wereld die wordt versterkt door deze ‘arbeiders’? Dit artikel duikt diep in dit evoluerende landschap en beoordeelt de implicaties, het potentieel en de uitdagingen die ons te wachten staan.

Een korte samenvatting: de evolutie van AI-werknemers

Voordat we de naderende revolutie kunnen begrijpen, is het van cruciaal belang om de door AI aangestuurde evolutie te onderkennen die al heeft plaatsgevonden.

  • Traditionele computersystemen: Vanaf basiscomputeralgoritmen begon de reis. Deze systemen kunnen vooraf gedefinieerde taken oplossen met behulp van een vaste reeks regels.
  • Chatbots en vroege stemassistenten: Naarmate de technologie evolueerde, evolueerden ook onze interfaces. Tools als Siri, Cortana en vroege chatbots vereenvoudigden de interactie tussen gebruiker en AI, maar hadden een beperkt begrip en beperkte mogelijkheden.
  • Neurale netwerken en diep leren: Neurale netwerken markeerden een keerpunt, bootsten menselijke hersenfuncties na en evolueerden door ervaring. Deep learning-technieken hebben dit nog verder verbeterd, waardoor geavanceerde beeld- en spraakherkenning mogelijk is.
  • Transformers en geavanceerde NLP-modellen: De introductie van transformatorarchitecturen bracht een revolutie teweeg in het NLP-landschap. Systemen zoals ChatGPT door OpenAI, BERT en T5 hebben doorbraken mogelijk gemaakt in de communicatie tussen mens en AI. Dankzij hun diepgaande kennis van taal en context kunnen deze modellen betekenisvolle gesprekken voeren, inhoud schrijven en complexe vragen met ongekende nauwkeurigheid beantwoorden.

Betreed de AI-agent: meer dan alleen een gesprek

Today's AI-landschap verwijst naar iets uitgebreiders dan gespreksinstrumenten. AI-agenten kunnen nu, naast louter chatfuncties, taken uitvoeren, van hun omgeving leren, beslissingen nemen en zelfs creativiteit tentoonspreiden. Ze beantwoorden niet alleen vragen; ze zijn problemen aan het oplossen.

Traditionele softwaremodellen werkten volgens een duidelijk traject. Stakeholders legden een doel voor aan softwaremanagers, die vervolgens een specifiek plan ontwierpen. Ingenieurs zouden dit plan uitvoeren via coderegels. Dit 'legacy paradigma' van softwarefunctionaliteit was duidelijk omschreven en omvatte een overvloed aan menselijke tussenkomsten.

AI-agenten werken echter anders. Een agent:

  1. Heeft doelen het probeert te bereiken.
  2. Kan interactie met milieu.
  3. Formuleert een plan op basis van deze observaties om zijn doel te bereiken.
  4. Duurt noodzakelijk acties, zijn aanpak aanpassen gebaseerd op de veranderende toestand van het milieu.

Wat AI-agenten echt onderscheidt van traditionele modellen is hun vermogen om autonoom een ​​stappenplan te maken om een ​​doel te realiseren. Terwijl voorheen de programmeur het plan aanleverde, stippelen de huidige AI-agenten in wezen hun koers uit.

Neem een ​​alledaags voorbeeld. Bij traditioneel softwareontwerp informeert een programma gebruikers over achterstallige taken op basis van vooraf bepaalde voorwaarden. De ontwikkelaars zouden deze voorwaarden stellen op basis van specificaties van de productmanager.

In het AI-agentparadigma bepaalt de agent zelf wanneer en hoe hij de gebruiker op de hoogte moet stellen. Het meet de omgeving (gewoonten van de gebruiker, staat van de applicatie) en beslist over de beste handelwijze. Het proces wordt daardoor dynamischer, meer in het moment.

ChatGPT markeerde een afwijking van het traditionele gebruik met de integratie van plug-ins, waardoor het externe tools kon gebruiken om meerdere verzoeken uit te voeren. Het werd een vroege manifestatie van het agentconcept. Als we een eenvoudig voorbeeld bekijken: een gebruiker die informeert naar het weer in New York City, ChatGPT, kan met behulp van plug-ins communiceren met een externe weer-API, de gegevens interpreteren en zelfs de koers corrigeren op basis van de ontvangen antwoorden.

Huidig ​​landschap van AI-agenten

Huidig ​​landschap van AI-agenten

AI-agenten, waaronder Auto-GPT, AgentGPT en BabyAGI, luiden een nieuw tijdperk in het uitgebreide AI-universum in. Terwijl ChatGPT populair werd generatieve AI Door menselijke inbreng te vereisen, is de visie achter AI-agenten om AI's in staat te stellen onafhankelijk te functioneren en naar doelstellingen te sturen met weinig tot geen menselijke tussenkomst. Dit transformatieve potentieel wordt onderstreept door de snelle opkomst van Auto-GPT, die binnen slechts zes weken na de oprichting meer dan 107,000 sterren op GitHub heeft verzameld, een ongekende groei vergeleken met gevestigde projecten zoals het data science-pakket 'pandas'.

AI-agenten versus ChatGPT

Veel geavanceerde AI-agents, zoals Auto-GPT en BabyAGI, maken gebruik van de GPT-architectuur. Hun primaire focus is het minimaliseren van de noodzaak van menselijke tussenkomst bij het voltooien van AI-taken. Beschrijvende termen als “GPT on a loop” karakteriseren de werking van modellen als AgentGPT en BabyAGI. Ze werken in iteratieve cycli om gebruikersverzoeken beter te begrijpen en hun output te verfijnen. Ondertussen verlegt Auto-GPT de grenzen verder door internettoegang en code-uitvoeringsmogelijkheden te integreren, waardoor het probleemoplossende bereik aanzienlijk wordt vergroot.

Innovaties in AI-agenten

  1. Lange termijn geheugen: Traditionele LLM's hebben een beperkt geheugen en behouden alleen de recente segmenten van interacties. Voor uitgebreide taken wordt het herinneren van het hele gesprek of zelfs eerdere gesprekken cruciaal. Om dit te overwinnen hebben AI-agenten ingebedde workflows ingevoerd, waarbij tekstuele gesprekken worden omgezet in numerieke arrays, wat een oplossing biedt voor geheugenbeperkingen.
  2. Mogelijkheden voor surfen op het web: Om op de hoogte te blijven van recente gebeurtenissen, is Auto-GPT gewapend met browsermogelijkheden, met behulp van de Google Search API. Dit heeft geleid tot discussies binnen de AI-gemeenschap over de reikwijdte van de kennis van een AI.
  3. Code uitvoeren: Naast het genereren van code kan Auto-GPT zowel shell- als Python-codes uitvoeren. Deze ongekende mogelijkheid maakt het mogelijk om te communiceren met andere software, waardoor het operationele domein wordt verbreed.

AI AGENTEN ARCHITECTUUR AUTOGPT, AGENTGPT, LLM, GEHEUGEN EN meer

Het diagram visualiseert de architectuur van een AI-systeem dat wordt aangedreven door een groot taalmodel en agenten.

  • Ingangen: Het systeem ontvangt gegevens uit verschillende bronnen: directe gebruikersopdrachten, gestructureerde databases, webinhoud en realtime omgevingssensoren.
  • LLM en agenten: In de kern verwerkt de LLM deze input, in samenwerking met gespecialiseerde agenten zoals Auto-GPT voor het koppelen van gedachten, AgentGPT voor webspecifieke taken, BabyAGI voor taakspecifieke acties, en HuggingGPT voor teamgebaseerde verwerking.
  • Uitgangen: Eenmaal verwerkt, wordt de informatie omgezet in een gebruiksvriendelijk formaat en vervolgens doorgegeven aan apparaten die op de externe omgeving kunnen inwerken of deze kunnen beïnvloeden.
  • Geheugen Componenten: Het systeem bewaart informatie, zowel op tijdelijke als permanente basis, via caches voor de korte termijn en databases voor de lange termijn.
  • Milieu: Dit is het externe domein, dat de sensoren beïnvloedt en wordt beïnvloed door de acties van het systeem.

Geavanceerde AI-agenten: Auto-GPT, BabyAGI en meer

AutoGPT en AgentGPT

AutoGPT, een geesteskind dat in maart 2023 op GitHub werd uitgebracht, is een ingenieuze op Python gebaseerde applicatie die de kracht van GPT, het transformatieve generatieve model van OpenAI, benut. Wat Auto-GPT onderscheidt van zijn voorgangers is zijn autonomie: het is ontworpen om taken uit te voeren met minimale menselijke begeleiding en heeft het unieke vermogen om zelf aanwijzingen te initiëren. Gebruikers hoeven alleen maar een overkoepelend doel te definiëren, en Auto-GPT bedenkt de benodigde aanwijzingen om dat doel te bereiken, waardoor het een potentieel revolutionaire sprong wordt naar echte kunstmatige algemene intelligentie (AGI).

Met functies die internetconnectiviteit, geheugenbeheer en bestandsopslagmogelijkheden omvatten met behulp van GPT-3.5, is deze tool bedreven in het verwerken van een breed spectrum aan taken, van conventionele taken zoals het opstellen van e-mail tot ingewikkelde taken die doorgaans veel meer menselijke betrokkenheid vereisen.

Daarnaast is AgentGPT, ook gebouwd op het GPT-framework, is een gebruikersgerichte interface waarvoor geen uitgebreide codeerexpertise vereist is om in te stellen en te gebruiken. Met AgentGPT kunnen gebruikers AI-doelen definiëren, die het vervolgens opsplitst in beheersbare taken.

AgentGPT AI AGENT LLM

AgentGPT-gebruikersinterface

Bovendien valt AgentGPT op door zijn veelzijdigheid. Het is niet beperkt tot het maken van chatbots. Het platform breidt zijn mogelijkheden uit om diverse applicaties zoals Discord-bots te creëren en kan zelfs naadloos worden geïntegreerd met Auto-GPT. Deze aanpak zorgt ervoor dat zelfs mensen zonder een uitgebreide codeerachtergrond taken kunnen uitvoeren zoals volledig autonoom coderen, tekstgeneratie, taalvertaling en probleemoplossing.

LangChain is een raamwerk dat grote taalmodellen (LLM's) overbrugt met verschillende tools en agenten, vaak gezien als 'Bots', gebruikt om specifieke taken te bepalen en uit te voeren door de juiste tool te kiezen. Deze agenten kunnen naadloos worden geïntegreerd met externe bronnen, terwijl een vectordatabase in LangChain ongestructureerde gegevens opslaat, waardoor het snel ophalen van informatie voor LLM's wordt vergemakkelijkt.

BabyAGI

Dan is er BabyAGI, een vereenvoudigde maar krachtige agent. Om de mogelijkheden van BabyAGI te begrijpen, moet u zich een digitale projectmanager voorstellen die autonoom taken creëert, organiseert en uitvoert met een scherpe focus op bepaalde doelstellingen. Hoewel de meeste AI-gestuurde platforms beperkt zijn door hun vooraf opgeleide kennis, valt BabyAGI op door zijn vermogen om zich aan te passen en van ervaringen te leren. Het beschikt over een diepgaand vermogen om feedback te onderscheiden en, net als mensen, beslissingen te baseren op vallen en opstaan.

De onderliggende kracht van BabyAGI is met name niet alleen het aanpassingsvermogen, maar ook de vaardigheid in het uitvoeren van code voor specifieke doelstellingen. Het schittert in complexe domeinen, zoals de handel in cryptocurrency, robotica en autonoom rijden, waardoor het een veelzijdig hulpmiddel is in een overvloed aan toepassingen.

BABYAGI taakgestuurde autonome agent

https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/

Het proces kan worden onderverdeeld in drie agenten:

  1. Uitvoeringsagent: Deze agent, het hart van het systeem, maakt gebruik van de API van OpenAI voor taakverwerking. Gegeven een doelstelling en een taak, wordt de API van OpenAI geactiveerd en worden de taakresultaten opgehaald.
  2. Agent voor het maken van taken: Deze functie creëert nieuwe taken op basis van eerdere resultaten en huidige doelstellingen. Er wordt een prompt naar de API van OpenAI gestuurd, die vervolgens potentiële taken retourneert, georganiseerd als een lijst met woordenboeken.
  3. Agent voor taakprioritering: De laatste fase omvat het rangschikken van de taken op basis van prioriteit. Deze agent gebruikt de API van OpenAI om taken opnieuw te ordenen, zodat de meest kritische taken als eerste worden uitgevoerd.

In samenwerking met het taalmodel van OpenAI maakt BabyAGI gebruik van de mogelijkheden van Pinecone voor het contextgericht opslaan en ophalen van taakresultaten.

Hieronder ziet u een demonstratie van het gebruik van de BabyAGI deze link.

Om te beginnen heeft u een geldige OpenAPI-sleutel nodig. Voor gemakkelijke toegang heeft de gebruikersinterface een instellingengedeelte waar de OpenAPI-sleutel kan worden ingevoerd. Als u de kosten wilt beheersen, vergeet dan niet een limiet in te stellen voor het aantal iteraties.

Nadat ik de applicatie had geconfigureerd, deed ik een klein experiment. Ik plaatste een opdracht aan BabyAGI: “Maak een beknopte tweetthread waarin de nadruk ligt op de reis van persoonlijke groei, waarin mijlpalen, uitdagingen en de transformerende kracht van continu leren aan de orde komen.”

BabyAGI reageerde met een goed doordacht plan. Het was niet alleen een generiek sjabloon, maar een uitgebreide routekaart die aangaf dat de onderliggende AI inderdaad de nuances van het verzoek had begrepen.

BABYAGI taakgestuurde autonome agent

Deepnote AI-copiloot

Deepnote AI-copiloot hervormt de dynamiek van gegevensverkenning in notebooks. Maar wat onderscheidt het?

In de kern is Deepnote AI bedoeld om de workflow van datawetenschappers te vergroten. Op het moment dat je een rudimentaire instructie geeft, komt de AI in actie, bedenkt strategieën, voert SQL-query's uit, visualiseert gegevens met behulp van Python en presenteert de bevindingen ervan op een gearticuleerde manier.

Een van de sterke punten van Deepnote AI is het uitgebreide inzicht in uw werkruimte. Door integratieschema's en bestandssystemen te begrijpen, kunnen de uitvoeringsplannen perfect worden afgestemd op de organisatorische context, waardoor de inzichten altijd relevant zijn.

De integratie van de AI met notebookmedia creëert een unieke feedbacklus. Het beoordeelt actief de code-uitvoer, waardoor het bedreven is in zelfcorrectie en ervoor zorgt dat de resultaten consistent zijn met de gestelde doelstellingen.

Deepnote AI onderscheidt zich door zijn transparante bedrijfsvoering en biedt duidelijke inzichten in zijn processen. De verwevenheid van code en output zorgt ervoor dat de acties altijd verantwoordelijk en reproduceerbaar zijn.

CAMEL

CAMEL is een raamwerk dat de samenwerking tussen AI-agenten wil bevorderen, met als doel een efficiënte taakvoltooiing met minimaal menselijk toezicht.

CAMEL AI-AGENT

https://github.com/camel-ai/camel

Het verdeelt zijn activiteiten in twee hoofdtypes:

  • De AI User Agent legt instructies uit.
  • De AI Assistant Agent voert taken uit op basis van de verstrekte richtlijnen.

Een van de ambities van CAMEL is om de complexiteit van AI-denkprocessen te ontrafelen, met als doel de synergieën tussen meerdere agenten te optimaliseren. Met functies als rollenspel en inception prompts zorgt het ervoor dat AI-taken naadloos aansluiten bij menselijke doelstellingen.

Westworld-simulatie: leven in AI

Afgeleid van inspiraties zoals Unity-software en aangepast in Python, de Westworld-simulatie is een sprong in het simuleren en optimaliseren van omgevingen waarin meerdere AI-agenten met elkaar interacteren, bijna zoals in een digitale samenleving.

Generatieve agenten

Generatieve agenten

Deze agenten zijn niet alleen digitale entiteiten. Ze simuleren geloofwaardig menselijk gedrag, van dagelijkse routines tot complexe sociale interacties. Hun architectuur breidt een groot taalmodel uit om ervaringen op te slaan, erover te reflecteren en ze te gebruiken voor dynamische gedragsplanning.

De interactieve sandbox-omgeving van Westworld, die doet denken aan De Sims, brengt een stad tot leven die wordt bevolkt door generatieve agenten. Hier kunnen gebruikers communiceren, kijken en deze agenten door de dag heen begeleiden, waarbij ze opkomend gedrag en de complexe sociale dynamiek observeren.

Westworld-simulatie is een voorbeeld van de harmonieuze samensmelting van computervaardigheid en mensachtige ingewikkeldheden. Door uitgebreide taalmodellen te combineren met dynamische agentsimulaties, wordt een pad uitgestippeld naar het creëren van AI-ervaringen die opvallend niet van de werkelijkheid te onderscheiden zijn.

Conclusie

AI-agenten kunnen ongelooflijk veelzijdig zijn en geven vorm aan industrieën, veranderen workflows en maken prestaties mogelijk die ooit onmogelijk leken. Maar net als alle baanbrekende innovaties zijn ze niet zonder onvolkomenheden.

Hoewel ze de macht hebben om de structuur van ons digitale bestaan ​​opnieuw vorm te geven, worstelen deze agenten nog steeds met bepaalde uitdagingen, waarvan sommige aangeboren menselijk zijn, zoals het begrijpen van de context in genuanceerde scenario's of het aanpakken van problemen die buiten hun getrainde datasets liggen.

In het volgende artikel gaan we dieper in op AutoGPT en GPT Engineer en onderzoeken we hoe we deze kunnen instellen en gebruiken. Daarnaast zullen we onderzoeken waarom deze AI-agenten af ​​en toe haperen, zoals het vastlopen in lussen, naast andere problemen. Dus blijf op de hoogte!

De afgelopen vijf jaar heb ik me verdiept in de fascinerende wereld van Machine Learning en Deep Learning. Door mijn passie en expertise heb ik bijgedragen aan meer dan 50 verschillende software engineering projecten, met een bijzondere focus op AI/ML. Mijn voortdurende nieuwsgierigheid heeft me ook aangetrokken tot Natural Language Processing, een gebied dat ik graag verder wil verkennen.