Artificiell intelligens

AutoGen: Drivs av nästa generations stora språkmodellapplikationer

publicerade

2 år sedan

October 18, 2023

Kunal Kejriwal

Stora språkmodeller (LLM) är för närvarande ett av de mest diskuterade ämnena inom mainstream AI. Utvecklare över hela världen undersöker de potentiella tillämpningarna av LLM. Dessa modeller är AI-algoritmer som använder djupinlärningstekniker och stora mängder träningsdata för att förstå, sammanfatta, förutsäga och generera ett brett utbud av innehåll, inklusive text, ljud, bilder, videor och mer.

Stora språkmodeller är invecklade AI-algoritmer. Att utveckla en sådan modell är en uttömmande uppgift, och att konstruera en applikation som utnyttjar kapaciteten hos en LLM är lika utmanande. Det kräver betydande expertis, ansträngning och resurser för att designa, implementera och i slutändan optimera ett arbetsflöde som kan utnyttja den fulla potentialen hos en stor språkmodell för att ge bästa resultat. Med tanke på den omfattande tid och resurser som krävs för att upprätta arbetsflöden för applikationer som utnyttjar kraften hos LLM, har automatisering av dessa processer ett enormt värde. Detta är särskilt sant eftersom arbetsflöden förväntas bli ännu mer komplexa inom en snar framtid, med utvecklare som skapar allt mer sofistikerade LLM-baserade applikationer. Dessutom är designutrymmet som krävs för dessa arbetsflöden både intrikat och expansivt, vilket ytterligare lyfter utmaningarna med att skapa ett optimalt, robust arbetsflöde som uppfyller prestandaförväntningarna.

AutoGen är ett ramverk utvecklat av teamet på Microsoft som syftar till att förenkla orkestreringen och optimeringen av LLM-arbetsflöden genom att introducera automatisering i arbetsflödespipelinen. AutoGen-ramverket erbjuder konverserbara och anpassningsbara agenter som utnyttjar kraften hos avancerade LLM:er som GPT-3 och GPT-4, och samtidigt åtgärdar deras nuvarande begränsningar genom att integrera LLM:erna med verktyg och mänskliga input genom att använda automatiserade chattar för att initiera konversationer mellan flera agenter.

När du använder AutoGen-ramverket är det bara två steg som krävs för att utveckla ett komplext konversationssystem med flera agenter.

Steg 1: Definiera en uppsättning agenter, var och en med sina roller och förmågor.

Steg 2: Definiera interaktionsbeteendet mellan agenter, dvs en agent ska veta vad den ska svara när den får ett meddelande från en annan agent.

Båda stegen ovan är modulära och intuitiva, vilket gör dessa medel komponerbara och återanvändbara. Bilden nedan visar ett exempel på ett arbetsflöde som tar upp kodbaserade frågor i optimeringen av försörjningskedjan. Som det kan ses skriver skribenten först koden och tolkningen, skyddet säkerställer kodens integritet och säkerhet, och koden exekveras sedan av befälhavaren efter att den fått det nödvändiga tillståndet. Om systemet stöter på något problem under körningen, upprepas processen tills det är helt löst. Genom att implementera ramverket nedan minskar mängden manuell interaktion från 3x till 10x när den distribueras i applikationer som optimering av försörjningskedjan. Dessutom minskar användningen av AutoGen också mängden kodningsansträngning med upp till fyra gånger.

AutoGen kan vara en game changer eftersom det syftar till att förändra utvecklingsprocessen för komplexa applikationer som utnyttjar kraften hos LLM. Användningen av AutoGen kan inte bara minska mängden manuella interaktioner som behövs för att uppnå önskade resultat, utan det kan också minska mängden kodningsinsatser som krävs för att skapa sådana komplexa applikationer. Användningen av AutoGen för att skapa LLM-baserade applikationer kan inte bara påskynda processen avsevärt, utan det kommer också att bidra till att minska mängden tid, ansträngning och resurser som krävs för att utveckla dessa komplexa applikationer.

I den här artikeln kommer vi att ta en djupare dykning i AutoGen-ramverket, och vi kommer att utforska de väsentliga komponenterna och arkitekturen i AutoGen-ramverket, tillsammans med dess potentiella applikationer. Så låt oss börja.

En introduktion till AutoGen: Drivs av nästa generations stora språkmodellapplikationer

AutoGen är ett ramverk med öppen källkod utvecklat av teamet på Microsoft som utrustar utvecklare med kraften att skapa applikationer som utnyttjar kraften hos LLM:er med hjälp av flera agenter som kan ha konversationer med varandra för att framgångsrikt utföra de önskade uppgifterna. Agenter i AutoGen är konverserbara, anpassningsbara och de kan arbeta i olika lägen som använder kombinationen av verktyg, mänsklig input och LLM. Utvecklare kan också använda AutoGen-ramverket för att definiera interaktionsbeteendet för agenter, och utvecklare kan använda både datorkod och naturligt språk för att programmera flexibla konversationsmönster som används i olika applikationer. Eftersom AutoGen är ett ramverk med öppen källkod kan AutoGen anses vara ett generiskt ramverk som utvecklare kan använda för att bygga applikationer och ramverk av olika komplexitet som utnyttjar kraften hos LLM.

Stora språkmodeller spelar en avgörande roll för att utveckla agenter som använder LLM-ramverken för att anpassa sig till nya observationer, verktygsanvändning och resonemang i många verkliga tillämpningar. Men att utveckla dessa applikationer som kan utnyttja den fulla potentialen hos LLM är en komplex affär, och med tanke på den ständigt ökande efterfrågan och tillämpningarna av LLMs tillsammans med den ökade uppgiftens komplexitet är det viktigt att skala upp kraften hos dessa agenter genom att använda flera agenter som fungerar synkroniserat med varandra. Men hur kan ett tillvägagångssätt med flera agenter användas för att utveckla LLM-baserade applikationer som sedan kan tillämpas på ett brett spektrum av domäner med varierande komplexitet? AutoGen-ramverket försöker svara på ovanstående fråga genom att använda konversationer med flera agenter.

AutoGen : Komponenter och ramverk

I ett försök att minska mängden ansträngning som utvecklare behöver lägga ner för att skapa komplexa applikationer med hjälp av LLM-funktioner över ett brett spektrum av domäner, är den grundläggande principen för AutoGen att konsolidera och effektivisera arbetsflöden för flera agenter genom att använda multiagentkonversationer , vilket också maximerar återanvändbarheten av dessa implementerade medel. AutoGen använder flera agenter som kan ha konversationer med varandra för att framgångsrikt utföra de önskade uppgifterna, och ramverket bygger på två grundläggande koncept: Konverserbara agenter och Konverserbar programmering.

Konverserbara agenter

En konverserbar agent i AutoGen är en enhet med en fördefinierad roll som kan skicka meddelanden för att skicka och ta emot information till och från andra konverserbara agenter. En konverserbar agent bibehåller sitt interna sammanhang baserat på mottagna eller skickade meddelanden, och utvecklare kan konfigurera dessa agenter för att ha en unik uppsättning funktioner som att aktiveras av LLM-verktyg eller ta mänskliga input.

Agentfunktioner som drivs av människor, verktyg och LLM

En agents förmåga är direkt relaterad till hur den bearbetar och svarar på meddelanden, vilket är den främsta anledningen till att agenterna i AutoGen-ramverket tillåter utvecklare flexibiliteten att ge sina agenter olika funktioner. AutoGen stöder många vanliga komponerbara funktioner för agenter som inkluderar

LLM:er: Agenter som stöds av LLM utnyttjar funktionerna hos avancerade LLM-ramverk som implicit tillståndsinterferens, rollspel, ge feedback och till och med kodning. Utvecklare kan använda nya prompttekniker för att kombinera dessa förmågor i ett försök att öka en agents autonomi eller skicklighet.
Människor: Flera applikationer önskar eller kräver en viss grad av mänskligt engagemang, och AutoGen-ramverket tillåter LLM-baserade applikationer att underlätta mänskligt deltagande i agentkonversationer med hjälp av agenter som stöds av människor som kan begära mänskliga insatser under vissa konversationsronder på basis av agentens konfiguration.
Verktyg: Verktygsstödda agenter har vanligtvis förmågan att använda kodexekvering eller funktionsexekvering för att exekvera verktyg.

Agentsamarbete och anpassning

Baserat på de specifika behoven och kraven för en applikation kan utvecklare konfigurera individuella agenter för att ha en kombination av viktiga back-end-typer för att visa det komplexa beteendet som är involverat i konversationer med flera agenter. AutoGen-ramverket tillåter utvecklare att enkelt skapa agenter med specialiserade roller och kapaciteter genom att utöka eller återanvända de inbyggda agenterna. Bilden nedan visar den grundläggande strukturen för inbyggda agenter i AutoGen-ramverket. Klassen ConversableAgent kan använda människor, verktyg och LLM:er som standard eftersom det är agentabstraktionen på högsta nivå. UserProxyAgent och AssistantAgent är förkonfigurerade klasser av ConversableAgent, och var och en av dem representerar ett gemensamt användningsläge, dvs var och en av dessa två agenter fungerar som en AI-assistent (när de stöds av LLMs), och begär mänsklig input eller utför funktionsanrop eller koder (när de stöds av verktyg och/eller människor) genom att agera som en mänsklig proxy.

Bilden nedan visar hur utvecklare kan använda AutoGen-ramverket för att utveckla ett tvåagentsystem som har en anpassad svarsfunktion, tillsammans med en illustration av den resulterande automatiska agentchatt som använder tvåagentsystemet under körningen av programmet.

Genom att tillåta användning av anpassade agenter som kan konversera med varandra, fungerar dessa konverserbara agenter som en grundläggande byggsten i AutoGen-ramverket. Utvecklare måste dock specificera och forma dessa multiagentkonversationer för att utveckla applikationer där dessa agenter kan göra betydande framsteg med de angivna uppgifterna.

Konversationsprogrammering

För att lösa problemet ovan använder AutoGen-ramverket konversationsprogrammering, ett datorparadigm byggt på två väsentliga koncept: beräkning, de åtgärder som vidtas av agenter i en konversation med flera agenter för att beräkna deras svar och styrningsflöde, villkoren eller sekvensen under vilka dessa beräkningar äger rum. Möjligheten att programmera dessa tillåter utvecklare att implementera många flexibla konversationsmönster för flera agenter. Dessutom, i AutoGen-ramverket, är beräkningarna konversationscentrerade. De åtgärder som vidtas av en agent är relevanta för de konversationer agenten är inblandad i, och de åtgärder som vidtas av agenterna resulterar sedan i att meddelanden skickas för efterföljande konversationer tills den punkt då ett uppsägningsvillkor är uppfyllt. Dessutom drivs kontrollflödet i AutoGen-ramverket av konversationer eftersom det är de deltagande agenternas beslut om vilka agenter som kommer att skicka meddelanden till och från beräkningsproceduren.

Ovanstående figur visar en enkel illustration av hur enskilda agenter utför sina rollspecifika operationer och konversationscentrerade beräkningar för att generera de önskade svaren som kodexekvering och LLM-interferensanrop. Uppgiften går framåt med hjälp av konversationer som visas i dialogrutan.

För att underlätta konversationsprogrammering har AutoGen-ramverket följande designmönster.

Automatiska svarsmekanismer och enhetligt gränssnitt för automatiska agentchattar

AutoGen-ramverket har ett enhetligt gränssnitt för att utföra motsvarande beräkning som är konversationscentrerad till sin natur, inklusive en "ta emot eller skicka funktion" för att antingen ta emot eller skicka meddelanden tillsammans med en "generera_svar” funktion som genererar ett svar på grundval av det mottagna meddelandet och vidtar nödvändiga åtgärder. AutoGen-ramverket introducerar och distribuerar också agent-auto svar mekanism som standard för att realisera den konversationsdrivna kontrollen.

Kontroll genom sammanslagning av naturligt språk och programmering

AutoGen-ramverket underlättar användningen av naturligt språk och programmering i olika kontrollflödeshanteringsmönster som inkluderar: Naturliga språkkontroller med hjälp av LLM, Styrning av programmeringsspråkoch Styr övergången mellan programmering och naturligt språk.

Utöver statiska konversationer som vanligtvis åtföljs av ett fördefinierat flöde, stöder AutoGen-ramverket också dynamiska konversationsflöden med flera agenter, och ramverket ger utvecklare två alternativ för att uppnå detta

Genom att använda funktionsanrop.
Genom att använda en anpassad generera-svar-funktion.

Tillämpningar av AutoGen

För att illustrera potentialen hos AutoGen-ramverket i utvecklingen av komplexa multi-agent-applikationer, här är sex potentiella applikationer av AutoGen som väljs ut på grundval av deras relevans i den verkliga världen, problemlösningsförmåga förstärkt av AutoGen-ramverket, och deras innovativa potential.

Dessa sex tillämpningar av AutoGen-ramverket är

Matematisk problemlösning.
Hämta utökade chattar.
ALF chattar.
Multi-agent kodning.
Dynamisk gruppchatt.
Konversationsschack.

Tillämpningar av AutoGen Framework

Applikation 1: Problemlösning i matematik

Matematik är en av de grundläggande disciplinerna för att utnyttja LLM-modeller för att hjälpa till med att lösa komplexa matematiska problem som öppnar upp en helt ny värld av potentiella tillämpningar inklusive AI-forskningshjälp och personlig AI-handledning.

Den bifogade figuren ovan visar tillämpningen av AutoGen-ramverket för att uppnå konkurrenskraftiga prestanda för att lösa matematiska problem.

Applikation 2: Frågesvar och hämtning-förstärkt kodgenerering

Under de senaste månaderna har Retrieval Augmented Code Generation dykt upp som ett effektivt och praktiskt tillvägagångssätt för att övervinna begränsningarna hos LLM:er när det gäller att införliva externa dokument. Figuren nedan visar tillämpningen av AutoGen-ramverket för effektiv hämtningsförstärkning och förbättrad prestanda för frågor och svar.

Tillämpning 3: Beslutsfattande i textvärldsmiljöer

AutoGen-ramverket kan användas för att skapa applikationer som fungerar med online eller interaktivt beslutsfattande. Bilden nedan visar hur utvecklare kan använda AutoGen-ramverket för att designa ett samtalssystem med tre agenter med en jordningsagent för att avsevärt öka prestandan.

Applikation 4: Multi-Agent Coding

Utvecklare som arbetar med AutoGen-ramverket kan använda OptiGuide-ramverket för att bygga ett kodningssystem för flera agenter som kan skriva kod för att implementera optimerade lösningar och svara på användarfrågor. Bilden nedan visar att användningen av AutoGen-ramverket för att skapa en multiagentdesign hjälper till att öka den övergripande prestandan avsevärt, särskilt när det gäller att utföra kodningsuppgifter som kräver en skyddsåtgärd.

Applikation 5: Dynamisk gruppchatt

AutoGen-ramverket ger stöd för ett kommunikationsmönster som kretsar kring dynamiska gruppchattar där de deltagande flera agenterna delar sammanhanget, och istället för att följa en uppsättning fördefinierade order, pratar de med varandra på ett dynamiskt sätt. Dessa dynamiska gruppchattar är beroende av pågående konversationer för att styra flödet av interaktion inom agenterna.

Ovanstående figur illustrerar hur AutoGen-ramverket stöder dynamiska gruppchatt mellan agenter genom att använda "GroupChatManager” , en specialagent.

Tillämpning 6: Konversationsschack

Utvecklarna av AutoGen-ramverket använde det för att utveckla en Conversational Chess-applikation som är ett naturligt interferensspel som har inbyggda agenter för spelare som antingen kan vara en LLM eller människa, och det finns också en tredjepartsagent som tillhandahåller relevant information och validerar dragen på brädet på basis av en uppsättning fördefinierade standardregler. Bilden nedan visar Conversational Chess, ett naturligt interferensspel byggt med hjälp av AutoGen-ramverket som tillåter spelare att använda skämt, karaktärsspel eller till och med meme-referenser för att uttrycka sina rörelser kreativt, vilket gör schackspelet mer intressant inte bara för spelarna. , men också för publik och åskådare.

Slutsats

I den här artikeln har vi pratat om AutoGen, ett ramverk med öppen källkod som använder begreppen konversationsprogrammering & konverserbara agenter som syftar till att förenkla orkestreringen och optimeringen av LLM-arbetsflödena genom att introducera automatisering i arbetsflödespipelinen. AutoGen-ramverket erbjuder konverserbara och anpassningsbara agenter som utnyttjar kraften hos avancerade LLM:er som GPT-3 och GPT-4, och samtidigt åtgärdar deras nuvarande begränsningar genom att integrera LLM:erna med verktyg och mänskliga input genom att använda automatiserade chattar för att initiera konversationer mellan flera agenter.

Även om AutoGen-ramverket fortfarande är i sina tidiga experimentstadier, banar det väg för framtida utforskningar och forskningsmöjligheter inom området, och AutoGen kan vara verktyget som hjälper till att förbättra hastigheten, funktionaliteten och enkla utvecklingen av applikationer som utnyttjar LLMs kapacitet.

Relaterade ämnen:

Strax

Att bryta ner "State of AI Report 2023"

Missa inte

AudioSep : Separera allt du beskriver