Umělá inteligence

ChatDev: Komunikativní agenti pro vývoj softwaru

aktualizováno on Listopadu 1, 2023

Odvětví vývoje softwaru je doménou, která často spoléhá jak na konzultace, tak na intuici, vyznačující se složitými strategiemi rozhodování. Navíc vývoj, údržba a provoz softwaru vyžadují disciplinovaný a metodický přístup. Je běžné, že vývojáři softwaru zakládají rozhodnutí spíše na intuici než na konzultacích, v závislosti na složitosti problému. Ve snaze zvýšit efektivitu softwarového inženýrství, včetně efektivity softwaru a snížení nákladů na vývoj, vědci zkoumají použití rámců založených na hlubokém učení k řešení různých úkolů v rámci procesu vývoje softwaru. S nedávným vývojem a pokroky v sektorech hlubokého učení a umělé inteligence hledají vývojáři způsoby, jak transformovat procesy a postupy vývoje softwaru. Dělají to pomocí sofistikovaných návrhů implementovaných v různých fázích procesu vývoje softwaru.

Dnes budeme diskutovat ChatDev, inovativní přístup založený na velkém jazykovém modelu (LLM), jehož cílem je převrat v oblasti vývoje softwaru. Toto paradigma se snaží eliminovat potřebu specializovaných modelů během každé fáze vývojového procesu. Rámec ChatDev využívá schopnosti rámců LLM a využívá komunikaci v přirozeném jazyce ke sjednocení a zefektivnění klíčových procesů vývoje softwaru.

V tomto článku prozkoumáme ChatDev, virtuální společnost specializující se na vývoj softwaru. ChatDev přijímá vodopádový model a pečlivě rozděluje proces vývoje softwaru do čtyř primárních fází.

Projektování.
Kódování.
Testování.
Dokumentace.

Instrumentální analýza ChatDev ukazuje, že rámec ChatDev je nejen extrémně efektivní při dokončování procesu vývoje softwaru, ale je extrémně nákladově efektivní a také dokončuje celý proces vývoje softwaru za méně než jeden dolar. Kromě toho rámec nejen identifikuje, ale také zmírňuje potenciální zranitelnosti, napravuje potenciální halucinace, to vše při zachování vysoké účinnosti a nákladové efektivity.

ChatDev: Úvod do vývoje softwaru založeného na LLM

Odvětví vývoje softwaru je tradičně odvětvím, které je postaveno na základech disciplinovaného a metodického přístupu nejen k vývoji aplikací, ale také k jejich údržbě a provozu. Tradičně řečeno, typický proces vývoje softwaru je vysoce složitý, složitý a časově náročný proces s dlouhými vývojovými cykly, protože do procesu vývoje je zapojeno několik rolí včetně koordinace v rámci organizace, přidělování úkolů, psaní kódu, testování a nakonec dokumentace.

V posledních letech s pomocí LLM nebo velké jazykové modelyKomunita umělé inteligence dosáhla významných milníků v oblasti počítačového vidění a zpracování přirozeného jazyka a po školení o paradigmatech „předvídání dalšího slova“ prokázaly Large Language Models svou schopnost vrátit efektivní výkon u široké řady navazujících úkolů. jako je strojový překlad, odpovídání na otázky a generování kódu.

Ačkoli velké jazykové modely mohou psát kód pro celý software, mají velkou nevýhodu: kódové halucinace, což je docela podobné halucinacím, kterým čelí rámce zpracování přirozeného jazyka. Halucinace kódu mohou zahrnovat problémy, jako jsou neobjevené chyby, chybějící závislosti a neúplné implementace funkcí. Existují dvě hlavní příčiny halucinací kódu.

Chybějící specifikace úkolu: Při generování softwarového kódu v jediném kroku nedefinování specifika úkolu zaměňuje LLM jako úkoly v procesu vývoje softwaru, jako je analýza uživatelských požadavků nebo výběr preferovaného programovacího jazyka, často poskytují řízené myšlení, něco, co chybí na nejvyšší úrovni. Úlohy na úrovni zpracovávané těmito LLM.
Nedostatek křížového výslechu : Významná rizika přicházejí, když se neprovádí křížové zkoumání, zejména během rozhodovacích procesů.

ChatDev si klade za cíl tyto problémy vyřešit a usnadnit LLM s mocí vytvářet nejmodernější a efektivní softwarové aplikace vytvořením virtuální společnosti pro vývoj softwaru, která stanoví vodopádový model a pečlivě rozděluje proces vývoje softwaru na čtyři primární etapy,

Projektování.
Kódování.
Testování.
Dokumentace.

Každá z těchto fází nasazuje tým virtuálních agentů, jako jsou programátoři kódu nebo testeři, kteří vzájemně spolupracují pomocí dialogů, jejichž výsledkem je bezproblémový pracovní postup. ChatDev navíc využívá chatovací řetězec, který funguje jako facilitátor a rozděluje každou fázi vývojového procesu na atomické dílčí úkoly, čímž umožňuje dvojí role, což umožňuje návrhy a ověřování řešení pomocí kontextové komunikace, která umožňuje vývojářům efektivně vyřešit zadané dílčí úkoly. Řetězec chatu se skládá z několika uzlů, kde každý jednotlivý uzel představuje konkrétní dílčí úkol, a tyto dvě role se zapojují do víceotáčkových kontextových diskusí, aby řešení nejen navrhovaly, ale také ověřovaly.

V tomto přístupu framework ChatDev nejprve analyzuje požadavky klienta, generuje kreativní nápady, navrhuje a implementuje prototypové systémy, identifikuje a řeší potenciální problémy, vytváří přitažlivou grafiku, vysvětluje ladicí informace a generuje uživatelské manuály. A konečně, framework ChatDev dodává software uživateli spolu se zdrojovým kódem, uživatelskými manuály a specifikacemi závislého prostředí.

ChatDev: Architektura a práce

Nyní, když máme krátký úvod do ChatDev, pojďme se podívat na architekturu a fungování rámce ChatDev počínaje Chat Chain.

Chatový řetězec

Jak jsme zmínili v předchozí části, framework ChatDev používá pro vývoj softwaru vodopádovou metodu, která rozděluje proces vývoje softwaru do čtyř fází včetně návrhu, kódování, testování a dokumentace. Každá z těchto fází má v procesu rozvoje jedinečnou roli a je mezi nimi potřeba efektivní komunikace a při identifikaci jednotlivců, se kterými se lze zapojit, a při určování posloupnosti interakcí existují potenciální problémy.

K vyřešení tohoto problému používá rámec ChatDev Chat Chain, zobecněnou architekturu, která rozděluje každou fázi na subatomární chat, přičemž každá z těchto fází se zaměřuje na hraní rolí orientované na úkoly, které zahrnuje dvojí role. Požadovaný výstup pro chat tvoří životně důležitou komponentu pro cílový software a je dosažen jako výsledek spolupráce a výměny instrukcí mezi agenty účastnícími se procesu vývoje. Paradigma řetězce chatu pro středně pokročilé řešení úloh je znázorněno na obrázku níže.

U každého individuálního chatu instruktor nejprve iniciuje pokyny a poté vede dialog směrem k dokončení úkolu a mezitím se asistenti řídí pokyny zadaných instruktorem, poskytují ideální řešení a zapojují se do diskusí o proveditelnosti. řešení. Instruktor a agent se poté zapojí do víceotáčkových dialogů, dokud nedosáhnou konsensu a považují úkol za úspěšně splněný. Řetězový řetězec poskytuje uživatelům transparentní pohled na proces vývoje, osvětluje cestu pro rozhodování a nabízí příležitosti k ladění chyb, když se objeví, což umožňuje koncovým uživatelům analyzovat a diagnostikovat chyby, kontrolovat mezivýstupy, a v případě potřeby zasáhnout do procesu. Díky začlenění řetězce chatu je rámec ChatDev schopen zaměřit se na každý konkrétní dílčí úkol v granulárním měřítku, což nejen usnadňuje efektivní spolupráci mezi agenty, ale také vede k rychlému dosažení požadovaných výstupů.

Projektování

Ve fázi návrhu vyžaduje framework ChatDev počáteční nápad jako vstup od lidského klienta a v této fázi jsou tři předdefinované role.

CEO nebo generální ředitel.
CPO nebo Chief Product Officer.
CTO nebo technický ředitel.

Řetězec chatu pak vstupuje do hry a rozděluje fázi návrhu na sekvenční subatomární chatovací úlohy, které zahrnují programovací jazyk (CTO a CEO) a modalitu cílového softwaru (CPO a CEO). Fáze návrhu zahrnuje tři klíčové mechanismy: Přiřazení rolí nebo Specializace rolí, Paměťový proud a Sebereflexe.

Přiřazení role

Každému agentovi v rámci Chat Dev je přiřazena role pomocí speciálních zpráv nebo speciálních výzev během procesu hraní rolí. Na rozdíl od jiných modelů konverzačních jazyků se rámec ChatDev omezuje pouze na spouštění scénářů hraní rolí mezi agenty. Tyto výzvy se používají k přiřazení rolí agentům před dialogy.

Zpočátku instruktor přebírá odpovědnost generálního ředitele a zapojuje se do interaktivního plánování, zatímco povinnosti CPO má na starosti agent, který provádí úkoly a poskytuje požadované odpovědi. Rámec používá „počáteční výzva” pro specializaci rolí, která agentům umožňuje efektivně plnit své role. Výzvy asistenta a instruktora se skládají z důležitých podrobností týkajících se určených rolí a úkolů, kritérií ukončení, komunikačních protokolů a několika omezení, jejichž cílem je zabránit nežádoucímu chování, jako jsou nekonečné smyčky, neinformativní reakce a redundance pokynů.

Memory Stream

Paměťový proud je mechanismus používaný rámcem ChatDev, který udržuje komplexní konverzační záznam předchozích dialogů agenta a pomáhá při rozhodovacím procesu, který následuje způsobem s vědomím výpovědi. Rámec ChatDev používá výzvy k vytvoření požadovaných komunikačních protokolů. Například, když zúčastněné strany dosáhnou konsensu, závěrečná zpráva, která splňuje konkrétní požadavek na formátování, jako je ( : Desktopová aplikace“). Aby byl zajištěn soulad s určeným formátem, rámec nepřetržitě monitoruje a nakonec umožňuje, aby aktuální dialog dospěl k závěru.

Sebereflexe

Vývojáři frameworku ChatDev zaznamenali situace, kdy obě zúčastněné strany dosáhly vzájemného konsenzu, ale předdefinované komunikační protokoly nebyly spuštěny. Chcete-li tyto problémy vyřešit, Framework ChatDev zavádí mechanismus sebereflexe která pomáhá při získávání a extrakci vzpomínek. K implementaci mechanismu sebereflexe zahájí rámec ChatDev nový a čerstvý chat tím, že zařadí „pseudo self“ jako nového tazatele. „Pseudo self“ analyzuje předchozí dialogy a historické záznamy a informuje současného asistenta, načež si vyžádá shrnutí přesvědčivých a činných informací, jak je znázorněno na obrázku níže.

S pomocí svépomocného mechanismu je asistent ChatDev povzbuzován, aby reflektoval a analyzoval rozhodnutí, která navrhl.

Kódování

Ve fázi kódování jsou tři předdefinované role, jmenovitě CTO, programátor a výtvarník. Mechanismus řetězce chatu jako obvykle rozděluje fázi kódování na jednotlivé subatomární úlohy, jako je generování kódů (programátor a CTO) nebo navrhování GUI. nebo grafické uživatelské rozhraní (programátor a návrhář). CTO poté instruuje programátora, aby použil formát markdown k implementaci softwarového systému, na jehož základě výtvarný designér navrhne uživatelsky přívětivé a interaktivní GUI, které využívá grafické ikony k interakci s uživateli spíše než se spoléhat na tradiční textové příkazy.

Správa kódu

Rámec ChatDev používá objektově orientované programovací jazyky jako Python, Java a C++ ke zpracování komplexních softwarových systémů, protože modularita těchto programovacích jazyků umožňuje použití samostatných objektů, které nejen pomáhají při odstraňování problémů, ale také při společném vývoji. a také pomáhá při odstraňování nadbytečnosti opakovaným použitím objektů prostřednictvím konceptu dědičnosti.

Myšlenkové instrukce

Tradiční metody zodpovězení otázek často vedou k irelevantním informacím nebo nepřesnostem, zejména při generování kódu, protože poskytování naivních instrukcí může vést k halucinacím LLM a může se stát náročným problémem. K vyřešení tohoto problému zavádí framework ChatDev mechanismus „myšlenkových instrukcí“, který čerpá inspiraci z výzev řetězu myšlenek. Mechanismus „myšlenkových instrukcí“ se explicitně zabývá jednotlivými myšlenkami na řešení problémů obsaženými v pokynech, podobně jako řešení úkolů sekvenčním a organizovaným způsobem.

Testování

Napsat bezchybný kód na první pokus je náročné nejen pro LLM, ale také pro lidské programátory, a spíše než úplné vyřazení nesprávného kódu, programátoři analyzují svůj kód, aby identifikovali chyby a opravili je. Fáze testování v rámci ChatDev je rozdělena do tří rolí: programátor, tester a recenzent. Proces testování je dále rozdělen do dvou po sobě jdoucích subatomárních úloh: Peer Review nebo statické ladění (recenzent a programátor) a Testování systému nebo dynamické ladění (Programátor a Tester). Statické ladění nebo Peer review analyzuje zdrojový kód k identifikaci chyb, zatímco dynamické ladění nebo systémové testování ověřuje provádění softwaru prostřednictvím různých testů, které programátor provádí pomocí interpretu. Dynamické ladění se zaměřuje především na testování aplikací v černé skříňce.

Dokumentace

Poté, co je framework ChatDev hotový s fázemi návrhu, kódování a testování, zaměstnává čtyři agenty, jmenovitě CEO, CTO, CPO a Programmer, aby vygeneroval dokumentaci pro softwarový projekt. Rámec ChatDev používá LLM k využití několika výzev s kontextovými příklady pro generování dokumentů. CTO instruuje programátora, aby poskytl pokyny pro konfiguraci závislostí prostředí a vytvořil dokument jako „dependency requirements.txt“. Současně jsou požadavky a návrh systému sděleny CPO generálním ředitelem, aby vytvořil uživatelskou příručku pro produkt.

výsledky

Statistiky softwaru

Chcete-li analyzovat výkon rámce ChatDev, tým vývojářů provedl statistickou analýzu softwarových aplikací generovaných rámcem na základě několika klíčových metrik včetně spotřebovaných tokenů, celkového počtu otočení dialogu, obrazových aktiv, softwarových souborů, aktualizací verzí a několika dalších, a výsledky jsou ukázáno v tabulce níže.

Analýza trvání

Aby se prověřila doba výroby softwaru ChatDev pro různé výzvy k požadavku, vývojáři také provedli analýzu trvání a rozdíl v době vývoje pro různé výzvy odráží různou jasnost a složitost přidělených úkolů a výsledky jsou znázorněny na obrázku níže. .

Případová studie

Následující obrázek ukazuje ChatDev vyvíjející hru Piškvorky nebo Gomoku.

Obrázek zcela vlevo ukazuje základní software vytvořený frameworkem bez použití GUI. Jak je dobře vidět, aplikace bez GUI nabízí omezenou interaktivitu a uživatelé mohou tuto hru hrát pouze přes příkazový terminál. Další obrázek ukazuje vizuálně přitažlivější hru vytvořenou pomocí GUI, nabízí lepší uživatelský zážitek a vylepšenou interaktivitu pro poutavé herní prostředí, které si uživatelé mohou užít mnohem více. Designér poté vytvoří další grafiku pro další vylepšení použitelnosti a estetiky hry, aniž by to ovlivnilo jakoukoli funkčnost. Pokud však lidští uživatelé nejsou spokojeni s obrázkem generovaným návrhářem, mohou obrázky nahradit poté, co framework ChatDev dokončí software. Flexibilita nabízená rámcem ChatDev pro ruční nahrazení obrázků umožňuje uživatelům přizpůsobit aplikace podle jejich preferencí pro vylepšenou interaktivitu a uživatelský zážitek, aniž by to jakýmkoli způsobem ovlivnilo funkčnost softwaru.

Závěrečné myšlenky

V tomto článku jsme hovořili o ChatDev, an LLM neboli velký jazykový model založené inovativní paradigma, jehož cílem je převrat v oblasti vývoje softwaru odstraněním požadavku na specializované modely během každé fáze vývojového procesu. Rámec ChatDev se zaměřuje na využití schopností rámců LLM pomocí komunikace v přirozeném jazyce ke sjednocení a zefektivnění klíčových procesů vývoje softwaru. Rámec ChatDev využívá mechanismus chatovacího řetězce k rozdělení procesu vývoje softwaru na sekvenční subatomární úlohy, čímž umožňuje granulární zaměření a podporuje požadované výstupy pro každý subatomární úkol.

Související témata:chatdev

Nahoru Další

Jak technologie „Acoustic Touch“ nabízí vidění prostřednictvím zvuku

Nenechte si ujít

EasyPhoto: Váš osobní generátor fotografií AI

Kunal Kejriwal

„Povoláním inženýr, srdcem spisovatel“. Kunal je technický spisovatel s hlubokou láskou a porozuměním AI a ML, který se věnuje zjednodušování složitých konceptů v těchto oblastech prostřednictvím své poutavé a informativní dokumentace.