Connect with us

Za hranice ChatGPT; AI Agent: Nový svět pracovníků

Nástroje AI 101

Za hranice ChatGPT; AI Agent: Nový svět pracovníků

mm

S pokroky v hlubokém učení, zpracování přirozeného jazyka (NLP) a AI, jsme v době, kdy AI agenti mohou tvořit významnou část globální pracovní síly. Tyto AI agenti, které přesahují chatboty a hlasové asistenty, vytvářejí nový paradigm pro obory a náš denní život. Ale co to skutečně znamená žít ve světě obohaceném o tyto “pracovníky”? Tento článek se hluboce ponoří do tohoto se vyvíjejícího krajiny, hodnotí důsledky, potenciál a výzvy, které leží před námi.

Krátce o evoluci AI pracovníků

Než pochopíme nadcházející revoluci, je důležité uznat AI-poháněnou evoluci, která již nastala.

  • Tradiční výpočetní systémy: Z základních výpočetních algoritmů začala cesta. Tyto systémy mohly řešit předem definované úkoly pomocí pevné sady pravidel.
  • Chatboti a rané hlasové asistenty: Jak technologie pokročila, tak i naše rozhraní. Nástroje jako Siri, Cortana a rané chatboty zjednodušily interakci uživatel-AI, ale měly omezené pochopení a schopnosti.
  • Neuronové sítě a hluboké učení: Neuronové sítě označily zlomový bod, napodobující funkce lidského mozku a vyvíjející se prostřednictvím zkušeností. Techniky hlubokého učení dále zlepšily toto, umožňující sofistikované rozpoznávání obrazů a řeči.
  • Transformátory a pokročilé modely NLP: Zavedení architektur transformátorů revolucionalizovalo krajinu NLP. Systémy jako ChatGPT od OpenAI, BERT a T5 umožnily průlomové úspěchy v komunikaci člověk-AI. S jejich hlubokým pochopením jazyka a kontextu mohou tyto modely vést smysluplné konverzace, vytvářet obsah a odpovídat na komplexní otázky s bezprecedentní přesností.

Vstup AI agenta: Více než jen konverzace

Dnešní AI krajina naznačuje něco rozsáhlejšího než konverzační nástroje. AI agenti, za hranicemi pouhých chat funkcí, mohou nyní provádět úkoly, učit se z prostředí, rozhodovat a dokonce vykazovat kreativitu. Nerozumí pouze odpovědím; řeší problémy.

Tradiční softwarové modely fungovaly na jasném postupu. Stakeholdeři vyjádřili cíl softwarovým manažerům, kteří pak navrhli konkrétní plán. Inženýři by tento plán provedli prostřednictvím řádků kódu. Tento ‘legacy paradigm’ softwarové funkcionality byl jasný, zahrnující řadu lidských zásahů.

AI agenti však fungují jinak. Agent:

  1. cíle, kterých se snaží dosáhnout.
  2. Může interagovat se svým prostředím.
  3. Navrhuje plán na základě těchto pozorování, aby dosáhl svého cíle.
  4. Přijímá nezbytné akce, upravuje svůj přístup na základě měnícího se stavu prostředí.

Co skutečně odlišuje AI agenti od tradičních modelů, je jejich schopnost autonomně vytvářet krok za krokem plán k dosažení cíle. V podstatě, zatímco dříve programátor poskytoval plán, dnešní AI agenti vytvářejí svou vlastní cestu.

Vezměme si každodenní příklad. V tradičním softwarovém designu by program upozornil uživatele na pozdní úkoly na základě předem stanovených podmínek. Vývojáři by tyto podmínky nastavili na základě specifikací poskytnutých produktovým manažerem.

V paradigmatu AI agenta sám agent rozhoduje, kdy a jak upozornit uživatele. Hodnotí prostředí (uživatelovy návyky, stav aplikace) a rozhoduje o nejlepším postupu. Proces se tak stává více dynamickým, více v daném okamžiku.

ChatGPT označil odchod od svého tradičního použití s integrací pluginů, umožňující mu využívat externí nástroje pro provádění více požadavků. Stal se raným projevem konceptu agenta. Pokud vezmeme jednoduchý příklad: uživatel se ptá na počasí v New Yorku, ChatGPT, využívající pluginy, může interagovat s externím poštovním API, interpretovat data a dokonce korigovat podle obdržených odpovědí.

Aktuální krajina AI agentů

Aktuální krajina AI agentů

AI agenti, včetně Auto-GPT, AgentGPT a BabyAGI, zvěstují novou éru v rozsáhlém AI vesmíru. Zatímco ChatGPT popularizoval Generativní AI vyžadující lidský vstup, vize za AI agenty je umožnit AI fungovat nezávisle, směřovat k cílům s minimálním lidským zásahem. Tento transformační potenciál byl podtržen meteorickým vzestupem Auto-GPT, který získal přes 107 000 hvězd na GitHubu během pouhých šesti týdnů od jeho vzniku, nebývalý růst ve srovnání se zavedenými projekty, jako je balíček pro datové vědy ‘pandas’.

AI Agenti vs. ChatGPT

Mnozí pokročilí AI agenti, jako Auto-GPT a BabyAGI, využívají architekturu GPT. Jejich primárním zaměřením je minimalizovat potřebu lidského zásahu při dokončování AI úkolů. Popisné termíny, jako “GPT na smyčce”, charakterizují provoz modelů, jako je AgentGPT a BabyAGI. Provozují se v iterativních cyklech, aby lépe pochopili požadavky uživatelů a vylepšili své výstupy. Zatímco Auto-GPT posouvá hranice dále, zahrnuje přístup k internetu a schopnost spouštět kód, což významně rozšiřuje jeho dosah řešení problémů.

Inovace v AI Agentech

  1. Dlouhodobá paměť: Tradiční LLM mají omezenou paměť, uchovávají pouze nedávné segmenty interakcí. Pro komplexní úkoly se stává zásadním recalls整个 konverzace nebo dokonce předchozích konverzací. K překonání tohoto, AI agenti přijali pracovní postupy pro vkládání, převádějící textové konverzace na numerické pole, nabízející řešení omezení paměti.
  2. Schopnosti prohlížení webu: Auto-GPT je vybaven procházením schopnostmi, využívající Google Search API. To vyvolalo debaty v AI komunitě ohledně rozsahu znalostí AI.
  3. Spuštění kódu: Kromě generování kódu může Auto-GPT spouštět shell a Python kód. Tato bezprecedentní schopnost mu umožňuje rozhraní s jiným softwarem, čímž rozšiřuje jeho provozní doménu.

ARCHITEKTURA AI AGENTŮ AUTOGPT, AGENTGPT, LLM, PAMĚŤ A další

Diagram znázorňuje architekturu systému AI poháněného velkým jazykovým modelem a agenty.

  • Vstupy: Systém přijímá data z různých zdrojů: přímé uživatelské příkazy, strukturované databáze, webový obsah a údaje z reálných environmentálních senzorů.
  • LLM & Agenti: V jádru zpracovává LLM tyto vstupy, spolupracuje se specializovanými agenty, jako je Auto-GPT pro řetězení myšlenek, AgentGPT pro webové úkoly, BabyAGI pro úkoly specifické pro úkoly a HuggingGPT pro týmovou zpracování.
  • Výstupy: Jakmile jsou informace zpracovány, jsou transformovány do uživatelsky přívětivého formátu a poté předány zařízením, která mohou jednat nebo ovlivňovat vnější prostředí.
  • Komponenty paměti: Systém uchovává informace, a to jak dočasně, tak trvale, prostřednictvím krátkodobých缓 a dlouhodobých databází.
  • Prostředí: Toto je vnější sféra, která ovlivňuje senzory a je ovlivňována akcemi systému.

Pokročilí AI Agenti: Auto-GPT, BabyAGI a další

AutoGPT a AgentGPT

AutoGPT, dítě vydáno na GitHub v březnu 2023, je geniální Python-based aplikace, která využívá sílu GPT, OpenAI’s transformačního generativního modelu. Co odlišuje Auto-GPT od jeho předchůdců, je jeho autonomie – je navržen tak, aby prováděl úkoly s minimálním lidským vedením a má jedinečnou schopnost samo-iniciovat podněty. Uživatelé prostě potřebují definovat hlavní cíl, a Auto-GPT vytváří požadované podněty k dosažení tohoto cíle, dělaje z něj potenciálně revoluční krok směrem k skutečné umělé obecné inteligenci (AGI).

S funkcemi, které sahají od internetové konektivity, správy paměti až po schopnosti ukládat soubory pomocí GPT-3.5, tento nástroj je schopen zvládnout širokou škálu úkolů, od konvenčních, jako je složení e-mailu, až po komplexní úkoly, které by obvykle vyžadovaly mnohem více lidského zapojení.

Na druhé straně AgentGPT, také postavený na frameworku GPT, je uživatelsky orientované rozhraní, které nevyžaduje rozsáhlé znalosti kódování pro nastavení a použití. AgentGPT umožňuje uživatelům definovat AI cíle, které pak rozkládá na zvládnutelné úkoly.

AgentGPT AI AGENT

AgentGPT UI

Furthermore, AgentGPT vyniká svou všestranností. Není omezen na vytváření chatbotů. Platforma rozšiřuje své schopnosti na vytváření různých aplikací, jako jsou Discord boti, a dokonce se integruje bezproblémově s Auto-GPT. Tento přístup zajišťuje, že i ti, kteří nemají rozsáhlé znalosti kódování, mohou provádět úkoly, jako je plně autonomní kódování, generování textu, překlad jazyků a řešení problémů.

LangChain je framework, který spojuje Large Language Modely (LLM) s různými nástroji a využívá agenty, často vnímané jako ‘Boty’, k určení a provedení konkrétních úkolů výběrem vhodného nástroje. Tyto agenty se bezproblémově integrují s externími zdroji, zatímco vektorová databáze v LangChain ukládá nestrukturovaná data, usnadňující rychlé získání informací pro LLM.

BabyAGI

Pak je tu BabyAGI, zjednodušený, ale mocný agent. Chcete-li pochopit schopnosti BabyAGI, představte si digitálního projektového manažera, který autonomně vytváří, organizuje a provádí úkoly se zaměřením na stanovené cíle. Zatímco většina AI-driven platforem je omezena jejich předem trénovanými znalostmi, BabyAGI vyniká svou schopností adaptovat se a učit se z zkušeností. Má hlubokou schopnost rozlišovat zpětnou vazbu a, podobně jako lidé, zakládat rozhodnutí na základě pokusů a omylů.

Zejména základní síla BabyAGI není pouze v jeho adaptabilitě, ale také v jeho schopnosti spouštět kód pro specifické cíle. Vyniká v komplexních doménách, jako je obchodování s kryptoměnami, robotika a autonomní řízení, dělaje z něj všestranný nástroj v široké škále aplikací.

BABYAGI úkol-poháněný autonomní agent

https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/

Proces lze rozdělit do tří agentů:

  1. Exekuční Agent: Srdce systému, tento agent využívá OpenAI’s API pro zpracování úkolů. Daný cíl a úkol, vyvolá OpenAI’s API a získá výsledky úkolů.
  2. Agent pro vytváření úkolů: Tato funkce vytváří nové úkoly na základě předchozích výsledků a aktuálních cílů. Podnět je odeslán do OpenAI’s API, které pak vrátí potenciální úkoly, organizované jako seznam slovníků.
  3. Agent pro prioritizaci úkolů: Konečná fáze zahrnuje sekvencování úkolů na základě priority. Tento agent využívá OpenAI’s API k reorder úkolů, zajistí, aby nejkritičtější úkoly byly provedeny první.

Ve spolupráci s OpenAI’s jazykovým modelem, BabyAGI využívá schopnosti Pinecone pro kontext-centric úložiště a získání úkolů.

Níže je demonstrace BabyAGI pomocí tohoto odkazu.

Abyste začali, budete potřebovat platný OpenAPI klíč. Pro snadný přístup má UI nastavení, kde lze zadat OpenAPI klíč. Kromě toho, pokud chcete spravovat náklady, nezapomeňte nastavit limit počtu iterací.

Jakmile jsem aplikaci nakonfiguroval, provedl jsem malý experiment. Zadal jsem podnět BabyAGI: “Vytvořte stručný tweetový řetězec zaměřený na cestu osobního růstu, dotýkající se milníků, výzev a transformačního účinku kontinuálního učení.”

BabyAGI odpověděl dobře promyšleným plánem. Nešlo o generický šablonu, ale o komplexní mapu, která naznačovala, že podkladový AI skutečně pochopil nuance požadavku.

BABYAGI úkol-poháněný autonomní agent

Deepnote AI Copilot

Deepnote AI Copilot mění dynamiku prozkoumání dat v noteboocích. Ale co ho odlišuje?

V jeho jádru, Deepnote AI cílí na posílení workflow datových vědců. Okamžik, kdy poskytnete základní instrukci, AI se rozeběhne, vymýšleje strategie, provádějící SQL dotazy, visualizující data pomocí Pythonu a prezentující svá zjištění v артиkulovaném způsobem.

Jednou z hlavních sil Deepnote AI je jeho komplexní pochopení vašeho pracovního prostoru. Porozuměním integračním schématům a souborovým systémům, jeho plány se dokonale sladí s organizačním kontextem, zajišťuje, že jeho vhledy jsou vždy relevantní.

Integrace AI s notebookovými médii vytváří jedinečnou zpětnou vazbu. Aktivně hodnotí kódové výstupy, dělaje ho schopen sebe-korekce a zajišťuje, že výsledky jsou konzistentní se stanovenými cíli.

Deepnote AI vyniká transparentními operacemi, poskytujícími jasný vhled do jeho procesů. Proplétání kódu a výstupů zajišťuje, že jeho akty jsou vždy zodpovědné a reprodukovatelné.

CAMEL

CAMEL je framework, který usiluje o spolupráci mezi AI agenty, cílem je efektivní dokončení úkolů s minimálním lidským dohledem.

CAMEL AI AGENT

https://github.com/camel-ai/camel

Rozděluje své operace do dvou hlavních typů agentů:

  • AI Uživatel Agent rozkládá instrukce.
  • AI Asistent Agent provádí úkoly na základě poskytnutých direktiv.

Jednou z aspirací CAMEL je rozplést složitosti AI myšlení, cílem je optimalizovat synergii mezi několika agenty. S funkcemi, jako je role-playing a inception prompting, zajišťuje, že AI úkoly se sladí dokonale s lidskými cíli.

Westworld Simulace: Život do AI

Odvozené z inspirací, jako je software Unity a adaptované v Pythonu, Westworld simulace je skokem ve simulaci a optimalizaci prostředí, kde interagují多 AI agenti, téměř jako digitální společnost.

Generativní Agenti

Generativní Agenti

Tito agenti nejsou pouze digitální entity. Simulují věrohodné lidské chování, od denních rutin až po komplexní sociální interakce. Jejich architektura rozšiřuje velký jazykový model, aby ukládal zkušenosti, odrážel se na nich a využíval je pro dynamické plánování chování.

Westworld simulace představuje harmonické spojení výpočetní síly a lidských nuancí. Sléváním rozsáhlých jazykových modelů s dynamickými simulacemi agentů, vytváří cestu k vytváření AI zkušeností, které jsou ohromující neoddělitelné od reality.

Závěr

AI agenti mohou být neuvěřitelně všestranní a formují obory, mění pracovní postupy a umožňují činy, které dříve zdály nemožné. Ale jako všechny průlomové inovace, nejsou bez svých nedokonalostí.

Zatímco mají sílu měnit samotnou tkaninu naší digitální existence, tito agenti stále zápasí s určitými výzvami, některé z nich jsou zásadně lidské, jako je pochopení kontextu v nuancovaných scénářích nebo řešení problémů, které leží mimo jejich trénovací sady.

V dalším článku se budeme hluboce zabývat Auto-GPT a GPT Engineer, zkoumáním, jak je nastavit a používat. Kromě toho prozkoumáme důvody, proč tito AI agenti občas selhávají, jako je například uvíznutí v smyčkách, mezi jinými problémy. Takže zůstaňte naladění!

Já jsem strávil posledních pět let ponořen do fascinujícího světa Machine Learning a Deep Learning. Moje vášeň a odbornost mě vedly k tomu, abych přispěl k více než 50 různým softwarovým inženýrským projektům, se zvláštním zaměřením na AI/ML. Moje pokračující zvědavost mě také táhne směrem k Natural Language Processing, oblasti, kterou jsem ochoten dále prozkoumat.