Spojte se s námi

Názor

Paměťový limit ChatGPT je frustrující – mozek ukazuje lepší cestu

mm

Pokud jste zkušeným uživatelem ChatGPT, možná jste se nedávno setkali s obávanou obrazovkou „Paměť je plná“. Tato zpráva se zobrazí, když dosáhnete limitu uložené paměti ChatGPT, a může být značnou překážkou při dlouhodobých projektech. Paměť má být klíčovou funkcí pro složité, probíhající úkoly – chcete, aby vaše umělá inteligence přenášela znalosti z předchozích relací do budoucích výstupů. Vidění varování o plné paměti uprostřed časově citlivého projektu (například když jsem řešil přetrvávající chyby serveru HTTP 502 na jednom z našich sesterských webů) může být extrémně frustrující a rušivé.

Frustrace z limitu paměti ChatGPT

Hlavním problémem není existenci limitu paměti – i platící uživatelé ChatGPT Plus chápou, že mohou existovat praktická omezení toho, kolik paměti lze uložit. Skutečný problém spočívá v… jak Jakmile je dosaženo limitu, musíte spravovat staré vzpomínky. Současné rozhraní pro správu paměti je zdlouhavé a časově náročné. Když vás ChatGPT upozorní, že je vaše paměť 100% plná, máte dvě možnosti: pečlivě mazat vzpomínky jednu po druhé nebo je vymazat všechny najednou. Neexistuje žádný nástroj pro mezilehlý ani hromadný výběr, který by efektivně prořezával uložené informace.

Mazání jedné vzpomínky po druhé, zvláště pokud to musíte dělat každých pár dní, se jeví jako otravná povinnost, která není vhodná pro dlouhodobé používání. Koneckonců, většina uložených vzpomínek byla uchovávána z nějakého důvodu – obsahují cenný kontext, který jste poskytli ChatGPT o svých potřebách nebo podnikání. Přirozeně byste raději smazali minimální počet položek potřebných k uvolnění místa, abyste neomezili chápání vaší historie umělou inteligencí. Návrh správy paměti však nutí přístup „všechno nebo nic“ nebo pomalou ruční správu. Osobně jsem pozoroval, že každá smazaná vzpomínka uvolní pouze asi 1% paměťového prostoru, což naznačuje, že systém povoluje pouze přibližně Celkem 100 vzpomínek než se naplní (100% využití). Toto pevné omezení se vzhledem k rozsahu moderních systémů umělé inteligence jeví jako libovolné a podkopává slib ChatGPT stát se zkušeným asistentem, který s vámi v průběhu času poroste.

Co by se mělo dít

Vzhledem k tomu, že ChatGPT a infrastruktura, která za ním stojí, mají přístup k téměř neomezeným výpočetním zdrojům, je překvapivé, že řešení pro dlouhodobou paměť je tak rudimentární. V ideálním případě by… Dlouhodobé paměti umělé inteligence by měly lépe replikovat to, jak lidský mozek funguje a zpracovává informace v průběhu času. Lidský mozek si vyvinul efektivní strategie pro správu vzpomínek – nezaznamenáváme si jednoduše každou událost slovo od slova a neukládáme ji donekonečna. Mozek je naopak navržen pro efektivitu: podrobné informace uchováváme krátkodobě a poté postupně... konsolidovat si komprimovat tyto detaily do dlouhodobé paměti.

V neurovědě, konsolidace paměti označuje proces, kterým se nestabilní krátkodobé vzpomínky transformují na stabilní, dlouhodobé. Podle standardního modelu konsolidace jsou nové zážitky zpočátku kódovány hippocampus, oblasti mozku, která je klíčová pro formování epizodických vzpomínek, a postupem času se tyto znalosti ukládají „vycvičený“ do kortexu pro trvalé uložení. Tento proces neprobíhá okamžitě – vyžaduje plynutí času a často k němu dochází během období odpočinku nebo spánku. Hipokampus v podstatě funguje jako vyrovnávací paměť pro rychlé učení, zatímco mozková kůra postupně integruje informace do trvalejší formy napříč rozsáhlými neuronovými sítěmi. Jinými slovy, „krátkodobá paměť“ mozku (pracovní paměť a nedávné zážitky) je systematicky přenášena a reorganizována do distribuovaného úložiště dlouhodobé paměti. Tento vícestupňový přenos činí paměť odolnější vůči rušení nebo zapomínání, podobně jako stabilizace nahrávky, aby nebyla snadno přepsána.

Rozhodující je lidský mozek není plýtvá zdroji doslovným ukládáním každého detailu. Místo toho má tendenci filtrovat triviální detaily a zachovávat si to nejvýznamnější z našich zkušeností. Psychologové již dlouho poznamenávají, že když si vzpomínáme na minulou událost nebo naučené informace, obvykle zapamatujte si podstatu spíše než dokonalý, slovo od slova popis. Například po přečtení knihy nebo sledování filmu si vzpomenete na hlavní dějové body a témata, ale ne na každou repliku dialogu. Postupem času přesné formulace a drobné detaily zážitku slábnou a zanechávají abstraktnější shrnutí toho, co se stalo. Výzkum dokonce ukazuje, že naše doslovná paměť (přesné detaily) s postupem času slábne rychleji než naše paměť na podstatu (obecný význam). Toto je efektivní způsob ukládání znalostí: tím, že mozek vynechává zbytečné specifika, „komprimuje“ informace a ponechává si ty podstatné části, které se pravděpodobně budou v budoucnu hodit.

Toto nervová komprese lze to přirovnat k tomu, jak počítače komprimují soubory, a vědci skutečně pozorovali analogické procesy v mozku. Když si v duchu přehráváme vzpomínku nebo si představujeme budoucí scénář, nervová reprezentace se efektivně zrychlí a zbaví se některých detailů – je to komprimovaná verze skutečného zážitku. Neurovědci na UT Austin objevili mechanismus mozkových vln, který nám umožňuje vybavit si celou sekvenci událostí (například odpoledne strávené v obchodě s potravinami) během pouhých několika sekund pomocí rychlejšího mozkového rytmu, který kóduje méně detailní informace na vysoké úrovni. V podstatě se náš mozek dokáže rychle procházet vzpomínkami, zachovat si osnovu a kritické body a zároveň vynechat bohaté detaily, které by byly zbytečné nebo příliš objemné na to, aby se daly přehrát v plném rozsahu. Důsledkem je, že představované plány a zapamatované zážitky se ukládají ve zhuštěné podobě – stále užitečné a srozumitelné, ale mnohem prostorově a časově efektivnější než původní zážitek.

Dalším důležitým aspektem řízení lidské paměti je stanovení prioritNe všechno, co se dostane do krátkodobé paměti, se uloží i do dlouhodobého úložiště. Náš mozek podvědomě rozhoduje, co si zapamatovat a co ne, na základě významnosti nebo emocionálního významu. nedávná studie na Rockefellerově univerzitě demonstrovali tento princip na myších: myši byly v bludišti vystaveny několika výsledkům (některé vysoce obohacující, některé mírně obohacující, některé negativní). Zpočátku se myši naučily všechny asociace, ale při testování o měsíc později se objevily pouze ty nejvýraznější Paměť na vysoce odměňující události byla zachována, zatímco méně důležité detaily zmizely.

Jinými slovy, mozek filtroval hluk a ponechal si vzpomínku, která byla pro cíle zvířete nejdůležitější. Vědci dokonce identifikovali oblast mozku, tzv. přední thalamus, který během konsolidace funguje jako jakýsi moderátor mezi hipokampem a kortexem a signalizuje, které vzpomínky jsou dostatečně důležité k dlouhodobému „uložení“. Zdá se, že thalamus vysílá nepřetržité posilování cenných vzpomínek – v podstatě říká kortexu „tuto si ponechte“, dokud není vzpomínka plně zakódována – a zároveň umožňuje méně důležitým vzpomínkám vyblednout. Toto zjištění podtrhuje, že Zapomínání není jen selhání paměti, ale aktivní funkce systémuTím, že se mozek zbaví triviálních nebo nadbytečných informací, zabraňuje zahlcení paměti a zajišťuje snadný přístup k nejužitečnějším znalostem.

Přehodnocení paměti umělé inteligence s ohledem na lidské principy

Způsob, jakým lidský mozek nakládá s pamětí, nabízí jasný plán pro to, jak by ChatGPT a podobné systémy umělé inteligence měly spravovat dlouhodobé informace. Místo toho, aby se s každou uloženou pamětí zacházelo jako s izolovaným datovým bodem, který musí být buď uchováván navždy, nebo ručně smazán, by umělá inteligence mohla... konsolidovat a shrnout starší vzpomínky na pozadí. Pokud máte například deset souvisejících konverzací nebo faktů uložených o vašem probíhajícím projektu, umělá inteligence je může automaticky sloučit do stručného shrnutí nebo sady klíčových závěrů – efektivně tak zkomprimovat paměť a zároveň zachovat její podstatu, podobně jako mozek zhušťuje detaily do hlavního textu. Tím by se uvolnilo místo pro nové informace, aniž by se skutečně „zapomnělo“ na to, co bylo důležité na starých interakcích. Dokumentace OpenAI skutečně rady že modely ChatGPT již dokáží provádět automatické aktualizace a kombinování uložených údajů, ale současná uživatelská zkušenost naznačuje, že to zatím není bezproblémové ani dostatečné.

Dalším vylepšením inspirovaným člověkem by bylo upřednostnění uchovávání paměti. Namísto rigidního limitu 100 položek by umělá inteligence mohla zvažovat, které vzpomínky byly nejčastěji relevantní nebo nejdůležitější pro potřeby uživatele, a zahodit (nebo snížit počet) pouze ty, které se zdají být nejméně důležité. V praxi by to mohlo znamenat, že ChatGPT identifikuje určitá fakta (např. hlavní cíle vaší společnosti, specifikace probíhajících projektů, osobní preference) jako vysoce důležitá a měla by být vždy uchovávána, zatímco jednorázové drobnosti z doby před měsíci by mohly být archivovány nebo odstraněny jako první. Tento dynamický přístup je podobný tomu, jak mozek pracuje. průběžně prořezává nepoužívaná připojení a posiluje ty často používané pro optimalizaci kognitivní efektivity.

Sečteno a podtrženo, systém dlouhodobé paměti pro umělou inteligenci by měl rozvinout, ne jen se zaplnit a zastavit. Lidská paměť je pozoruhodně adaptivní – v průběhu času se transformuje a reorganizuje a neočekává, že externí uživatel bude mikrospravovat každý paměťový slot. Pokud by paměť ChatGPT fungovala více jako ta naše, uživatelé by nečelili náhlé bariéře při 100 položkách ani bolestivému výběru mezi vymazáním všeho nebo proklikáním stovky položek jednu po druhé. Místo toho by se starší vzpomínky z chatu postupně proměnily v destilovanou znalostní bázi, ze které může umělá inteligence čerpat, a zmizely by pouze skutečně zastaralé nebo irelevantní části. Komunita umělé inteligence, která je zde cílovou skupinou, si uvědomuje, že implementace takového systému by mohla zahrnovat techniky, jako je shrnutí kontextu, vektorové databáze pro vyhledávání znalostí, nebo hierarchické paměťové vrstvy v neuronových sítích – to vše jsou aktivní oblasti výzkumu. Ve skutečnosti je známou výzvou dát umělé inteligenci formu „epizodické paměti“, která se v průběhu času komprimuje, a její řešení by bylo skokem směrem k umělé inteligenci, která se učí nepřetržitě a udržitelně škáluje svou znalostní základnu.

Proč investovat do čističky vzduchu?

Současné omezení paměti ChatGPT se jeví jako provizorní řešení, které nevyužívá plný potenciál umělé inteligence. Podíváme-li se na lidské poznávání, vidíme, že efektivní dlouhodobá paměť nespočívá v ukládání neomezeného množství surových dat – jde o inteligentní kompresi, konsolidaci a zapomínání správných věcí. Schopnost lidského mozku uchovat si to, na čem záleží, a zároveň šetřit úložištěm, je přesně to, co dělá naši dlouhodobou paměť tak rozsáhlou a užitečnou. Aby se umělá inteligence stala skutečným dlouhodobým partnerem, měla by přijmout podobnou strategii: automaticky destilovat minulé interakce do trvalých poznatků, spíše než aby tuto zátěž přenášela na uživatele. Frustraci z narážení na zeď „plné paměti“ by mohl nahradit systém, který elegantně roste s používáním, učením a pamatováním flexibilním a lidským způsobem. Přijetí těchto principů by nejen vyřešilo problém UX, ale také by odemklo výkonnější a personalizovanější zážitek z umělé inteligence pro celou komunitu uživatelů a vývojářů, kteří se na tyto nástroje spoléhají.

Antoine je vizionářský vůdce a zakládající partner Unite.AI, poháněný neochvějnou vášní pro utváření a prosazování budoucnosti umělé inteligence a robotiky. Je sériovým podnikatelem a věří, že umělá inteligence bude pro společnost stejně rušivá jako elektřina, a často je přistižen při blouznění o potenciálu převratných technologií a AGI.

Jako futurista, věnuje se zkoumání toho, jak tyto inovace utvářejí náš svět. Kromě toho je zakladatelem Cenné papíry.io, platforma zaměřená na investice do špičkových technologií, které nově definují budoucnost a přetvářejí celé sektory.