Думка
Обмеження пам’яті ChatGPT викликає розчарування — Мозок показує кращий шлях

Якщо ви потужний користувач ChatGPT, ви, можливо, недавно зустрілися з страшним екраном “Пам’ять заповнена”. Це повідомлення з’являється, коли ви досягли межі збережених пам’ятей ChatGPT, і це може бути серйозною перешкодою під час довгострокових проєктів. Пам’ять повинна бути ключовою функцією для складних, тривалих завдань — ви хочете, щоб ваш ІІ зберігав знання з попередніх сесій для майбутніх виходів.бачення попередження про повну пам’ять посередині термінового проєкту (наприклад, коли я виправляв постійні помилки сервера HTTP 502 на одному з наших сестринських сайтів) може бути дуже розчаровуючим і порушувати роботу.
Розчарування через обмеження пам’яті ChatGPT
Основна проблема полягає не в тому, що існує обмеження пам’яті — навіть платні користувачі ChatGPT Plus можуть зрозуміти, що можуть бути практичні обмеження того, скільки можна зберігати. Реальна проблема полягає в тому, як вам потрібно керувати старими пам’ятями після досягнення межі. Поточний інтерфейс для керування пам’яттю є трудомістким і часозатратним. Коли ChatGPT повідомляє вам, що ваша пам’ять заповнена на 100%, у вас є два варіанти: болісно видалити пам’яті одну за одною або видалити всі одразу. Не існує проміжного варіанта або інструменту масового вибору для ефективного підтримання збереженої інформації.
Видалення однієї пам’яті за раз, особливо якщо вам потрібно робити це кожні кілька днів, відчувається як робота, яка не сприяє довгостроковому використанню. Після всього, більшість збережених пам’ятей зберігалися з певної причини — вони містять цінний контекст, який ви надали ChatGPT про свої потреби або свій бізнес. Природно, ви хотіли б видалити мінімальну кількість елементів, необхідну для звільнення місця, щоб не позбавити ІІ розуміння вашої історії. Однак дизайн керування пам’яттю змушує вас вибирати між усьому або нічого або повільним ручним підтриманням. Я особисто спостерігав, що кожна видалена пам’ять звільняє лише близько 1% місця пам’яті, що свідчить про те, що система дозволяє приблизно 100 пам’ятей загалом до того, як вона заповниться (100% використання). Ця жорстка межа здається довільною з урахуванням масштабу сучасних систем ІІ, і вона підкреслює обіцянку того, що ChatGPT стане знающим помічником, який росте з вами з часом.
Що повинно відбуватися
Якщо враховувати, що ChatGPT і інфраструктура за ним мають доступ майже до необмежених обчислювальних ресурсів, то дивно, що рішення для довгострокової пам’яті є такою примітивною. Ідеально, довгострокова пам’ять ІІ повинна краще повторювати, як людський мозок діє і обробляє інформацію з часом. Людський мозок має ефективні стратегії для керування пам’яттю — ми не просто записуємо кожну подію слово за словом і зберігаємо її необмежено. Замість цього мозок призначений для ефективності: ми зберігаємо детальну інформацію в короткостроковій пам’яті, а потім поступово консолідуємо і стискуємо ці деталі в довгострокову пам’ять.
У нейробіології консолідування пам’яті відноситься до процесу, за допомогою якого нестабільні короткострокові пам’яті перетворюються в стабільні, довгострокові. За стандартною моделлю консолідування, нові досвіди спочатку кодуються гіпокампом, регіоном мозку, який є важливим для формування епізодичних пам’ятей, а з часом знання “навчаються” в кору для постійного зберігання. Цей процес не відбувається миттєво — він вимагає проходження часу і часто відбувається під час періодів відпочинку або сну. Гіпокамп фактично діє як швидкозатVERHній буфер, а кора поступово інтегрує інформацію в більш стійку форму поширених нейронних мереж. Інакше кажучи, “короткострокова пам’ять” мозку (робоча пам’ять і недавні досвіди) систематично передається і реорганізується в розподілену довгострокову пам’ять. Цей багаторічний перехід робить пам’ять більш стійкою до інтерференції або забування, подібно до стабілізації запису, щоб він не був легко перезаписаний.
Важливо, що людський мозок не марнує ресурси, зберігаючи кожну деталь дослівно. Замість цього він схильний фільтрувати незначимі деталі і зберігати те, що є найбільш значимим з наших досвідів. Психологи давно відзначили, що коли ми пригадуємо минулу подію або вивчену інформацію, ми зазвичай пригадуємо суть цього, а не дослівний опис. Наприклад, після прочитання книги або перегляду фільму ви пам’ятатимете основні сюжетні моменти і теми, але не кожну фразу діалогу. З часом точна формулировка і деталі досвіду зникають, залишаючи після себе більш абстрактний підсумок того, що відбулося. Насправді дослідження показують, що наша дослівна пам’ять (точні деталі) зникає швидше, ніж наша пам’ять про сутність (загальне значення) з часом. Це ефективний спосіб зберігання знань: викидаючи зайві деталі, мозок “стискає” інформацію, зберігаючи лише суттєві частини, які, ймовірно, будуть корисними в майбутньому.
Ця нейронна компресія можна порівняти з тим, як комп’ютери стискають файли, і дійсно вчені спостерігали аналогічні процеси в мозку. Коли ми ментально переграємо пам’ять або уявляємо майбутню ситуацію, нейронна репрезентація фактично прискорюється і позбавляється деяких деталей — це стиснута версія реального досвіду. Нейробіологи в UT Austin виявили механізм мозкових хвиль, який дозволяє нам пригадати цілий ряд подій (наприклад, післяnoon, проведений у магазині) за кілька секунд, використовуючи швидшу мозкову ритміку, яка кодує менш детальну, високорівневу інформацію. По суті, наш мозок може перемотувати через пам’ять, зберігаючи контур і критичні моменти, а не деталі, які були б зайвими або надто об’ємними для повного відтворення. Наслідком є те, що уявлені плани і пригадані досвіди зберігаються в стиснутій формі — все ще корисній і зрозумілій, але значно більш ефективній за оригінальний досвід.
Іншим важливим аспектом керування пам’яттю людини є пріоритезація. Не все, що потрапляє до короткострокової пам’яті, вічно зберігається в довгостроковому зберіганні. Наш мозок підсвідомо вирішує, що варто пам’ятати, а що ні, залежно від значимості або емоційної виразності. Недавнє дослідження в університеті Рокфеллера продемонструвало цей принцип, використовуючи мишей: миші були піддані декільком результатам у лабіринті (декілька високо винагороджених, деякі слабо винагороджені, деякі негативні). Спочатку миші вивчили всі асоціації, але коли їх тестували через місяць, зберігалася лише найбільш виразна пам’ять про високу винагороду, тоді як менш важливі деталі зникли.
Інакше кажучи, мозок фільтрує шум і зберігає пам’ять, яка найважливіша для цілей тварини. Дослідники навіть ідентифікували мозковий регіон, передню таламус, який діє як一种 модератор між гіпокампом і корою під час консолідування, сигналізуючи, які пам’яті достатньо важливі, щоб “зберегти” на довгий термін. Таламус, здається, надсилає безперервне підкріплення для цінних пам’ятей — фактично кажучи корі “збережи цю” — доки пам’ять не буде повністю закодована — тоді як дозволяє менш важливим пам’ятям зникнути. Це відкриття підкреслює, що забування не є просто провалом пам’яті, а активною особливістю системи: позбуваючись зайвої або надмірної інформації, мозок запобігає завантаженню свого зберігання пам’яті і забезпечує легкий доступ до найбільш корисних знань.
Перегляд пам’яті ІІ з людськими принципами
Спосіб, яким людський мозок обробляє пам’ять, пропонує чіткий план того, як ChatGPT і подібні системи ІІ повинні керувати довгостроковою інформацією. Замість того, щоб розглядати кожну збережену пам’ять як ізольовану точку даних, яку потрібно зберігати назавжди або вручну видаляти, ІІ міг би консолідувати і підсумувати старіші пам’яті на фоні. Наприклад, якщо у вас є десять пов’язаних розмов або фактів, збережених про ваш проєкт, ІІ міг би автоматично об’єднати їх у стислий підсумок або набір ключових висновків — ефективно стискаючи пам’ять, зберігаючи її сутність, подібно до того, як мозок конденсує деталі в сутність. Це звільнило би місце для нової інформації без справжнього “забування” того, що було важливим про старі взаємодії. Дійсно, документація OpenAI намекає, що моделі ChatGPT вже можуть робити деяке автоматичне оновлення і об’єднання збережених деталей, але поточний досвід користувача свідчить про те, що це ще не безшовно чи достатньо.
Іншим вдохновленим людьми вдосконаленням було б пріоритетне збереження пам’яті. Замість жорсткої межі в 100 пунктів ІІ міг би зважувати, які пам’яті були найбільш часто актуальними або найбільш критичними для потреб користувача, і видаляти (або знижувати) лише ті, які здаються найменш важливими. На практиці це могло б означати, що ChatGPT ідентифікує, що певні факти (наприклад, основні цілі вашої компанії, специфікації проєкту, особисті вподобання) є високо виразними і повинні завжди зберігатися, тоді як одноразові шматки тривії з місяців тому могли бути архівовані або видалені першими. Цей динамічний підхід паралельний тому, як мозок постійно підтримує незастосовані з’єднання і посилює часто використовувані для оптимізації когнітивної ефективності.
Основна думка полягає в тому, що довгострокова система пам’яті для ІІ повинна еволюціонувати, а не просто заповнюватися і зупинятися. Людська пам’ять є надзвичайно адаптивною — вона трансформується і реорганізується з часом, і вона не очікує зовнішнього користувача для мікрокерування кожним слотом пам’яті. Якщо пам’ять ChatGPT працювала б більш як наша, користувачі не зустрічалися б з раптовою стіною в 100 записах, ані з болісним вибором між видаленням всього або кліком через сотню пунктів по одному. Замість цього старіші чат-пам’яті поступово трансформувалися б у дистильовану базу знань, яку ІІ міг би використовувати, а真正 застарілі або незначимі частини зникли б. Спільнота ІІ, яка є ціловою аудиторією тут, може оцінити, що реалізація такої системи може включати техніки, такі як підсумування контексту, векторові бази даних для відновлення знань або ієрархічні шари пам’яті в нейронних мережах — всі ці активні області досліджень. Насправді, надання ІІ форми “епізодичної пам’яті”, яка стискається з часом, є відомим викликом, і вирішення його буде стрибком до ІІ, який безперервно вчиться і масштабує свою базу знань устойчиво.
Висновок
Поточне обмеження пам’яті ChatGPT здається тимчасовим рішенням, яке не використовує повної потужності ІІ. Оглядаючи людську когнітивність, ми бачимо, що ефективна довгострокова пам’ять не полягає в зберіганні необмежених сирих даних — це про розумну компресію, консолідацію і забування правильних речей. Спроможність людського мозку зберігати те, що важливо, і економити на зберіганні є саме тим, що робить нашу довгострокову пам’ять такою величезною і корисною. Для того, щоб ІІ став справжнім довгостроковим партнером, йому слід прийняти подібну стратегію: автоматично витягувати минулі взаємодії в тривалі інсайти, а не перекладати цю відповідальність на користувача. Розчарування від зустрічі з “пам’яттю, повною” стіною могло бути замінено системою, яка елегантно росте з використанням, вчиться і пам’ятає гнучким, людським способом. Прийняття цих принципів не тільки розв’яже болючу точку UX, але також розблокує більш потужний і персоналізований досвід ІІ для всієї спільноти користувачів і розробників, які покладаються на ці інструменти.












