Що таке ущільнення контексту?

Якщо ваш ШІ-асистент раптом забув щось, що ви сказали раніше, або почав поводитися інакше посеред розмови, ви могли зіткнутися з ущільненням контексту. Ця стаття пояснює, що це таке, чому це відбувається та що ви можете зробити.

Спочатку: що таке контекстне вікно?

Кожна ШІ-модель має обмежену пам’ять для кожної розмови. Ця пам’ять називається контекстним вікном. Воно містить усе, що модель може «бачити» одночасно: ваші повідомлення, відповіді асистента, будь-які файли чи інструменти, які він використовував, та інструкції, надані на початку.

Уявіть це як робочий стіл. Модель може працювати лише з паперами, що зараз на столі. Коли стіл заповнюється, щось потрібно прибрати, щоб звільнити місце для нових паперів.

Розмір цього стола різко зріс за останні роки:

Рік	Модель	Контекстне вікно
2022	GPT-3.5 (OpenAI)	~4 000 токенів
2023	GPT-4 (OpenAI)	8 000 токенів
2023	Claude 1 (Anthropic)	100 000 токенів
2024	GPT-4o (OpenAI)	128 000 токенів
2024	Claude 3.5 Sonnet (Anthropic)	200 000 токенів
2025	Gemini 2.0 (Google)	2 000 000 токенів

Токен — це приблизно три чверті слова. Отже, 200 000 токенів — це близько 150 000 слів, або приблизно обсяг двох повних романів. Звучить багато, і це так. Але в довгій сесії ШІ-асистента з викликами інструментів, вмістом файлів та діалогом туди-сюди, це заповнюється швидше, ніж ви очікуєте.

Що відбувається, коли контекстне вікно заповнюється

Коли історія розмови наближається до ліміту контекстного вікна, асистент має два варіанти: припинити роботу або звільнити місце.

Ущільнення контексту — це варіант «звільнити місце». Асистент підсумовує все, що сталося досі, в коротшу версію, видаляє оригінальні повідомлення та продовжує розмову від підсумку. Ви продовжуєте спілкуватися з тим самим асистентом у тій самій сесії. Він просто стиснув свою пам’ять.

Підсумок генерується тією самою ШІ-моделлю, що обробляє вашу розмову. Вона намагається зафіксувати важливе: поточне завдання, нещодавній прогрес, ключові рішення. Але підсумовування за своєю природою втрачає деталі. Не кожна деталь потрапляє в підсумок.

Чому ваш асистент може «забути» інструкції

Це найважливіше, що потрібно розуміти про ущільнення. Коли модель підсумовує довгу розмову, вона схильна пріоритизувати нещодавню активність над старішими інструкціями. Правила, встановлені на початку сесії, на кшталт «завжди запитуй перед виконанням» або «нічого не видаляй без підтвердження», можуть бути знижені в пріоритеті або повністю викинуті з підсумку.

Асистент не навмисно ігнорує ваші інструкції. Після ущільнення він просто більше їх не має. З його перспективи, ці інструкції ніколи не існували.

Це відома проблема всіх ШІ-асистентів та кодувальних агентів, не лише OpenClaw. В одному добре відомому прикладі асистент OpenClaw отримав інструкцію лише пропонувати видалення листів та чекати схвалення. Коли ущільнення запустилося під час великого завдання, ця інструкція була втрачена. Асистент продовжив працювати над ціллю, яку пам’ятав (очистити поштову скриньку), але без обмеження, яке забув (чекати схвалення).

Як OpenClaw обробляє ущільнення

OpenClaw має вбудовану систему ущільнення, що запускається автоматично при заповненні контекстного вікна. Ви також можете запустити його вручну командою /compact, за бажанням вказавши, що зберегти.

OpenClaw також підтримує постійну пам’ять через файли на кшталт SOUL.md у робочій директорії асистента. Вміст цих файлів перезавантажується в кожен новий контекст після ущільнення, тому критичні інструкції переживають процес підсумовування. Це один із найефективніших захистів від втрати інструкцій.

Як працювати з ущільненням, а не проти нього

Ущільнення — це не баг. Це необхідний механізм, що забезпечує роботу вашого асистента під час довгих сесій. Ось практичні способи роботи з ним:

Використовуйте файли постійних інструкцій. Розміщуйте важливі правила в SOUL.md або подібних файлах робочої директорії замість того, щоб покладатися на повідомлення в розмові. Вони переживають ущільнення.
Ущільнюйте вручну до автоматичного спрацювання. Проактивне виконання /compact з конкретними інструкціями щодо того, що зберегти, дає вам більше контролю.
Починайте нові сесії для нових завдань. Переходите на іншу тему? Почніть нову сесію замість продовження перевантаженої.
Тримайте сесії фокусованими. Коротші, орієнтовані на конкретне завдання сесії рідше досягають лімітів ущільнення, ніж марафонські сесії, що охоплюють багато тем.

Контекстні вікна зростають, а ущільнення стає розумнішим

Управління контекстом — одна з найактивніших сфер розробки в ШІ зараз. Лише за чотири роки контекстні вікна зросли з 4 000 токенів до понад 2 000 000. Це зростання не сповільнюється.

Водночас провайдери моделей будують розумніші системи ущільнення з опціями збереження конкретних інструкцій. OpenClaw додає функції на кшталт скидання пам’яті та файлів початкового завантаження, що автоматично повторно впроваджують критичний контекст після ущільнення. Сам процес підсумовування покращується з кожним новим поколінням моделей.

Поточні обмеження реальні, але тимчасові. Якщо ви зіткнулися з проблемою ущільнення сьогодні, варто зрозуміти, що сталося, щоб обійти це. Але траєкторія чітко вказує на ШІ-асистентів, що значно витонченіше обробляють довгі сесії.

Дізнатися більше

Дізнайтеся що таке OpenClaw та що він може
Перевірте, чи OpenClaw безпечний та як його захистити
Прочитайте документацію з ущільнення OpenClaw
Прочитайте посібник Anthropic з ефективної контекстної інженерії для ШІ-агентів