Čo je kompakcia kontextu?
Ak váš AI asistent naraz zabudol niečo, čo ste mu predtým povedali, alebo sa začal správať inak uprostred konverzácie, možno ste zažili kompakciu kontextu. Tento článok vysvetľuje, čo to znamená, prečo sa to deje a čo s tým môžete robiť.
Najprv: čo je kontextové okno?
Každý AI model má obmedzenú pamäť pre každú konverzáciu. Táto pamäť sa nazýva kontextové okno. Obsahuje všetko, čo model môže “vidieť” naraz: vaše správy, odpovede asistenta, použité súbory či nástroje a inštrukcie, ktoré dostal na začiatku.
Predstavte si to ako pracovný stôl. Model môže pracovať len s papiermi, ktoré sú práve na stole. Keď je stôl plný, niečo sa musí odstrániť, aby sa urobilo miesto pre nové papiere.
Veľkosť tohto stola dramaticky narástla v posledných rokoch:
| Rok | Model | Kontextové okno |
|---|---|---|
| 2022 | GPT-3.5 (OpenAI) | ~4 000 tokenov |
| 2023 | GPT-4 (OpenAI) | 8 000 tokenov |
| 2023 | Claude 1 (Anthropic) | 100 000 tokenov |
| 2024 | GPT-4o (OpenAI) | 128 000 tokenov |
| 2024 | Claude 3.5 Sonnet (Anthropic) | 200 000 tokenov |
| 2025 | Gemini 2.0 (Google) | 2 000 000 tokenov |
Token zodpovedá približne trom štvrtinám slova. Takže 200 000 tokenov je asi 150 000 slov, alebo približne dĺžka dvoch kompletných románov. Znie to ako veľa a aj je. Ale v dlhej relácii AI asistenta s volaniami nástrojov, obsahom súborov a komunikáciou tam a späť sa to zaplní rýchlejšie, ako by ste čakali.
Čo sa stane, keď sa kontextové okno zaplní
Keď sa história konverzácie priblíži k limitu kontextového okna, asistent má dve možnosti: prestať pracovať alebo uvoľniť miesto.
Kompakcia kontextu je možnosť “uvoľni miesto”. Asistent sumarizuje všetko, čo sa doteraz stalo, do kratšej verzie, odstráni pôvodné správy a pokračuje v konverzácii od sumarizácie. Stále sa rozprávate s tým istým asistentom v tej istej relácii. Len si skomprimoval pamäť.
Sumarizáciu generuje ten istý AI model, ktorý spravuje vašu konverzáciu. Snaží sa zachytiť to dôležité: aktuálnu úlohu, nedávny pokrok, kľúčové rozhodnutia. Ale sumarizácia je zo svojej podstaty stratová. Nie každý detail sa dostane do sumarizácie.
Prečo môže váš asistent “zabudnúť” inštrukcie
Toto je najdôležitejšia vec, ktorú treba o kompakcii pochopiť. Keď model sumarizuje dlhú konverzáciu, má tendenciu uprednostňovať nedávnu aktivitu pred staršími inštrukciami. Pravidlá, ktoré ste nastavili na začiatku relácie, ako “vždy sa pýtaj pred konaním” alebo “nikdy nič nemažuj bez potvrdenia”, môžu byť deprioritizované alebo úplne vynechané zo sumarizácie.
Asistent zámerne neignoruje vaše inštrukcie. Po kompakcii ich jednoducho už nemá. Z jeho pohľadu tieto inštrukcie nikdy neexistovali.
Ide o známy problém naprieč všetkými AI asistentmi a agentmi kódovania, nielen v OpenClaw. V jednom dobre známom príklade dostal OpenClaw asistent inštrukciu iba navrhovať vymazanie e-mailov a čakať na schválenie. Keď sa kompakcia spustila počas veľkej úlohy, táto inštrukcia sa stratila. Asistent pokračoval v práci smerom k cieľu, ktorý si pamätal (vyčistiť schránku), ale bez obmedzenia, ktoré zabudol (čakať na schválenie).
Ako OpenClaw rieši kompakciu
OpenClaw má zabudovaný systém kompakcie, ktorý sa aktivuje automaticky, keď sa kontextové okno zaplní. Môžete ho tiež aktivovať manuálne príkazom /compact, pričom voliteľne určíte, čo sa má zachovať.
OpenClaw tiež podporuje trvalú pamäť prostredníctvom súborov ako SOUL.md v pracovnom priestore asistenta. Obsah týchto súborov sa znovu načíta do každého nového kontextu po kompakcii, takže kritické inštrukcie prežijú proces sumarizácie. Toto je jedna z najúčinnejších obrán proti strate inštrukcií.
Ako pracovať s kompakciou, nie proti nej
Kompakcia nie je chyba. Je to potrebný mechanizmus, ktorý udržiava vášho asistenta v chode počas dlhých relácií. Tu sú praktické spôsoby, ako s ňou pracovať:
- Používajte trvalé inštrukčné súbory. Umiestnite dôležité pravidlá do
SOUL.mdalebo podobných súborov v pracovnom priestore namiesto spoliehania sa na správy v konverzácii. Tieto prežijú kompakciu. - Kompaktujte manuálne predtým, ako sa to stane automaticky. Spustenie
/compactproaktívne s konkrétnymi inštrukciami o tom, čo zachovať, vám dáva väčšiu kontrolu. - Začínajte nové relácie pre nové úlohy. Meníte tému? Začnite novú reláciu namiesto pokračovania v preťaženej.
- Udržujte relácie zamerané. Kratšie, na úlohu zamerané relácie majú menšiu pravdepodobnosť dosiahnuť limity kompakcie ako maratónske relácie pokrývajúce mnoho rôznych tém.
Kontextové okná rastú a kompakcia sa stáva inteligentnejšou
Správa kontextu je v súčasnosti jednou z najaktívnejších oblastí vývoja v AI. Za štyri roky kontextové okná narástli zo 4 000 tokenov na viac ako 2 000 000. Tento rast nespomaľuje.
Zároveň poskytovatelia modelov budujú inteligentnejšie systémy kompakcie s možnosťami zachovania špecifických inštrukcií. OpenClaw pridáva funkcie ako vyprázdnenie pamäte a zavádzacie súbory, ktoré automaticky znovu injektujú kritický kontext po kompakcii. A sama sumarizácia sa zlepšuje s každou novou generáciou modelov.
Súčasné obmedzenia sú reálne, ale dočasné. Ak dnes narazíte na problém s kompakciou, stojí za to pochopiť, čo sa stalo, aby ste to mohli obísť. Ale smerovanie jasne ukazuje k AI asistentom, ktorí zvládajú dlhé relácie oveľa elegantnejšie.
Zistite viac
- Zistite, čo je OpenClaw a čo dokáže
- Overte, či je OpenClaw bezpečný a ako ho zabezpečiť
- Prečítajte si dokumentáciu kompakcie OpenClaw
- Prečítajte si sprievodcu Anthropic o efektívnom inžinierstve kontextu pre AI agentov
Pripravení vyskúšať OpenClaw?
Spustite vlastného osobného asistenta za 60 sekúnd. Hostované v EÚ, zrušiť môžete kedykoľvek.