Što je kompakcija konteksta?

Ako je Vaš AI asistent iznenada zaboravio nešto što ste mu ranije rekli, ili se počeo ponašati drugačije usred razgovora, možda ste doživjeli kompakciju konteksta. Ovaj članak objašnjava što to znači, zašto se događa i što možete učiniti.

Prvo: što je kontekstni prozor?

Svaki AI model ima ograničenu memoriju za svaki razgovor. Ta memorija naziva se kontekstni prozor. Sadrži sve što model može “vidjeti” odjednom: Vaše poruke, odgovore asistenta, sve datoteke ili alate koje je koristio i upute dane na početku.

Zamislite to kao radni stol. Model može raditi samo s papirima koji su trenutno na stolu. Kad se stol napuni, nešto se mora maknuti da se napravi mjesta za nove papire.

Veličina tog stola dramatično je narasla posljednjih godina:

Godina	Model	Kontekstni prozor
2022	GPT-3.5 (OpenAI)	~4.000 tokena
2023	GPT-4 (OpenAI)	8.000 tokena
2023	Claude 1 (Anthropic)	100.000 tokena
2024	GPT-4o (OpenAI)	128.000 tokena
2024	Claude 3.5 Sonnet (Anthropic)	200.000 tokena
2025	Gemini 2.0 (Google)	2.000.000 tokena

Jedan token otprilike odgovara tri četvrtine riječi. Dakle 200.000 tokena je oko 150.000 riječi, ili otprilike dva cijela romana. Zvuči puno, i jest. No u dugoj sesiji AI asistenta s pozivima alata, sadržajem datoteka i razgovorom naprijed-natrag, napuni se brže nego što biste očekivali.

Što se događa kad se kontekstni prozor napuni

Kada povijest razgovora priđe granici kontekstnog prozora, asistent ima dvije opcije: prestati raditi ili napraviti mjesta.

Kompakcija konteksta je opcija “napravi mjesta”. Asistent sažima sve što se dosad dogodilo u kraću verziju, uklanja izvorne poruke i nastavlja razgovor od sažetka. Vi nastavljate razgovarati s istim asistentom u istoj sesiji. On je samo komprimirao svoju memoriju.

Sažetak generira isti AI model koji obrađuje Vaš razgovor. Pokušava uhvatiti bitno: trenutni zadatak, nedavni napredak, ključne odluke. No sažimanje je inherentno s gubitkom. Ne prolazi svaki detalj u sažetak.

Zašto Vaš asistent može “zaboraviti” upute

Ovo je najvažnija stvar koju trebate razumjeti o kompakciji. Kada model sažima dug razgovor, teži davanju prednosti nedavnoj aktivnosti pred starijim uputama. Pravila koja ste postavili na početku sesije, poput “uvijek pitaj prije nego djeluješ” ili “nikada ne briši ništa bez potvrde”, mogu biti deprioritizirana ili potpuno izostavljena iz sažetka.

Asistent ne ignorira namjerno Vaše upute. Nakon kompakcije ih jednostavno više nema. Iz njegove perspektive te upute nikada nisu postojale.

Ovo je poznati problem kod svih AI asistenata i agenata za kodiranje, ne samo kod OpenClaw. U jednom poznatom primjeru, OpenClaw asistent dobio je uputu da samo predlaže brisanje e-pošte i čeka odobrenje. Kada se kompakcija pokrenula tijekom velikog zadatka, ta je uputa izgubljena. Asistent je nastavio raditi prema cilju koji je zapamtio (očisti sandučić) ali bez ograničenja koje je zaboravio (čekaj odobrenje).

Kako OpenClaw upravlja kompakcijom

OpenClaw ima ugrađeni sustav kompakcije koji se automatski aktivira kad se kontekstni prozor napuni. Možete ga i ručno pokrenuti naredbom /compact, po želji navodeći što treba sačuvati.

OpenClaw podržava i trajnu memoriju putem datoteka poput SOUL.md u radnom prostoru asistenta. Sadržaj tih datoteka ponovno se učitava u svaki novi kontekst nakon kompakcije, tako da kritične upute prežive proces sažimanja. To je jedna od najučinkovitijih obrana od gubitka uputa.

Kako raditi s kompakcijom, ne protiv nje

Kompakcija nije greška. To je nužan mehanizam koji održava Vašeg asistenta u radu tijekom dugih sesija. Evo praktičnih načina za upravljanje:

Koristite trajne datoteke s uputama. Stavite važna pravila u SOUL.md ili slične datoteke radnog prostora umjesto da se oslanjate na poruke u razgovoru. One preživljavaju kompakciju.
Kompaktirajte ručno prije nego se dogodi automatski. Proaktivno pokretanje /compact s konkretnim uputama o tome što sačuvati daje Vam više kontrole.
Pokrenite nove sesije za nove zadatke. Mijenjate temu? Pokrenite novu sesiju umjesto da nastavljate u preopterećenoj.
Održavajte sesije fokusiranima. Kraće sesije usmjerene na zadatak rjeđe dosežu granicu kompakcije od maratonskih sesija koje pokrivaju mnogo različitih tema.

Kontekstni prozori rastu i kompakcija postaje pametnija

Upravljanje kontekstom jedno je od najaktivnijih područja razvoja u AI upravo sada. U samo četiri godine kontekstni su prozori narasli s 4.000 tokena na više od 2.000.000. Taj rast ne usporava.

Istovremeno, pružatelji modela grade pametnije sustave kompakcije s opcijama za očuvanje specifičnih uputa. OpenClaw dodaje značajke poput ispiranja memorije i bootstrap datoteka koje automatski ponovno ubacuju kritični kontekst nakon kompakcije. I samo sažimanje se poboljšava sa svakom novom generacijom modela.

Trenutna ograničenja su stvarna, ali privremena. Ako danas naiđete na problem s kompakcijom, vrijedi razumjeti što se dogodilo kako biste to zaobišli. No putanja jasno vodi prema AI asistentima koji se s dugim sesijama nose znatno elegantnije.

Saznajte više

Saznajte što je OpenClaw i što može
Provjerite je li OpenClaw siguran i kako ga zaštititi
Pročitajte dokumentaciju kompakcije OpenClaw
Pročitajte vodič Anthropica o učinkovitom kontekstnom inženjeringu za AI agente