Ce je vas pomocnik z umetno inteligenco nenadoma pozabil nekaj, kar ste mu prej povedali, ali se je sredi pogovora zacel obnasati drugace, ste morda izkusili zgoscevanje konteksta. Ta clanek pojasnjuje, kaj to pomeni, zakaj se dogaja in kaj lahko storite.

Najprej: kaj je kontekstno okno?

Vsak model umetne inteligence ima omejen pomnilnik za vsak pogovor. Ta pomnilnik se imenuje kontekstno okno. Vsebuje vse, kar model lahko hkrati “vidi”: vasa sporocila, odgovore pomocnika, uporabljene datoteke ali orodja in navodila, ki jih je prejel na zacetku.

Predstavljajte si ga kot pisalno mizo. Model lahko dela samo s papirji, ki so trenutno na mizi. Ko je miza polna, je treba nekaj odstraniti, da se sprosti prostor za nove papirje.

Velikost te mize je v zadnjih letih izjemno narasla:

LetoModelKontekstno okno
2022GPT-3.5 (OpenAI)~4.000 zetonov
2023GPT-4 (OpenAI)8.000 zetonov
2023Claude 1 (Anthropic)100.000 zetonov
2024GPT-4o (OpenAI)128.000 zetonov
2024Claude 3.5 Sonnet (Anthropic)200.000 zetonov
2025Gemini 2.0 (Google)2.000.000 zetonov

Zeton ustreza priblizno trem cetrtinam besede. Torej 200.000 zetonov pomeni priblizno 150.000 besed ali priblizno dolzino dveh celotnih romanov. To se slisi kot veliko in tudi je. Toda v dolgotrajni seji pomocnika z umetno inteligenco s klici orodij, vsebino datotek in izmenjavo sporocil se zapolni hitreje, kot bi pricakovali.

Kaj se zgodi, ko se kontekstno okno zapolni

Ko se zgodovina pogovora pribliza meji kontekstnega okna, ima pomocnik dve moznosti: prenehati delati ali narediti prostor.

Zgoscevanje konteksta je moznost “naredi prostor”. Pomocnik povzame vse, kar se je doslej zgodilo, v krajso razlicico, odstrani prvotna sporocila in nadaljuje pogovor od povzetka. Se vedno se pogovarjate z istim pomocnikom v isti seji. Le svoj pomnilnik je stisnil.

Povzetek generira isti model umetne inteligence, ki upravlja vas pogovor. Poskusa zajeti bistveno: trenutno nalogo, nedavni napredek, kljucne odlocitve. Toda povzemanje je po naravi izgubno. Vsaka podrobnost ne pride v povzetek.

Zakaj vas pomocnik lahko “pozabi” navodila

To je najpomembnejsa stvar, ki jo je treba razumeti o zgoscevanju. Ko model povzame dolg pogovor, ima navado dajati prednost nedavni dejavnosti pred starejsimi navodili. Pravila, ki ste jih dolocili na zacetku seje, kot sta “vedno vprasaj, preden ukrepass” ali “nikoli nicesar ne brisi brez potrditve”, so lahko razvrednotena ali v celoti izpuscena iz povzetka.

Pomocnik ne prezre namerno vasih navodil. Po zgoscevanju jih preprosto nima vec. Z njegove perspektive ta navodila nikoli niso obstajala.

To je znan problem pri vseh pomocnikih z umetno inteligenco in agentih za kodiranje, ne le pri OpenClaw. V enem znanem primeru je pomocnik OpenClaw prejel navodilo, naj le predlaga brisanje e-poste in pocaka na odobritev. Ko se je zgoscevanje sprozilo med obsezno nalogo, se je to navodilo izgubilo. Pomocnik je nadaljeval z delom proti cilju, ki si ga je zapomnil (pocistiti nabiralnik), toda brez omejitve, ki jo je pozabil (pocakati na odobritev).

Kako OpenClaw obravnava zgoscevanje

OpenClaw ima vgrajen sistem zgoscevanja, ki se samodejno sproze, ko se kontekstno okno zapolni. Lahko ga sprozite tudi rocno z ukazom /compact, pri cemer po zelji navedete, kaj naj se ohrani.

OpenClaw podpira tudi trajni pomnilnik prek datotek, kot je SOUL.md, v delovnem prostoru pomocnika. Vsebina teh datotek se po zgoscevanju znova nalozi v vsak nov kontekst, tako da kriticna navodila prezivijo postopek povzemanja. To je ena najučinkovitejših obramb pred izgubo navodil.

Kako delati z zgoscevanjem, ne proti njemu

Zgoscevanje ni napaka. Je nujen mehanizem, ki ohranja vasega pomocnika v delovanju med dolgimi sejami. Tukaj so prakticni nasveti za ravnanje z njim:

  • Uporabljajte trajne datoteke z navodili. Pomembna pravila postavite v SOUL.md ali podobne datoteke v delovnem prostoru namesto zanasanja na sporocila v pogovoru. Te prezivijo zgoscevanje.
  • Zgostite rocno, preden se to zgodi samodejno. Proaktivno izvajanje /compact s specificnimi navodili o tem, kaj ohraniti, vam daje vec nadzora.
  • Zacnite nove seje za nove naloge. Spreminjate temo? Zacnite novo sejo namesto nadaljevanja v preobremenjeni.
  • Ohranjajte seje osredotocene. Krajse, nalogovno usmerjene seje imajo manjso verjetnost doseganja mej zgoscevanja kot maratonske seje, ki pokrivajo veliko razlicnih tem.

Kontekstna okna rastejo in zgoscevanje postaja pametnejse

Upravljanje konteksta je trenutno eno najaktivnejsih podrocij razvoja v umetni inteligenci. V le stirih letih so kontekstna okna zrasla s 4.000 zetonov na vec kot 2.000.000. Ta rast se ne upocasnjuje.

Hkrati ponudniki modelov gradijo pametnejse sisteme zgoscevanja z moznostmi ohranjanja specificnih navodil. OpenClaw dodaja funkcije, kot sta izpiranje pomnilnika in zagonske datoteke, ki samodejno znova vnesejo kriticen kontekst po zgoscevanju. In povzemanje samo se izboljsuje z vsako novo generacijo modelov.

Trenutne omejitve so resnicne, a zacasne. Ce danes naletite na tezavo z zgoscevanjem, je vredno razumeti, kaj se je zgodilo, da lahko to obidete. Toda smer jasno kaze proti pomocnikom z umetno inteligenco, ki dolge seje obvladujejo bistveno bolj elegantno.

Izvedite vec