Tri godine AI agenti su bili predmet šale. Demostracije su izgledale impresivno. Rezultati u produkciji bili su sramotni. Tvrtke su potrošile milijune na agente koji nisu mogli pouzdano dovršiti desetominutni zadatak bez haluciniranja, gubitka konteksta ili tihog pada.

Onda se nešto promijenilo. Ne postupno. Naglo.

U prosincu 2025., više nezavisnih promatrača izvijestilo je o istom: AI agenti, konkretno agenti za kodiranje, prešli su prag pouzdanosti. Mogli su držati složene zadatke u memoriji. Oporavljati se od pogrešaka. Iterirati nad neuspjesima. Raditi autonomno dulje vrijeme bez raspada. Riječ koja se stalno ponavljala bila je “koherentnost”.

U OpenClaw.rocks upravljamo osobnim AI agentima za tisuće korisnika. Godinama pažljivo pratimo ovaj prostor. Slijedi naša analiza: što se dogodilo, zašto je razvoj softvera bio prva domena koja se transformirala i što putanja agentne AI znači za svakog profesionalca.

Zašto su AI agenti postali pouzdani

Prosinac 2025. nije bio jedan proboj. Dvije stvari su se poklopile.

Modeli su prešli prag kvalitete. Claude Opus 4.5, GPT-5.2 i Gemini 3 Pro lansirani su unutar nekoliko tjedana. Svaki je donio skok u koherentnosti dugog konteksta: sposobnost praćenja složenog zadatka kroz tisuće tokena, razmišljanja o rubnim slučajevima i oporavka iz slijepih ulica bez gubitka niti. Raniji modeli mogli su generirati isječke koda. Ovi modeli mogli su držati cijeli projekt u glavi, udariti u zid, istražiti rješenje, vratiti se i pokušati drugačiji pristup. To je razlika između automatskog dovršavanja i agenta.

Alati su naučili koristiti računalo. Claude Code, Cursor i OpenAI Codex ne predlažu samo kod. Čitaju vaše datoteke, pokreću vaše testove, izvršavaju naredbe ljuske, tumače pogreške i izravno uređuju vašu bazu koda. Upravljaju vašim razvojnim okruženjem kao što bi to činio programer, osim što se ne umaraju i ne gube kontekst tijekom 30-minutne sesije otklanjanja grešaka.

Kombinacija pametnijih modela i alata sposobnih djelovati u stvarnom svijetu prešla je prag. 84% programera sada koristi AI alate, a 51% ih koristi svakodnevno. Tržište to odražava: Claude Code dosegao je 1 mlrd. dolara godišnjeg prihoda u roku od šest mjeseci od lansiranja i udvostručio se na 2,5 mlrd. do veljače 2026. Tržište AI za kodiranje od 4 mlrd. dolara sada ima tri igrača iznad 1 mlrd. ARR-a (GitHub Copilot, Claude Code, Cursor), koji drže preko 70% kombiniranog tržišnog udjela.

Benchmarkovi AI agenata: novi Mooreov zakon

Pomak nije samo anegdotalan. Istraživači iz METR-a izgradili su vodeći benchmark za AI agente, testirajući agente na otprilike 230 stvarnih zadataka od 2019. Njihov nalaz: duljina zadataka koje agenti mogu pouzdano dovršiti udvostručuje se svakih sedam mjeseci. U najnovijim podacima od 2024. do 2025. taj se tempo ubrzao na udvostručavanje svakih četiri mjeseca.

Korelacija između duljine zadatka i stope uspješnosti agenata izuzetno je čista (R² = 0,83), a trend ne pokazuje znakove usporavanja:

Chart showing AI agent task duration growing exponentially from 30-second tasks in 2022 to 14.5 hours with Claude Opus 4.6 in February 2026, with projections reaching 1 work week by 2028 and 1 work month by 2029

Od 30-sekundnih zadataka 2022. do 14,5 sati s Claude Opus 4.6 u veljači 2026. Izvorna METR trendovska linija predviđala je da će agenti obrađivati 8-satni radni dan do 2027. Taj je miljokaz dosegnut godinu dana ranije.

Produkcijski podaci Anthropica pokazuju isto ubrzanje iz drugog kuta. Među najduljim sesijama Claude Codea, trajanje 99,9. percentila gotovo se udvostručilo između listopada 2025. i siječnja 2026.: s manje od 25 minuta na više od 45 minuta neprekinutog autonomnog rada. Rast je gladak kroz verzije modela, bez naglih skokova.

Ako se trenutni tempo udvostručavanja zadrži, METR predviđa da će agenti obrađivati 40-satni radni tjedan do 2028. i radni mjesec do 2029. To nisu prazna predviđanja. Stoje na trendovskoj liniji sa šest godina podataka, a posljednja točka podataka već je premašila projekciju.

Zašto su AI agenti za kodiranje prvi proradili

Postoji razlog zašto agenti za kodiranje rade prije ostalih. Softver ima strukturalna svojstva koja ga čine jedinstveno prikladnim za autonomne AI sustave.

Rezultati su provjerljivi. Kod se kompajlira ili ne. Testovi prolaze ili padaju. Tipovi se provjeravaju ili bacaju greške. To agentima daje usku povratnu petlju za samokorekciju. Nijedna druga profesionalna domena nema tako jasnu, automatiziranu validaciju kvalitete rezultata.

Specifikacije se izravno preslikavaju u promptove. Razvoj softvera je već imao praksu pisanja zahtjeva, kriterija prihvaćanja i testnih slučajeva. Oni se izravno pretvaraju u upute za agenta. Specifikacija je u osnovi strukturirani prompt.

Infrastruktura za validaciju već postoji. Git, CI/CD cjevovodi, linteri, provjere tipova, okviri za testiranje: agenti se izravno priključuju na desetljeća alata. Nova infrastruktura nije potrebna.

Sve ostaje digitalno. Kod je tekst. Agenti ne moraju komunicirati s fizičkim svijetom. Cijeli lanac ulaza/izlaza je digitalan, deterministički i revizijski.

Ova svojstva stvaraju pozitivan ciklus: agenti pokušavaju rad, dobivaju trenutačnu povratnu informaciju, korigiraju smjer i poboljšavaju se. Zato su agenti za kodiranje prvi prešli prag pouzdanosti. Dario Amodei, izvršni direktor Anthropica, otišao je toliko daleko da je u Davosu predvidio u siječnju 2026. da će AI preuzeti većinu zadataka softverskog inženjerstva unutar šest do dvanaest mjeseci.

Ali važna spoznaja nije o kodiranju. Radi se o obrascu. Svaka domena koja izgradi provjerljive rezultate, jasne specifikacije i automatizirane povratne petlje slijedit će istu putanju.

AI agenti za poslovanje: izvan kodiranja

Dizajn, infrastruktura, financije i marketing grade te povratne petlje upravo sada.

Dizajn. Figma je sklopila partnerstvo s Anthropicom u veljači 2026. kako bi povezala AI alate za kodiranje sa svojom dizajnerskom platformom. Izgradite funkcionalno sučelje zadavanjem prompta agentu, zatim ga uvezite izravno u Figmu za doradu. Povratna petlja između dizajnerske namjere i funkcionalnog koda skraćuje se na minute.

Infrastruktura. Samoiscjeljujući Kubernetes klasteri prelaze iz istraživanja u produkciju. AI agenti kontinuirano skeniraju radna opterećenja, otkrivaju kvarove poput CrashLoopBackOff ili OOMKilled, prikupljaju logove, dijagnosticiraju uzroke i autonomno primjenjuju popravke. Uče: prvi put kad agent naiđe na OOMKilled pod, možda pokuša konzervativno povećanje memorije i ne uspije. Drugi put ide ravno na ispravnu alokaciju. Povratna petlja je automatizirani monitoring. Verifikacija je zdravlje sustava.

Financije. Goldman Sachs koristi Claude agente za računovodstvo trgovanja i uvođenje klijenata u produkciji. Ne pilot. Stvarne transakcije. Povratna petlja je regulatorna usklađenost i usklađivanje. CIO Goldmana opisuje pomak kao prelazak s “raspoređivanja ljudi na zadatke” na “raspoređivanje ljudski orkestriranih flota specijaliziranih timova više agenata.”

Marketing. AI SEO agenti sada prate rangiranje, identificiraju prilike za optimizaciju i provode promjene. Povratna petlja su podaci iz konzole za pretraživanje. Jedan dokumentirani radni tok postigao je povećanje klikova od 28% unutar sedam dana povezivanjem agenta s Google Search Consoleom i dopuštanjem automatske optimizacije.

Obrazac je dosljedan. U trenutku kad domena stvori usku povratnu petlju između radnje agenta i mjerljivog rezultata, agenti počinju isporučivati stvarnu vrijednost. I svaka velika industrija sada gradi te petlje.

Od vibe codinga do agentic engineeringa

Industrija je usred promjene rječnika koja otkriva dublji strukturalni pomak.

U veljači 2025. Andrej Karpathy skovao je pojam “vibe coding”: razigrano, eksperimentalno korištenje AI za generiranje koda bez temeljitog pregleda. Točno godinu dana kasnije zamijenio ga je pojmom “agentic engineering”: disciplinirana, ljudski nadzirana orkestracija agenata gdje vi definirate rezultate, a agenti se brinu o izvršenju.

Razlika je važna jer odražava što se događa u svakoj domeni kako agenti sazrijevaju. Prva faza je novost: ljudi eksperimentiraju, dive se demonstracijama i proizvode nepregledani rezultat. Druga faza je profesionalizacija: ljudi razvijaju radne tokove, uspostavljaju kontrole kvalitete i tretiraju rezultat agenta kao što bi tretirali rad mlađeg zaposlenika. Pregledajte ga. Testirajte ga. Preuzmite odgovornost.

Realistični dobitak produktivnosti danas je otprilike 1,5x, a ne 10x koji obećavaju ciklusi pretjeranog uzbuđenja. Ali 1,5x održano kroz cijelu profesiju je ogromno. I taj dobitak nesrazmjerno ide ljudima s ekspertizom u domeni. Agentima treba dobar kontekst za dobar rezultat, a određivanje pravog konteksta zahtijeva duboko razumijevanje problema. Zato ekspertiza postaje vrednija u svijetu koji pokreću agenti, ne manje. Osoba koja zna što treba izgraditi i može ocijeniti rezultat uvijek će nadmašiti onu koja samo zna kako napisati prompt.

Osobni AI agent je sljedeći

Goldman Sachs predviđa da je 2026. godina osobnih AI agenata. Njihov primjer: kad vam se otkaže let, vaš agent automatski prebukira, prerasporedi vaše sastanke i brine se o svim naknadnim detaljima. Bez da vi bilo što radite.

Gartner procjenjuje da će 40% poslovnih aplikacija uključivati AI agente specifične za zadatke do kraja 2026., u usporedbi s manje od 5% u 2025. Tržište AI agenata trebalo bi narasti s 12-15 mlrd. dolara u 2025. na 80-100 mlrd. do 2030.

Signali nisu samo u izvješćima analitičara. OpenAI je zaposlio Petera Steinbergera, kreatora OpenClaw-a, u veljači 2026. za izgradnju “sljedeće generacije osobnih agenata.” Steinberger je mjesecima isporučivao tempom cijelog tima, sam, usredotočivši cijeli svoj radni tok na AI agente. To je obrazac koji će se proširiti izvan programera: jedna osoba, pojačana agentima, postižući ono za što je prije bio potreban tim.

Strojarski inženjer nedavno je opisao kako je po prvi put izgradio funkcionalni softver koristeći agente za kodiranje. Roditelj je demonstrirao kako je jedan prompt stvorio funkcionalnu igru u pregledniku u školi njegovog 10-godišnjeg djeteta. To su rani signali onoga što se događa kad sposobnosti agenata dosegnu netehničke korisnike.

Putanja iz METR podataka je jasna. Današnji agenti obrađuju zadatke mjerene u satima. Do 2028. obrađivat će zadatke mjerene u tjednima. To nije dovoljno vremena za čekanje. To je dovoljno vremena da počnete graditi kompetencije.

Što to znači u praksi

Za profesionalce koji prate ovaj pomak, tri su stvari važne:

Poluga je stvarna, ali zahtijeva ekspertizu. Agenti pojačavaju ono što već znate. Marketinški direktor koji razumije psihologiju potrošača dobit će više od agenta nego netko tko ga samo zamoli da “napiše par oglasa.” Duboka domenaska ekspertiza postaje usko grlo i prednost.

Agenti prelaze s reaktivnih na stalne. Današnji AI alati uglavnom su reaktivni: otvorite aplikaciju, upišete prompt, dobijete odgovor, zatvorite aplikaciju. Sljedeći val radi u pozadini. Prati. Planira. Djeluje u vaše ime kroz vaše komunikacijske kanale i radne sustave. Razlika između AI agenta i chatbota je razlika između alata i suigrača.

Ne biste trebali nadgledati svog agenta. Trenutačna generacija AI alata zahtijeva da otvorite aplikaciju, pokrenete sesiju i sami upravljate interakcijom. Pravi osobni agent radi u pozadini, uvijek dostupan, uvijek ažuran i uvijek siguran. To znači da se netko mora brinuti o infrastrukturi, ažuriranjima, dostupnosti i sigurnosti kako biste se vi mogli usredotočiti na korištenje.

Upravo to radi OpenClaw.rocks. Dajemo vam osobnog AI agenta koji radi 24/7 na vašim omiljenim platformama za poruke: Telegram, WhatsApp, Discord, Signal. Mi se brinemo o infrastrukturi, sigurnosti i ažuriranjima. Vi jednostavno razgovarate sa svojim agentom. Izgrađen je na OpenClaw-u, open-source okviru za agente, tako da nema zaključavanja na dobavljača i vaši podaci ostaju vaši.

Pomak od trika do revolucije već se dogodio u softveru. Upravo se događa u dizajnu, financijama i infrastrukturi. Osobna produktivnost je sljedeća.

Najbolje vrijeme za početak bio je prosinac. Drugo najbolje je danas.

Nabavite svog.