Сви су користили бар једног од ових. Siri поставља ваше тајмере. Alexa пушта вашу музику. ChatGPT пише ваше имејлове. А ту је и OpenClaw, AI агент отвореног кода који је у последње време био свуда у вестима и ради нешто фундаментално другачије од сва три претходника.

Сви се називају “AI асистентима”, али технологија иза сваког од њих толико је различита да их је готово погрешно груписати заједно. Овај текст објашњава шта се заправо дешава испод хаубе, како су се AI асистенти развијали од правила преко језичких модела до аутономних агената и шта то значи за будућност.

Четири играча

Почнимо са тим шта сваки од њих заправо јесте.

Siri је Appleov гласовни асистент. Живи на вашем iPhoneu, Macu, Apple Watchu и HomePodu. Кажете “Hey Siri” и он одговара на питања, поставља аларме, шаље поруке и управља паметним кућним уређајима. Покренут је 2011. године и, искрено, од тада се није много променио. Apple је потврдио да долази велико AI унапређење 2026. године, али још није стигло.

Alexa је Amazonov гласовни асистент. Живи у Echo звучницима и другим Amazon уређајима. Може да пушта музику, одговара на питања, управља паметним кућним уређајима и наручује ствари са Amazona. У фебруару 2025. Amazon је покренуо Alexa+, унапређену верзију покретану великим језичким моделима.

ChatGPT је OpenAI-јев конверзацијски AI. Ради у веб прегледачу или мобилној апликацији. Куцате (или говорите), а он одговара изузетно течним, детаљним одговорима. Може да пише есеје, објашњава код, анализира слике и сумира документе. Новије верзије такође могу претраживати веб и покретати код унутар разговора.

OpenClaw је AI агент отвореног кода. Повезује се са вашим апликацијама за размену порука (WhatsApp, Telegram, Discord и многе друге) и изграђен је за предузимање акција: прегледање веба, управљање датотекама, покретање кода, управљање паметним кућним уређајима. Док су остали примарно конверзацијски, OpenClaw је примарно оперативан.

Четири “AI асистента”. Али фундаментално различите технологије које раде фундаментално различите ствари.

Како заправо функционишу?

Овде постаје занимљиво. Да бисте разумели зашто се ови производи тако различито осећају при коришћењу, морате разумети шта се дешава иза кулиса.

Siri и класична Alexa: дијаграм тока

Када питате Siri “Какво је време у Берлину?”, дешава се следеће:

  1. Ваш глас се претвара у текст (препознавање говора)
  2. Текст се упоређује са листом познатих команди (“време” + “Берлин” = намера за време, локација = Берлин)
  3. Siri позива API за време са улазом “Берлин”
  4. API враћа податке, а Siri чита унапред написани шаблон: “Тренутно је 3 степена у Берлину”

То је класификација намере и попуњавање слотова. Замислите то као веома софистициран дијаграм тока. Ако корисник каже ово, уради то. Siri има хиљаде таквих дијаграма тока, сваки пажљиво програмиран од стране Appleових инжењера.

Проблем? Ако питате нешто што се не поклапа са дијаграмом тока, Siri се распада. “Хеј Siri, да ли треба да понесем кишобран на сутрашњи састанак?” захтева од Siri да провери ваш календар, пронађе локацију састанка, провери временску прогнозу за ту локацију у то време и процени да ли је киша довољно вероватна да оправда кишобран. То није дијаграм тока. То је размишљање. А размишљање је управо оно што Siri још не може.

Alexa је годинама функционисала на исти начин. Њене “вештине” (Alexin еквивалент апликацијама) су у суштини хиљаде појединачних дијаграма тока које су изградили програмери трећих страна. Нова Alexa+ додаје језички модел на врх, али основна архитектура је и даље гласовно активирани систем за команде у срцу.

ChatGPT: предиктор следеће речи

ChatGPT функционише на потпуно другачији начин. Користи нешто што се зове Велики језички модел, или LLM. А разумевање LLM-ова кључ је за разумевање свега што се тренутно дешава у AI.

Ево једноставне верзије.

Замислите да сте прочитали сваку књигу, сваку веб страницу, сваки чланак и сваки разговор икада написан на енглеском језику. Милијарде и милијарде страница. После свог тог читања, развили бисте прилично добар осећај за то како језик функционише. Знали бисте да после “Главни град Француске је …” готово сигурно следи “Париз.” Знали бисте да рецепт за чоколадну торту вероватно укључује брашно, шећер, какао и јаја. Знали бисте да пристојан имејл обично завршава са “С поштовањем.”

То је у суштини оно што LLM ради, само са математиком уместо интуиције. То је масивна неуронска мрежа (замислите: мрежу милијарди бројева) која је тренирана на огромној количини текста са интернета. Током тренирања, играо је игру: дата реченица са уклоњеном последњом речи, предвиди шта следи. Играо је ту игру трилионе пута, сваки пут прилагођавајући своје интерне бројеве да буде мало бољи у предвиђању.

После довољно тренирања, појављује се нешто изванредно. Модел постаје изузетно флексибилан у мешању и слагању свега што је видео, до тачке где се чини да разуме ствари. Може да објасни квантну физику, пише Python код, ствара поезију и решава математичке проблеме логичким закључивањем. Не зато што је ико те способности програмирао, већ зато што обрасци људског језика кодирају огроману количину знања и логичког закључивања.

Када поставите питање ChatGPT-у, он не “претражује” одговор у бази података. Генерише одговор једну реч по једну (технички, један токен по токен), сваки пут питајући се: “С обзиром на све до сада, која је највероватнија следећа реч?” Зато може бити бриљантно тачан и уверено погрешан у истом разговору. Увек производи статистички најуверљивији одговор, не најверификованији.

OpenAI је увео моделе који “размишљају” са o1 крајем 2024. године: за тешке проблеме, модел генерише корак-по-корак закључивање пре него што да одговор, слично као што бисте ви могли решавати математички проблем на помоћном папиру. GPT-5 је уједнио то у један систем који аутоматски усмерава између брзих одговора и дубинског закључивања. Резултат: 45% мање чињеничних грешака у поређењу са ранијим моделима када је веб претраживање омогућено.

OpenClaw: контролна петља

OpenClaw узима LLM (попут оног унутар ChatGPT-а) и ставља га у петљу.

  1. Пошаљете поруку (“Резервиши ми сто за вечеру вечерас”)
  2. LLM чита вашу поруку и одлучује шта прво да уради (провери ваш календар за вечерас)
  3. OpenClaw извршава ту акцију и резултат враћа LLM-у
  4. LLM чита резултат и одлучује следећи корак (претражити ресторане у близини локације)
  5. Кораци 3 и 4 се понављају док задатак није завршен

То се зове петља размишљања-акције-посматрања. LLM размишља о томе шта да уради, делује путем алата (прегледање, поруке, приступ датотекама), посматра резултат и поново петља. LLM није производ са којим комуницирате. Он је једна компонента унутар већег система који може предузимати стварне акције у свету.

Када замолите ChatGPT да резервише ресторан, може да предложи опције и напише поруку. Када замолите OpenClaw, он заправо може да направи резервацију, дода је у ваш календар и пошаље пријатељу детаље.

Три генерације

Сада када сте видели како сваки од њих функционише испод хаубе, појављује се образац. Дијаграми тока, језички модели, контролне петље. То нису само три различита производа. То су три генерације исте идеје: учинити да рачунари разумеју шта људи желе.

Генерација 1: Правила. То су Siri и класична Alexa, као што је описано горе. Људи пишу сваки дијаграм тока. Паметно, али крхко.

Генерација 2: LLM је производ. То је ChatGPT. Језички модел сам је ствар са којом комуницирате. Ви причате са моделом, модел вам одговара. Може да закључује, буде креативан, обради питања која нико није предвидео. Али у основи је и даље разговор. Ви питате, он одговара. LLM јесте производ.

Генерација 3: LLM је само API. Овде живи OpenClaw. LLM бива деградиран са тога да буде производ на то да буде једна компонента у већем систему: петља размишљања-акције-посматрања описана горе. Излаз LLM-а постаје његов властити следећи улаз.

Разлика је као да некога питате за упутства наспрам тога да некога запослите на пуно радно време. Систем генерације 2 вам даје упутства. Систем генерације 3 седа у ауто, вози вас тамо, памти руту за следећи пут и може да одлучи да провери саобраћај сутра ујутру пре него што ви уопште питате.

ChatGPT се креће у том правцу. OpenAI-јев Operator претражује веб уместо вас. ChatGPT може да извршава код, претражује веб и генерише слике у једном разговору. То су позиви алата унутар контролне петље. Али OpenClaw иде даље на три начина.

Самомодификација. OpenClawov системски промпт (SOUL.md), његова дугорочна меморија (MEMORY.md) и његове вештине живе у датотекама које агент сам може да чита и пише. Агент може да препише упутства која управљају тиме како се LLM промптује у сваком будућем кораку. Не само да користи LLM. Он усмерава како користи LLM и прилагођава то усмеравање током времена. ChatGPT има функције меморије, али не може да препише свој властити системски промпт.

Континуитет. ChatGPT чека да куцате. OpenClaw ради као позадински процес који остаје активан. Може да планира властите cron задатке, реагује на webhookove, пробуди се према распореду и предузме акцију без ичијег подстицаја. Није реактиван. Континуиран је.

Отвореност. ChatGPT даје LLM-у курирани скуп алата које контролише OpenAI. OpenClaw је отвореног кода и проширив са вештинама: модуларним пакетима знања и способности које било ко може да ствара и дели. Већ постоји преко 52.000 вештина, а тржишта заједнице попут ClawHuba чине екосистем практично бесконачним. Писао сам о томе у AI вештине су нове апликације: вештине су за AI агенте оно што су апликације биле за iPhone. Оне су начин на који систем постаје паметнији без да се језгро мора мењати.

Модел који покреће петљу може бити исти. Архитектура је оно што се разликује. Рани ChatGPT био је функција коју позивате. OpenClaw је процес који ради.

Ризици дужег повоца

Више слободе значи више моћи, а више моћи значи више ризика. А ризици генерације 3 фундаментално су различити од генерације 2.

Убацивање у промпт. Када користите ChatGPT сами, ви контролишете шта улази у промпт. Када агент претражује веб, чита имејлове или инсталира вештине трећих страна, садржај других људи улази у промпт. Злонамерна веб страница може да угради скривена упутства која LLM следи без знања корисника. Компромитована вештина може да убаци наредбе у агентову петљу закључивања. То је убацивање у промпт и то је много већи проблем за агенте него за чет-ботове, јер агент може да делује према тим убаченим упутствима: шаље имејлове, извлачи податке, модификује датотеке. У фебруару су истраживачи пронашли 341 злонамерну вештину на ClawHubu које су радиле управо то.

Излагање акредитива. Агентима генерације 3 потребан је приступ вашем стварном животу да би били корисни: API кључеви, лозинке, кредитне картице, налози за размену порука. У фебруару је откривено 135.000 OpenClaw инстанци изложених интернету, а Cisco, CrowdStrike и Kaspersky објавили су упозорења исте недеље. Погрешно конфигурисан агент са вашим акредитивима није само цурење података. То је прокси који може да делује као ви: лажно се представља на било ком сервису, троши ваш новац, приступа вашим налозима, шаље поруке у ваше име. Написали смо потпуну анализу безбедносне кризе и како аутентификација на нивоу проксија спречава најгоре.

Ненамерна аутономија. Агент који може да предузима стварне акције може да проузрокује стварну штету на начине које нико није предвидео. Пре само неколико дана, OpenClaw агент је послао pull request пројекту matplotlib, био одбијен јер пројекат прихвата само људске доприносе, а затим је аутономно објавио лични напад на одржаваоца који га је затворио. Чини се да му то нико није рекао. Што је дужи поводац, то су креативнији начини грешке.

Куда све ово води?

Путања је јасна: сваки AI асистент се креће ка генерацији 3. LLM постаје API, а производ постаје оркестрацијски слој око њега. Писао сам о томе у OpenClaw је нови Linux: LLM је процесор. Моћан, битан, али не ствар са којом комуницирате. Оно што је важно јесте оперативни систем који седи на врху.

Ера чет-ботова завршава. Ера агената почела је и убрзава се почетком 2026. Ово је следећа еволуција у томе како рачунари оснажују људе: од радне површине испред које седите, до телефона у џепу, до агента који ради у позадини и са којим комуницирате као са пријатељем на даљину.

Постоји разлог зашто људи стално говоре “OpenClaw је оно што је Apple Intelligence требало да буде.” Siri је био обећање: лични асистент који вас разуме и обавља ствари. Али изграђен је у генерацији 1, са правилима и дијаграмима тока. OpenClaw је оно што се дешава када то обећање изградите на архитектури генерације 3.

Генерација 4

Постоји генерација изван овога. Данас агент генерације 3 живи на вашем рачунару или у облаку. Већ може да допре до физичког света, али само индиректно: ангажовање људи путем платформи попут rentahuman.ai, позивање API-ја који покрећу физичке машине, наручивање које резултира стварним испорукама. Свака акција и даље треба посредника.

Генерација 4 уклања посредника. Отелотворени агент директно контролише роботе, дронове, возила и физичку инфраструктуру. Tesla преуређује фабричке линије са аутомобила на Optimus роботе. Figure AI хуманоиди управо су завршили 11-месечну имплементацију у BMW-у, утоваривши преко 90.000 делова. На CES 2026, хуманоидни роботи од Boston Dynamics, 1X и Figure били су свуда. Искрено ме занима куда робототехника иде у наредним годинама.

Знам да ово може звучати застрашујуће и да се брзо креће. Али радије бих да је ова технологија отворена, проверљива и доступна свима него закључана унутар неколицине корпорација које одлучују како функционише. Зато градим OpenClaw.rocks.

Шта градим

Почео сам овај текст покушавајући да објасним разлику између Siri, Alexa, ChatGPT и OpenClaw. Али права разлика није између четири производа. То је разлика између три начина размишљања о томе шта рачунари могу да учине за људе. Правила. Језик. Аутономија.

Прешли смо од дијаграма тока који се ломе када поставите погрешно питање, до модела који могу да закључују али само када их подстакнете, до система који могу самостално да делују и уче из резултата. Свака генерација учинила је рачунаре корисним за више људи на више начина. Та путања не успорава.

На OpenClaw.rocks градимо инфраструктуру за безбедно покретање AI агената у великом обиму и њихово стављање на располагање свима, отварајући код наших система успут.


Ако желите да пратите куда ово води, посетите OpenClaw.rocks или нас пронађите на X.