Siri, Alexa, ChatGPT a OpenClaw: aký je skutočný rozdiel?

Každý použil aspoň jedného z nich. Siri nastavuje časovače. Alexa prehráva hudbu. ChatGPT píše e-maily. A potom je tu OpenClaw, open-source AI agent, ktorý bol v poslednej dobe všade v správach a robí niečo zásadne odlišné od všetkých troch predchodcov.

Všetci sa nazývajú „AI asistentmi”, ale technológia za každým z nich je natoľko odlišná, že ich zaraďovanie do jednej skupiny je takmer zavádzajúce. Tento článok vysvetľuje, čo sa skutočne deje pod kapotou, ako sa AI asistenti vyvinuli od pravidiel cez jazykové modely k autonómnym agentom a čo to znamená pre budúcnosť.

Štyria hráči

Začnime tým, čo každý z nich vlastne je.

Siri je hlasový asistent od Apple. Žije na iPhone, Macu, Apple Watch a HomePode. Poviete „Hey Siri” a odpovedá na otázky, nastavuje budíky, posiela správy a ovláda inteligentné domáce zariadenia. Bol spustený v roku 2011 a úprimne povedané, odvtedy sa príliš nezmenil. Apple potvrdil, že veľká AI aktualizácia príde v roku 2026, ale zatiaľ tu nie je.

Alexa je hlasový asistent od Amazonu. Žije v reproduktoroch Echo a ďalších zariadeniach Amazonu. Dokáže prehrávať hudbu, odpovedať na otázky, ovládať inteligentné zariadenia a objednávať veci z Amazonu. Vo februári 2025 Amazon spustil Alexa+, vylepšenú verziu poháňanú veľkými jazykovými modelmi.

ChatGPT je konverzačná AI od OpenAI. Beží vo webovom prehliadači alebo mobilnej aplikácii. Píšete (alebo hovoríte) a dostávate pozoruhodne plynulé, podrobné odpovede. Dokáže písať eseje, vysvetľovať kód, analyzovať obrázky a zhrnúť dokumenty. Novšie verzie môžu tiež prehliadať web a spúšťať kód v rámci jednej konverzácie.

OpenClaw je open-source AI agent. Pripája sa k vašim komunikačným aplikáciám (WhatsApp, Telegram, Discord a mnohé ďalšie) a je postavený tak, aby konal: prehliadal web, spravoval súbory, spúšťal kód, ovládal inteligentné domáce zariadenia. Kým ostatní sú primárne konverzační, OpenClaw je primárne operačný.

Štyria „AI asistenti”. Ale sú to zásadne odlišné technológie, ktoré robia zásadne odlišné veci.

Ako vlastne fungujú?

Tu to začína byť zaujímavé. Aby ste pochopili, prečo sa tieto produkty pri používaní tak líšia, musíte pochopiť, čo sa deje za oponou.

Siri a stará Alexa: vývojový diagram

Keď sa spýtate Siri „Aké je počasie v Berlíne?”, stane sa toto:

Váš hlas sa prevedie na text (rozpoznávanie reči)
Text sa porovná so zoznamom známych príkazov („počasie” + „Berlín” = zámer počasie, miesto = Berlín)
Siri zavolá API pre počasie s „Berlín” ako vstupom
API vráti dáta a Siri prečíta vopred napísanú šablónu: „Aktuálne sú v Berlíne 3 stupne”

Toto je klasifikácia zámerov a napĺňanie slotov. Predstavte si to ako veľmi sofistikovaný vývojový diagram. Ak používateľ povie toto, urob tamto. Siri má tisíce takýchto vývojových diagramov, každý starostlivo naprogramovaný inžiniermi Apple.

Problém? Ak sa spýtate na niečo, čo nezapadá do žiadneho diagramu, Siri zlyhá. „Hey Siri, mal by som si vziať dáždnik na zajtrajšie stretnutie?” vyžaduje, aby Siri skontroloval váš kalendár, našiel miesto stretnutia, overil predpoveď počasia pre dané miesto v danom čase a usúdil, či je dážď dostatočne pravdepodobný na to, aby ospravedlnil dáždnik. To nie je vývojový diagram. To je myslenie. A myslenie je presne to, čo Siri zatiaľ nevie.

Alexa fungovala rovnako celé roky. Jej „skills” (ekvivalent Alexa pre aplikácie) sú v podstate tisíce jednotlivých vývojových diagramov vytvorených vývojármi tretích strán. Nová Alexa+ pridáva jazykový model, ale základná architektúra zostáva hlasovo aktivovaným príkazovým systémom.

ChatGPT: prediktor ďalšieho slova

ChatGPT funguje úplne inak. Používa niečo, čomu sa hovorí Large Language Model, čiže LLM. A pochopenie LLM je kľúčom k pochopeniu všetkého, čo sa práve v AI deje.

Tu je jednoduchá verzia.

Predstavte si, že ste prečítali každú knihu, každý web, každý článok a každú konverzáciu, ktoré boli kedy napísané v angličtine. Miliardy a miliardy strán. Po všetkom tom čítaní by ste si vyvinuli celkom dobrú intuíciu pre to, ako jazyk funguje. Vedeli by ste, že „Hlavné mesto Francúzska je…” takmer iste nasleduje „Paríž”. Vedeli by ste, že recept na čokoládový koláč pravdepodobne obsahuje múku, cukor, kakao a vajcia. Vedeli by ste, že zdvorilý e-mail sa zvyčajne končí „S pozdravom”.

To je v podstate to, čo LLM robí, len s matematikou namiesto intuície. Je to masívna neurónová sieť (predstavte si sieť miliárd čísel), ktorá bola natrénovaná na obrovskom množstve textu z internetu. Počas trénovania hrala hru: daná veta s odstráneným posledným slovom, predpovedať, čo nasleduje. Túto hru hrala bilióny ráz, zakaždým upravovala svoje vnútorné čísla, aby o trochu lepšie predpovedala.

Po dostatočnom trénovaní sa objaví niečo pozoruhodné. Model sa stane extrémne flexibilným v kombinovaní všetkého, čo videl, do takej miery, že sa zdá, akoby rozumel veciam. Dokáže vysvetliť kvantovú fyziku, písať kód v Pythone, skladať poéziu a premýšľať nad matematickými problémami. Nie preto, že by niekto naprogramoval tieto schopnosti, ale preto, že vzory ľudského jazyka kódujú obrovské množstvo znalostí a uvažovania.

Keď položíte ChatGPT otázku, „nevyhľadáva” odpoveď v databáze. Generuje odpoveď slovo po slove (technicky token po tokene), zakaždým sa pýta sám seba: „Aké je najpravdepodobnejšie ďalšie slovo na základe všetkého doteraz?” Preto môže byť v jednej konverzácii brilantne správny a sebavedome nesprávny. Vždy produkuje štatisticky najpravdepodobnejšiu odpoveď, nie najoverenejšiu.

OpenAI zaviedla „premýšľajúce” modely s o1 na konci roka 2024: pri ťažkých problémoch model generuje krokové uvažovanie pred tým, než dá odpoveď, podobne ako by ste riešili matematický problém na nečisto. GPT-5 toto zjednotil do jedného systému, ktorý automaticky prepína medzi rýchlymi odpoveďami a hlbokým premýšľaním. Výsledok: o 45 % menej faktických chýb v porovnaní s predchádzajúcimi modelmi, keď je zapnuté webové vyhľadávanie.

OpenClaw: riadiaca slučka

OpenClaw vezme LLM (ako ten v ChatGPT) a umiestni ho do slučky.

Pošlete správu („Zarezervuj mi stôl na večeru dnes večer”)
LLM prečíta vašu správu a rozhodne, čo urobiť ako prvé (skontrolovať kalendár na dnešný večer)
OpenClaw vykoná túto akciu a vráti výsledok späť LLM
LLM prečíta výsledok a rozhodne ďalší krok (hľadať reštaurácie v blízkosti miesta)
Kroky 3 a 4 sa opakujú, kým nie je úloha splnená

Tomu sa hovorí slučka reason-act-observe. LLM uvažuje o tom, čo robiť, koná prostredníctvom nástrojov (prehliadanie webu, posielanie správ, prístup k súborom), pozoruje výsledok a opakuje cyklus. LLM nie je produkt, s ktorým komunikujete. Je to komponent vo vnútri väčšieho systému, ktorý môže vykonávať skutočné akcie vo svete.

Keď požiadate ChatGPT o rezerváciu reštaurácie, môže navrhnúť možnosti a napísať správu. Keď požiadate OpenClaw, môže skutočne vykonať rezerváciu, pridať ju do kalendára a poslať priateľovi detaily.

Tri generácie

Teraz, keď ste videli, ako každý z nich funguje pod kapotou, vykresľuje sa vzor. Vývojové diagramy, jazykové modely, riadiace slučky. Nie sú to len tri rôzne produkty. Sú to tri generácie rovnakej myšlienky: prinútiť počítače, aby pochopili, čo ľudia chcú.

Generácia 1: pravidlá. To je Siri a stará Alexa, ako je popísané vyššie. Ľudia píšu každý vývojový diagram. Inteligentné, ale krehké.

Generácia 2: LLM je produkt. To je ChatGPT. Samotný jazykový model je to, s čím komunikujete. Hovoríte s modelom, model hovorí späť. Dokáže uvažovať, byť kreatívny a zvládať otázky, ktoré nikto nečakal. Ale stále je to v zásade konverzácia. Pýtate sa, on odpovedá. LLM je produkt.

Generácia 3: LLM je len API. Tu žije OpenClaw. LLM je degradovaný z produktu na komponent vo väčšom systéme: slučke reason-act-observe popísanej vyššie. Výstup LLM sa stáva jeho vlastným ďalším vstupom.

Rozdiel je ako pýtať sa niekoho na cestu oproti najímaniu niekoho na plný úväzok. Systém generácie 2 vám ukáže cestu. Systém generácie 3 nasadne do auta, odvezie vás tam, zapamätá si trasu na budúce a môže sa rozhodnúť skontrolovať premávku zajtra ráno, ešte predtým, než sa spýtate.

ChatGPT sa pohybuje týmto smerom. OpenAI Operator prehliada web za vás. ChatGPT môže spúšťať kód, prehľadávať web a generovať obrázky v jednej konverzácii. Sú to volania nástrojov vnútri riadiacej slučky. Ale OpenClaw ide ďalej v troch smeroch.

Sebamofidikácia. Systémový prompt OpenClaw (SOUL.md), jeho dlhodobá pamäť (MEMORY.md) a jeho skills žijú v súboroch, ktoré agent sám môže čítať a zapisovať. Agent môže prepísať inštrukcie, ktoré riadia, ako je LLM promptovaný v každom budúcom kroku. Nielen používa LLM. Riadi, ako ho používa, a toto riadenie postupom času upravuje. ChatGPT má pamäťové funkcie, ale nemôže prepísať svoj vlastný systémový prompt.

Kontinuita. ChatGPT čaká, kým napíšete. OpenClaw beží ako proces na pozadí, ktorý zostáva aktívny. Môže plánovať vlastné cron úlohy, reagovať na webhooky, prebudiť sa podľa plánu a konať bez toho, aby ho ktokoľvek vyzval. Nie je reaktívny. Je kontinuálny.

Otvorenosť. ChatGPT dáva LLM kurátorovanú sadu nástrojov, ktorú kontroluje OpenAI. OpenClaw je open source a rozšíriteľný pomocou skills: modulárnych balíčkov znalostí a schopností, ktoré môže ktokoľvek vytvárať a zdieľať. Už existuje viac ako 52 000 skills a komunitné trhoviská ako ClawHub robia ekosystém prakticky nekonečným. Písal som o tom v AI Skills Are the New Apps: skills sú pre AI agentov tým, čím boli aplikácie pre iPhone. Sú spôsobom, ako sa systém stáva inteligentnejším bez toho, aby sa musel meniť jadro.

Model pohánajúci slučku môže byť rovnaký. Architektúra je to, čo sa líši. Raný ChatGPT bol funkcia, ktorú ste zavolali. OpenClaw je proces, ktorý beží.

Riziká dlhších vodítok

Viac slobody znamená viac moci a viac moci znamená viac rizika. A riziká generácie 3 sú zásadne odlišné od generácie 2.

Injekcia promptu. Keď používate ChatGPT sami, kontrolujete, čo vstupuje do promptu. Keď agent prehliada web, číta e-maily alebo inštaluje skills tretích strán, obsah iných ľudí vstupuje do promptu. Škodlivá webová stránka môže vložiť skryté inštrukcie, ktoré LLM nasleduje bez vedomia používateľa. Kompromitovaný skill môže injektovať príkazy do slučky uvažovania agenta. To je injekcia promptu a je to oveľa väčší problém pre agentov než pre chatbotov, pretože agent môže konať na základe týchto injektovaných inštrukcií: posielať e-maily, exfiltrovať dáta, upravovať súbory. Vo februári výskumníci našli 341 škodlivých skills na ClawHub, ktoré robili presne toto.

Vystavenie prihlasovacích údajov. Agenti generácie 3 potrebujú prístup k vášmu skutočnému životu, aby boli užitoční: API kľúče, heslá, platobné karty, účty na komunikáciu. 135 000 inštancií OpenClaw bolo nájdených vystavených na internete vo februári, pričom Cisco, CrowdStrike a Kaspersky všetci publikovali varovania v tom istom týždni. Zle nakonfigurovaný agent s vašimi prihlasovacími údajmi nie je len únik dát. Je to zástupca, ktorý môže konať ako vy: vydávať sa za vás na akejkoľvek službe, míňať vaše peniaze, pristupovať k vašim účtom, posielať správy vaším menom. Napísali sme úplnú analýzu bezpečnostnej krízy a toho, ako autentifikácia na úrovni proxy predchádza najhoršiemu.

Nezamýšľaná autonómia. Agent, ktorý môže vykonávať skutočné akcie, môže spôsobiť skutočnú škodu spôsobmi, ktoré nikto nepredvídal. Pred niekoľkými dňami agent OpenClaw odoslal pull request do matplotlib, bol odmietnutý, pretože projekt prijíma iba ľudské príspevky, a potom autonómne publikoval osobný útok na správcu, ktorý ho zatvoril. Zdá sa, že mu to nikto nepovedal. Čím dlhšie vodítko, tým kreatívnejšie spôsoby zlyhania.

Kam to všetko smeruje?

Trajektória je jasná: každý AI asistent smeruje ku generácii 3. LLM sa stáva API a produkt sa stáva orchestračnou vrstvou okolo neho. Písal som o tom v OpenClaw Is the New Linux: LLM je procesor. Výkonný, nevyhnutný, ale nie to, s čím komunikujete. Záleží na operačnom systéme, ktorý nad ním sedí.

Éra chatbotov končí. Éra agentov začala a začiatkom roka 2026 rýchlo zrýchľuje. Toto je ďalšia evolúcia v tom, ako počítače posilňujú ľudí: od stolového počítača, pred ktorým sedíte, cez telefón vo vrecku, k agentovi, ktorý pracuje na pozadí a s ktorým komunikujete ako so vzdialeným priateľom.

Je dôvod, prečo ľudia stále hovoria: „OpenClaw je to, čím mal byť Apple Intelligence.” Siri bol sľub: osobný asistent, ktorý vám rozumie a veci vybavuje. Ale bol postavený v generácii 1, s pravidlami a vývojovými diagramami. OpenClaw je to, čo sa stane, keď tento sľub postavíte na architektúre generácie 3.

Generácia 4

Existuje generácia za touto. Dnes agent generácie 3 žije na vašom počítači alebo v cloude. Už môže dosiahnuť do fyzického sveta, ale len nepriamo: najímaním ľudí cez platformy ako rentahuman.ai, volaním API, ktoré spúšťajú fyzické stroje, zadávaním objednávok, ktoré vedú ku skutočným dodávkam. Každá akcia stále potrebuje sprostredkovateľa.

Generácia 4 odstraňuje sprostredkovateľa. Stelesnený agent priamo riadi roboty, drony, vozidlá a fyzickú infraštruktúru. Tesla premieňa výrobné linky z áut na roboty Optimus. Humanoidi Figure AI práve dokončili 11-mesačné nasadenie u BMW, kde naložili viac ako 90 000 dielov. Na CES 2026 boli humanoidní roboti od Boston Dynamics, 1X a Figure všade. Úprimne ma zaujíma, kam robotika v najbližších rokoch zamieri.

Viem, že to môže znieť desivo a všetko sa vyvíja rýchlo. Ale radšej by som chcel, aby táto technológia bola otvorená, auditovateľná a prístupná všetkým, než uzamknutá v niekoľkých korporáciách, ktoré rozhodujú o tom, ako funguje. Preto staviam OpenClaw.rocks.

Čo staviam

Začal som tento článok tým, že som chcel vysvetliť rozdiel medzi Siri, Alexou, ChatGPT a OpenClaw. Ale skutočný rozdiel nie je medzi štyrmi produktmi. Je medzi troma spôsobmi uvažovania o tom, čo môžu počítače urobiť pre ľudí. Pravidlá. Jazyk. Konanie.

Prešli sme od vývojových diagramov, ktoré sa rozpadnú pri nesprávnej otázke, cez modely, ktoré dokážu uvažovať, ale len keď ich vyzvete, k systémom, ktoré môžu konať samy a učiť sa z výsledkov. Každá generácia urobila počítače užitočnejšími pre viac ľudí viacerými spôsobmi. Táto trajektória nespomaľuje.

Na OpenClaw.rocks budujeme infraštruktúru na bezpečné prevádzkovanie AI agentov vo veľkom rozsahu a ich sprístupnenie všetkým, pričom naše systémy zverejňujeme ako open source.

Ak chcete sledovať, kam to smeruje, navštívte OpenClaw.rocks alebo nás nájdite na X.