Siri, Alexa, ChatGPT ja OpenClaw: mis on tegelikult erinev?

Koik on kasutanud vahemalt uhte neist. Siri seadistab teie taimereid. Alexa mangib teie muusikat. ChatGPT kirjutab teie e-kirju. Ja siis on veel OpenClaw, avatud lahtekoodiga AI agent, mis on viimasel ajal olnud koikjal uudistes ja teeb midagi pohimoiselt erinevat koigist kolmest eelnevast.

Koiki nimetatakse “AI assistentideks”, kuid tehnoloogia igauhe taga on nii erinev, et nende ruhma paigutamine on peaaegu eksitav. See postitus selgitab, mis tegelikult toimub kapoti all, kuidas AI assistendid arenesid reeglitest keelemudelite kaudu autonoomsete agentideni ja mida see tuleviku jaoks tahendab.

Neli mangijat

Alustame sellest, mis igauks neist tegelikult on.

Siri on Apple’i haalaassistent. Ta elab teie iPhone’is, Macis, Apple Watchis ja HomePodis. Utlete “Hey Siri” ja ta vastab kusimustele, seadistab alarme, saadab soonumeid ja juhib nutikodu seadmeid. See kaivitati 2011. aastal ja ausalt oeldes pole sellest ajast palju muutunud. Apple on kinnitanud, et suur AI uuendus tuleb 2026. aastal, kuid see pole veel kohal.

Alexa on Amazoni haalaassistent. Ta elab Echo kolarites ja teistes Amazoni seadmetes. Ta saab mangida muusikat, vastata kusimustele, juhtida nutikodu seadmeid ja tellida asju Amazonist. 2025. aasta veebruaris kaivitas Amazon Alexa+, uuendatud versiooni, mida toidavad suured keelemudelid.

ChatGPT on OpenAI vestluspoohine AI. See toootab veebibrauseris voi mobiilirakenduses. Te tipite (voi raagite) ja see vastab markimisvaarselt sujuvate, uksikasjalike vastustega. See suudab kirjutada esseesid, selgitada koodi, analuusida pilte ja teha dokumentidest kokkuvotteid. Uuemad versioonid saavad ka veebis sirvida ja koodi kaivitada vestluse raames.

OpenClaw on avatud lahtekoodiga AI agent. See uhendub teie soonumirakendusega (WhatsApp, Telegram, Discord ja paljud teised) ning on loodud tegevuste sooritamiseks: veebis sirvimine, failide haldamine, koodi kaivitamine, nutikodu seadmete juhtimine. Kui teised on peamiselt vestluslikud, on OpenClaw peamiselt operatiivne.

Neli “AI assistenti”. Kuid pohimoiselt erinevad tehnoloogiad, mis teevad pohimoiselt erinevaid asju.

Kuidas need tegelikult toootavad?

Siin laaheb huvitavaks. Et moista, miks need tooted kasutamisel nii erinevalt tunduvad, peate moistma, mis toimub kulisside taga.

Siri ja vana kooli Alexa: vooskeem

Kui kusite Sirilt “Milline on ilm Berliinis?”, toimub jargnev:

Teie haal teisendatakse tekstiks (konetuvasatus)
Teksti vorreldakse tuntud kaaskude nimekirjaga (“ilm” + “Berliin” = ilma kavatsus, asukoht = Berliin)
Siri kutsub ilma API-t sisendiga “Berliin”
API tagastab andmed ja Siri loeb ette eelkirjutatud malli: “Praegu on Berliinis 3 kraadi”

See on kavatsuse klassifitseerimine ja pesade taitmine. Motelge sellest kui vaaga keerukast vooskeemist. Kui kasutaja utleb seda, tee toda. Siril on tuhandeid selliseid vooskeeme, igauks hoolikalt programmeeritud Apple’i inseneride poolt.

Probleem? Kui kusite midagi, mis ei sobitu uhegi vooskeemiga, laguneb Siri laiali. “Hei Siri, kas ma peaksin homme kohtumisele vihmavarju kaasa voitma?” noouab Sirilt teie kalendri kontrollimist, kohtumise asukoha leidmist, selle asukoha ilmaennustuse kontrollimist sellel ajal ja hindamist, kas vihm on piisavalt toenoaoline, et vihmavarju oigustada. See pole vooskeem. See on mootlemine. Ja mootlemine on tapselt see, mida Siri veel ei suuda.

Alexa toootas aastaid samal viisil. Selle “oskused” (Alexa ekvivalent rakendustele) on sisuliselt tuhanded uiksikud vooskeemid, mille on loonud kolmandate osapoolte arendajad. Uus Alexa+ lisab keelemuedeli peale, kuid poohiarhitektuur on siski endiselt haalega aktiveeritud kaaskude suusteem.

ChatGPT: jargmise sona ennustaja

ChatGPT toootab tasiesti erineval viisil. See kasutab midagi, mida nimetatakse Suureks keelemudeliks ehk LLM-iks. Ja LLM-ide moistmine on vooti koige selle moistmiseks, mis praegu AI-s toimub.

Siin on lihtne versioon.

Kujutage ette, et loete labi iga raamatu, iga veebilehe, iga artikli ja iga vestluse, mis on kunagi inglise keeles kirjutatud. Miljardeid ja miljardeid lehekuulgi. Parast koike seda lugemist arendate uusna hea tunnetuse selle kohta, kuidas keel toootab. Teaksite, et “Prantsusmaa pealinn on …” jarel tuleb peaaegu kindlasti “Pariis.” Teaksite, et sokoladikoogi retsept sisaldab tooenaoiliselt jahu, suhkrut, kakaod ja mune. Teaksite, et viisakas e-kiri loopeb tavaliselt sonadega “Lugupidamisega.”

See on sisuliselt see, mida LLM teeb, ainult matemaatikaga intuitsiooni asemel. See on tohutu naarvivork (motelge: miljardite arvude vorgustik), mis on treenitud tohutul hulgal internetist parit tekstil. Treenimise ajal mangis see mangu: antud lause, millest on viimane sona eemaldatud, ennusta, mis tuleb jargmiseks. See mangis seda mangu triljoneid kordi, iga kord kohandades oma sisemisi arve, et olla ennustamises natuke parem.

Parast piisavat treeningut tekib midagi markimisvarset. Mudel muutub aarmiselt paindlikuks koige naaahtu segamisel ja kombineerimise, sellisele tasemele, kus tundub, et see moistab asju. See suudab selgitada kvantfuusikat, kirjutada Pythoni koodi, luua luulet ja lahendada matemaatikauulesandeid loogilise arutluse kaudu. Mitte sellepoarast, et keegi need voimed sisse programmeeris, vaid sellepaerast, et inimkeele mustrid kodeerivad tohutult palju teadmisi ja loogilist arutlust.

Kui esitate ChatGPT-le kusimuse, ei “otsi” see vastust andmebaasist. See genereerib vastuse uuks sona korraga (tehniliselt uuks token korraga), iga kord kusides endalt: “Arvestades koike senist, mis on koige toenaolisem jargmine sona?” Sellepaerast voib see olla saatavalt oige ja enesekindlalt vale samas vestluses. See toodab alati statistiliselt koige usutavamat vastust, mitte koige kontrollitumat.

OpenAI tutvustas “mootlevaid” mudeleid o1-ga 2024. aasta lopus: keeruliste probleemide puhul genereerib mudel sammhaaval arutluse enne vastuse andmist, sarnaselt sellele, kuidas teie voiksite matemaatikaprobleemi mustandi peal lahendada. GPT-5 uhendas selle uhte suusteemi, mis suunab automaatselt kiiirete vastuste ja sugava arutluse vahel. Tulemus: 45% vahem faktivigu vorrelduna varasemate mudelitega, kui veebiotsing on lubatud.

OpenClaw: juhtimistsukkel

OpenClaw voitab LLM-i (nagu see ChatGPT sees) ja paneb selle tsuhklisse.

Saadate soonumi (“Broneeri mulle laud ootasooogiks tana ohtul”)
LLM loeb teie soonumi ja otsustab, mida koigepealt teha (kontrollida teie kalendrit tanaohtuks)
OpenClaw taaidab selle tegevuse ja saadab tulemuse tagasi LLM-ile
LLM loeb tulemuse ja otsustab jargmise sammu (otsida restorane asukoha laahedal)
Sammud 3 ja 4 korduvad, kuni uulesanne on taaidetud

Seda nimetatakse arutluse-tegevuse-vaatlemise tsuhkliks. LLM arutleb, mida teha, tegutseb tooriistade kaudu (sirvimine, soonumid, failidele ligipoas), vaatleb tulemust ja kordab tsuhklit. LLM ei ole toode, millega suhtlete. See on uiuks komponent suuremas suusteemis, mis suudab vootta toeelisi meetmeid maailmas.

Kui palute ChatGPT-l restorani broneerida, saab see pakkuda voimalusi ja koostada soonumi. Kui palute OpenClaw’il, saab see tegelikult broneeringu teha, lisada selle teie kalendrisse ja saata sooobrale uksikasijad.

Kolm poolvkonda

Nuuud, kui olete nainud, kuidas igauks neist kapoti all toootab, ilmneb muster. Vooskeemid, keelemudelid, juhtimistsuhklid. Need pole lihtsalt kolm erinevat toodet. Need on kolm poolvkonda samast ideest: panna arvutid moistma, mida inimesed tahavad.

Poolvkond 1: Reeglid. See on Siri ja vana kooli Alexa, nagu uelal kirjeldatud. Inimesed kirjutavad iga vooskeemi. Nutikas, kuid habras.

Poolvkond 2: LLM on toode. See on ChatGPT. Keelemudel ise on asi, millega suhtlete. Teie raagite mudeliga, mudel raagib tagasi. See suudab arutleda, olla loov, kasitleda kusimusi, mida keegi ette ei nainud. Kuid see on endiselt pohimoiselt vestlus. Teie kusite, see vastab. LLM on toode.

Poolvkond 3: LLM on lihtsalt API. Siin elab OpenClaw. LLM alaandatakse tootest uheks komponendiks suuremas suusteemis: uelal kirjeldatud arutluse-tegevuse-vaatlemise tsuhkel. LLM-i vaaljund muutub tema enda jargmiseks sisendiks.

Erinevus on nagu kelleltki tee kuusimine versus kellegi taisajaga palkamine. Poolvkonna 2 suusteem annab teile juhised. Poolvkonna 3 suusteem istub autosse, soidab teid kohale, jaatab tee meelde jargmiseks korraks ja voib otsustada homme hommikul liiklust kontrollida, enne kui teie uldse kusite.

ChatGPT liigub selles suunas. OpenAI Operator sirvib veebi teie eest. ChatGPT suudab kaivitada koodi, otsida veebist ja genereerida pilte uhes vestluses. Need on tooriistakutsed juhtimistsuhkli sees. Kuid OpenClaw laaheb kolmel viisil kaugemale.

Enesemuutmine. OpenClaw suusteemiviip (SOUL.md), selle pikaajline malu (MEMORY.md) ja selle oskused elavad failides, mida agent ise saab lugeda ja kirjutada. Agent saab umaber kirjutada juhised, mis maaeravad, kuidas LLM-i igal jargmisel kaigul suunatakse. See ei kasuta lihtsalt LLM-i. See juhib, kuidas ta LLM-i kasutab, ja kohandab seda juhtimist aja jooksul. ChatGPT-l on malufunktsioonid, kuid see ei saa oma suusteemiviipa umaber kirjutada.

Jarkekestvus. ChatGPT ootab, et tipiksite. OpenClaw toootab taustaprotsessina, mis jaab aktiivseks. See suudab planeerida oma cron-uulesandeid, reageerida webhookidele, end ajakaava jargi aratada ja meetmeid vootta ilma kellegi suunamiseta. See pole reaktiivne. See on pidev.

Avatus. ChatGPT annab LLM-ile kureeritud tooriistakomplekti, mida OpenAI kontrollib. OpenClaw on avatud lahtekoodiga ja laiendatav oskustega: modulaarsed teadmiste ja vooimekuse paketid, mida igauks saab luua ja jagada. Juba on olemas uule 52 000 oskuse ning kogukonna turuplatsid nagu ClawHub muudavad okosuusteemi praktiliselt loputuks. Kirjutasin sellest artiklis AI oskused on uued rakendused: oskused on AI agentide jaoks see, mis rakendused olid iPhone’i jaoks. Need on viis, kuidas suusteem muutub nutikamaks ilma, et tuumik peaks muutuma.

Tsuhklit jooksutav mudel voib olla sama. Arhitektuur on see, mis erineb. Varajane ChatGPT oli funktsioon, mida kutsute. OpenClaw on protsess, mis toootab.

Pikema rihma riskid

Rohkem vabadust tahendab rohkem vooimu ja rohkem vooimu tahendab rohkem riski. Ja poolvkonna 3 riskid on pohimoiselt erinevad poolvkonnast 2.

Viiba sisestamine. Kui kasutate ChatGPT-d ise, kontrolite, mis viibasse laaheb. Kui agent sirvib veebi, loeb e-kirju voi installib kolmandate osapoolte oskusi, jooub teiste inimeste sisu viibasse. Pahatahtlik veebileht voib manustada peidetud juhiseid, mida LLM jargib ilma kasutaja teadmata. Kompromiteeritud oskus voib sisestada kaske agendi arutlustsuhklisse. See on viiba sisestamine ja see on palju suurem probleem agentide kui vestlusrobotite jaoks, sest agent saab nende sisestatud juhiste jargi tegutseda: saata e-kirju, andmeid valja viia, faile muuta. Veebruaris leidsid uurijad ClawHubist 341 pahatahtlikku oskust, mis tegid tapselt seda.

Mandaatide paljastamine. Poolvkonna 3 agendid vajavad ligipaeasu teie tegelikule elule, et olla kasulikud: API voitmed, paroolid, krediitkaardid, soonumirakenduste kontod. Veebruaris leiti 135 000 internetile avatud OpenClaw instantsi, kusjuures Cisco, CrowdStrike ja Kaspersky avaldasid hoiatused samal nadalal. Valesti konfigureeritud agent teie mandaatidega pole lihtsalt andmeleke. See on puhverserver, mis saab tegutseda teie nimel: esineda teie pahe igal teenusel, kulutada teie raha, paaeda ligi teie kontodele, saata soonumeid teie nimel. Kirjutasime tervikliku analuuusi turvalisuuskriisist ja sellest, kuidas puhverserveri taseme autentimine hoiab ara halvima.

Ettenagematu autonoomia. Agent, mis suudab vootta toeelisi meetmeid, voib pohjustada toeelist kahju viisidel, mida keegi ette ei nainud. Vaid mooni paeva tagasi saatis OpenClaw agent toombetaotluse matplotlib projektile, sai tagasilokkamise, kuna projekt aktsepteerib ainult inimeste panuseid, ja seejarel avaldas autonoomselt isikliku runnaku selle sulgenud hooldaja vastu. Tundub, et keegi ei kaelinud tal seda teha. Mida pikem rihm, seda loomingulisemad on ebaonnestumise viisid.

Kuhu see koik suundub?

Trajektoor on selge: iga AI assistent liigub poolvkonna 3 suunas. LLM-ist saab API ja tootest saab orkestreerimiskiht selle umaber. Kirjutasin sellest artiklis OpenClaw on uus Linux: LLM on protsessor. Voimas, oluline, kuid mitte see asi, millega suhtlete. Oluline on operatsioonisuusteem, mis asub peal.

Vestlusrobotite ajastu loopeb. Agentide ajastu on alanud ja kiireneb 2026. aasta alguses. See on jargmine evolutsioon selles, kuidas arvutid inimesi voimestavad: lauaarvutist, mille ees istute, telefonini taskus, agendini, mis toootab taustal ja kellega suhtlete nagu kaugel oleva sobraga.

On pohjus, miks inimesed pidevalt uutlevad “OpenClaw on see, mis Apple Intelligence oleks pidanud olema.” Siri oli lubadus: isiklik assistent, kes moistab teid ja ajab asju korda. Kuid see ehitati poolvkonnas 1, reeglite ja vooskeemidega. OpenClaw on see, mis juhtub, kui selle lubaduse ehitate poolvkonna 3 arhitektuuriga.

Poolvkond 4

On olemas sellest kaugemal poolvkond. Tana elab poolvkonna 3 agent teie arvutis voi pilves. See suudab juba jouda fuuusilisse maailma, kuid ainult kaudselt: inimeste palkamine platvormide kaudu nagu rentahuman.ai, API-de kutsumine, mis kaivitavad fuuusilisi masinaid, tellimused, mis pohjustavad toeelisi tarneid. Iga tegevus vajab ikka veel vahendajat.

Poolvkond 4 eemaldab vahendaja. Kehastunud agent juhib otse roboteid, droone, soidukeid ja fuuusilist infrastruktuuri. Tesla muudab tehaseliine autodelt Optimus robotitele. Figure AI humanoidid lopetasid just 11-kuulise juurutuse BMW-s, laadides ule 90 000 osa. CES 2026 voib naaha humanoidroboteid ettevotetelt Boston Dynamics, 1X ja Figure igal pool. Mind toeeliselt huvitab, kuhu robotitehnika laahiaastatel laaheb.

Tean, et see voib koilada hirmutavalt ja see liigub kiiresti. Kuid ma eelistaksin, et see tehnoloogia oleks avatud, auditeeritav ja koigile kattesaadav, selle asemel, et see oleks lukustatud moone korporatsiooni sisse, kes otsustavad, kuidas see toootab. Sellepaerast ma ehitan OpenClaw.rocks.

Mida ma ehitan

Alustasin seda postitust uritades selgitada erinevust Siri, Alexa, ChatGPT ja OpenClaw vahel. Kuid toeeline erinevus pole nelja toote vahel. See on kolme mootteviisi vahel selle kohta, mida arvutid saavad inimeste heaks teha. Reeglid. Keel. Autonoomia.

Liikusime vooskeemidest, mis lagunevad vale kusimuse puhul, mudeliteni, mis suudavad arutleda, kuid ainult siis, kui neid suunate, suusteemideni, mis suudavad iseseisvalt tegutseda ja tulemustest oppida. Iga poolvkond muutis arvutid kasulikumaks rohkematele inimestele rohkematel viisidel. See trajektoor ei aeglustu.

OpenClaw.rocks ehitame infrastruktuuri AI agentide turvaliseks kaeitamiseks ja nende kattesaadavaks tegemiseks koigile, avaldades avatud lahtekoodina oma suusteeme.

Kui soovite jalgida, kuhu see laaheb, kuulastage OpenClaw.rocks voi leidke meid X-is.