Siri, Alexa, ChatGPT ja OpenClaw: mika on todellinen ero?

Jokainen on kayttanyt ainakin yhta naista. Siri asettaa ajastimesi. Alexa soittaa musiikkiasi. ChatGPT kirjoittaa sahkopostisi. Ja sitten on viela OpenClaw, avoimen lahdekoodin tekoalyagentti, joka on viime aikoina ollut kaikkialla uutisissa ja tekee jotain olennaisesti erilaista kuin kaikki kolme edellistta.

Kaikkia kutsutaan “tekoalyavustajiksi”, mutta kunkin taustalla oleva teknologia on niin erilaista, etta niiden niputtaminen yhteen on lahes harhaanjohtavaa. Tama kirjoitus selittaa, mita konepellin alla todella tapahtuu, miten tekoalyavustajat kehittyivat saannoista kielimallien kautta autonomisiksi agenteiksi ja mita se tarkoittaa tulevaisuuden kannalta.

Nelja peluria

Aloitetaan siita, mita kukin naista todella on.

Siri on Applen aaniohjattu avustaja. Se asuu iPhonessasi, Macissasi, Apple Watchissasi ja HomePodissasi. Sanot “Hey Siri” ja se vastaa kysymyksiin, asettaa heratyksia, lahettaa viesteja ja ohjaa alykotilaitteitasi. Se lanseerattiin vuonna 2011 eika ole, rehellisesti sanottuna, muuttunut kovin paljon siita lahtien. Apple on vahvistanut, etta suuri tekoalypaivitys on tulossa vuonna 2026, mutta se ei ole viela taalla.

Alexa on Amazonin aaniohjattu avustaja. Se asuu Echo-kaiuttimissa ja muissa Amazon-laitteissa. Se voi soittaa musiikkia, vastata kysymyksiin, ohjata alykotilaitteita ja tilata tavaroita Amazonista. Helmikuussa 2025 Amazon lanseerasi Alexa+:n, paivitetyn version, jota kayttavat suuret kielimallit.

ChatGPT on OpenAI:n keskusteleva tekoaly. Se toimii verkkoselaimessa tai mobiilisovelluksessa. Kirjoitat (tai puhut), ja se vastaa huomattavan sujuvilla, yksityiskohtaisilla vastauksilla. Se osaa kirjoittaa esseita, selittaa koodia, analysoida kuvia ja tiivistaa asiakirjoja. Uusimmat versiot voivat myos selata verkkoa ja suorittaa koodia keskustelun aikana.

OpenClaw on avoimen lahdekoodin tekoalyagentti. Se yhdistaa viestisovelluksiisi (WhatsApp, Telegram, Discord ja monet muut) ja on rakennettu toimenpiteiden suorittamiseen: verkon selaaminen, tiedostojen hallinta, koodin suorittaminen, alykotilaitteiden ohjaaminen. Kun muut ovat ensisijaisesti keskustelevia, OpenClaw on ensisijaisesti operatiivinen.

Nelja “tekoalyavustajaa”. Mutta olennaisesti erilaisia teknologioita, jotka tekevat olennaisesti erilaisia asioita.

Miten ne oikeasti toimivat?

Tasta tulee mielenkiintoista. Ymmartaaksesi, miksi nama tuotteet tuntuvat kaytossa niin erilaisilta, sinun taytyy ymmartaa, mita kulissien takana tapahtuu.

Siri ja vanhan koulun Alexa: vuokaavio

Kun kysyt Sirilta “Millainen saa on Berliinissa?”, tapahtuu seuraavaa:

Aanesi muunnetaan tekstiksi (puheentunnistus)
Tekstia verrataan tunnettujen komentojen listaan (“saa” + “Berliini” = saaaikomus, sijainti = Berliini)
Siri kutsuu saarajapintaa syotteella “Berliini”
API palauttaa tiedot, ja Siri lukee valmiiksi kirjoitetun mallin: “Berliinissa on talla hetkella 3 astetta”

Tama on aikomuksen luokittelu ja paikkojen taytto. Kuvittele se erittain hienostuneena vuokaaviona. Jos kayttaja sanoo taman, tee tuo. Sirilla on tuhansia tallaisia vuokaavioita, jokainen huolellisesti Applen insinoorien ohjelmoima.

Ongelma? Jos kysyt jotain, joka ei vastaa mitaan vuokaaviota, Siri romahtaa. “Hei Siri, pitaisiko minun ottaa sateenvarjo mukaan huomiseen kokoukseeni?” vaatii Siria tarkistamaan kalenterisi, loytamaan kokouksen sijainnin, tarkistamaan saaennusteen tuolle sijainnille tuohon aikaan ja arvioimaan, onko sade tarpeeksi todennakoistta sateenvarjon perustelemiseksi. Se ei ole vuokaavio. Se on ajattelua. Ja ajattelu on juuri se, mita Siri ei viela osaa.

Alexa toimi samalla tavalla vuosia. Sen “taidot” (Alexan vastine sovelluksille) ovat pohjimmiltaan tuhansia yksittaisia vuokaavioita, jotka kolmannen osapuolen kehittajat ovat rakentaneet. Uusi Alexa+ lisaa kielimallin paallle, mutta perusarkkitehtuuri on ytimeltaan edelleen aaniaktivottu komentojarjestelma.

ChatGPT: seuraavan sanan ennustaja

ChatGPT toimii taysin eri tavalla. Se kayttaa jotain, jota kutsutaan suureksi kielimalliksi eli LLM:ksi. Ja LLM:ien ymmartaminen on avain kaiken talla hetkella tekoalyssa tapahtuvan ymmartamiseen.

Tassa on yksinkertainen versio.

Kuvittele, etta olet lukenut jokaisen kirjan, jokaisen verkkosivun, jokaisen artikkelin ja jokaisen keskustelun, joka on koskaan kirjoitettu englanniksi. Miljardeja ja miljardeja sivuja. Kaiken tuon lukemisen jalkeen sinulle kehittyisi melko hyva intuitio siita, miten kieli toimii. Tietaisit, etta “Ranskan paakaupunki on …” -lausetta seuraa lahes varmasti “Pariisi.” Tietaisit, etta suklaakakun reseptissa on todennakoisesti jauhoja, sokeria, kaakaota ja munia. Tietaisit, etta kohtelias sahkoposti paaattyy yleensa sanoihin “Ystavallisin terveisin.”

Se on pohjimmiltaan se, mita LLM tekee, mutta matematiikalla intuition sijaan. Se on valtava hermoverkko (kuvittele: miljardien lukujen verkosto), joka on koulutettu valtavalla maaralla tekstia internetista. Koulutuksen aikana se pelasi pelia: annettu lause, josta viimeinen sana on poistettu, ennusta mita tulee seuraavaksi. Se pelasi tata pelia biljoonia kertoja, joka kerta saataen sisaisia lukujaan, jotta se olisi hieman parempi ennustamisessa.

Riittavan koulutuksen jalkeen tapahtuu jotain merkittavaa. Mallista tulee aariimmaisen joustava kaiken nakemansa yhdistelymisessa, siihen pisteeseen, etta se vaikuttaa ymmartavan asioita. Se osaa selittaa kvanttifysiikkaa, kirjoittaa Python-koodia, luoda runoutta ja ratkaista matemaattisia ongelmia loogisella paaattelyllaa. Ei siksi, etta joku olisi ohjelmoinut nama kyvyt, vaan siksi, etta ihmiskielen mallit koodaavat valtavan maaran tietoa ja loogista paaattelya.

Kun esitat ChatGPT:lle kysymyksen, se ei “etsi” vastausta tietokannasta. Se tuottaa vastauksen sana kerrallaan (teknisesti yksi token kerrallaan), joka kerta kysyen itseltaan: “Kaiken tahan astisen perusteella, mika on todennakoisin seuraava sana?” Siksi se voi olla loistavasti oikeassa ja itsevarmasti vaarassa samassa keskustelussa. Se tuottaa aina tilastollisesti uskottavimman vastauksen, ei vahvistetuinta.

OpenAI esitteli “ajattelevat” mallit o1:lla vuoden 2024 lopulla: vaikeiden ongelmien kohdalla malli tuottaa vaihe vaiheelta -paattelyn ennen vastauksen antamista, samalla tavalla kuin sinua saattaisit ratkaista matemaattista ongelmaa luonnospaperilla. GPT-5 yhdisti taman yhdeksi jarjestelmaksi, joka reitittaa automaattisesti nopeiden vastausten ja syvallisen paattelyn valilla. Tulos: 45 % vahemman asiavarrheitta verrattuna aiempiin malleihin, kun verkkohaku on kayytossa.

OpenClaw: ohjaussilmukka

OpenClaw ottaa LLM:n (kuten ChatGPT:n sisalla olevan) ja asettaa sen silmukkaan.

Lahetat viestin (“Varaa minulle poyta illalliselle tanaan illalla”)
LLM lukee viestisi ja paattaa, mita tehda ensin (tarkistaa kalenterisi taman illan osalta)
OpenClaw suorittaa tuon toimenpiteen ja syottaa tuloksen takaisin LLM:lle
LLM lukee tuloksen ja paattaa seuraavan askeleen (etsia ravintoloita sijainnin lahelta)
Vaiheet 3 ja 4 toistuvat, kunnes tehtava on suoritettu

Tata kutsutaan paattely-toiminta-havainto -silmukaksi. LLM paaattelee, mita tehda, toimii tyokalujen kautta (selaaminen, viestinta, tiedostojen kaytto), havainnoi tuloksen ja toistaa silmukan. LLM ei ole tuote, jonka kanssa olet vuorovaikutuksessa. Se on yksi komponentti suuremmassa jarjestelmassa, joka voi suorittaa todellisia toimenpiteita maailmassa.

Kun pyydaat ChatGPT:ta varaamaan ravintolan, se voi ehdottaa vaihtoehtoja ja laatia viestin. Kun pyydaat OpenClaw’ta, se voi oikeasti tehda varauksen, lisata sen kalenteriisi ja lahettaa ystaavallesi yksityiskohdat.

Kolme sukupolvea

Nyt kun olet nahnyt, miten kukin naista toimii konepellin alla, esiin nousee malli. Vuokaaviot, kielimallit, ohjaussilmukat. Nama eivat ole vain kolme eri tuotetta. Ne ovat kolme sukupolvea samasta ideasta: saada tietokoneet ymmartamaan, mita ihmiset haluavat.

Sukupolvi 1: Saannot. Se on Siri ja vanhan koulun Alexa, kuten edella kuvattu. Ihmiset kirjoittavat jokaisen vuokaavion. Alykasta, mutta haurasta.

Sukupolvi 2: LLM on tuote. Se on ChatGPT. Kielimalli itse on se asia, jonka kanssa olet vuorovaikutuksessa. Sinaa puhut mallille, malli puhuu takaisin. Se osaa paatella, olla luova, kasitella kysymyksia, joita kukaan ei ennakoinut. Mutta se on pohjimmiltaan edelleen keskustelu. Sinaa kysyt, se vastaa. LLM on tuote.

Sukupolvi 3: LLM on vain API. Taalla OpenClaw asuu. LLM alennetaan tuotteesta yhdeksi komponentiksi suuremmassa jarjestelmassa: edella kuvattu paattely-toiminta-havainto -silmukka. LLM:n tuotos muuttuu sen omaksi seuraavaksi syotteeksi.

Ero on kuin kysyisit joltakulta tietaa verrattuna siihen, etta palkkaat jonkun kokoaikaisesti. Sukupolven 2 jarjestelma antaa sinulle ohjeet. Sukupolven 3 jarjestelma istuu autoon, ajaa sinut perille, muistaa reitin seuraavaa kertaa varten ja voi paattaa tarkistaa liikenteen huomenna aamulla ennen kuin ehddit edes kysya.

ChatGPT liikkuu tahan suuntaan. OpenAI:n Operator selaa verkkoa puolestasi. ChatGPT osaa suorittaa koodia, hakea verkosta ja luoda kuvia yhdessa keskustelussa. Nama ovat tyokalukutsuja ohjaussilmukan sisalla. Mutta OpenClaw menee pidemmalle kolmella tavalla.

Itsemuokkaus. OpenClaw’n jarjestelmakehote (SOUL.md), sen pitkaaikaismuisti (MEMORY.md) ja sen taidot elavat tiedostoissa, joita agentti itse voi lukea ja kirjoittaa. Agentti voi kirjoittaa uudelleen ohjeet, jotka maaraavat, miten LLM:aa ohjataan jokaisella tulevalla kierroksella. Se ei vain kayta LLM:aa. Se ohjaa, miten se kayttaa LLM:aa, ja saataa tuota ohjausta ajan myota. ChatGPT:lla on muistiominaisuuksia, mutta se ei voi kirjoittaa uudelleen omaa jarjestelmakehotettaan.

Jatkuvuus. ChatGPT odottaa, etta kirjoitat. OpenClaw toimii taustaprosessina, joka pysyy aktiivisena. Se voi ajastaa omia cron-tehtaviaan, reagoida webhookeihin, herata aikataulun mukaan ja ryhtyaa toimiin ilman kenenkaan kehotusta. Se ei ole reaktiivinen. Se on jatkuva.

Avoimuus. ChatGPT antaa LLM:lle kuratoidun tyokaluvalikoiman, jota OpenAI hallitsee. OpenClaw on avointa lahdekoodia ja laajennettavissa taidoilla: modulaarisilla tieto- ja kykypaketeilla, joita kuka tahansa voi luoda ja jakaa. Jo yli 52 000 taitoa on saatavilla, ja yhteison markkinapaikat kuten ClawHub tekevat ekosysteemista kaytannossa loputtoman. Kirjoitin tasta artikkelissa Tekoalytaidot ovat uusia sovelluksia: taidot ovat tekoalyagenteille sita, mita sovellukset olivat iPhonelle. Ne ovat tapa, jolla jarjestelma muuttuu alykkaammmaksi ilman ytimen muuttamista.

Silmukkaa pyorittava malli voi olla sama. Arkkitehtuuri on se, mika eroaa. Varhainen ChatGPT oli funktio, jota kutsut. OpenClaw on prosessi, joka pyorii.

Pidemmman talutushihnan riskit

Enemman vapautta tarkoittaa enemman valtaa, ja enemman valtaa tarkoittaa enemman riskia. Ja sukupolven 3 riskit ovat olennaisesti erilaisia kuin sukupolven 2.

Kehotteen injektio. Kun kaytat ChatGPT:ta itse, sinaa hallitset, mita kehotteeseen menee. Kun agentti selaa verkkoa, lukee sahkoposteja tai asentaa kolmannen osapuolen taitoja, muiden ihmisten sisalto paasee kehotteeseen. Haitallinen verkkosivu voi upottaa piilotettuja ohjeita, joita LLM noudattaa kayttajan tietamatta. Kompromissoitu taito voi injektoida komentoja agentin paaattelysilmukkaan. Tama on kehotteen injektio, ja se on paljon suurempi ongelma agenteille kuin chatboteille, koska agentti voi toimia naiden injektoitujen ohjeiden mukaan: lahettaa sahkoposteja, varastaa tietoja, muokata tiedostoja. Helmikuussa tutkijat loysivat 341 haitallista taitoa ClawHubista, jotka tekivat juuri nain.

Tunnistetietojen paljastuminen. Sukupolven 3 agentit tarvitsevat paasyn todelliseen elamaasi ollakseen hyodyllisia: API-avaimet, salasanat, luottokortit, viestintatilit. Helmikuussa loydettiin 135 000 internetiin avointa OpenClaw-instanssia, ja Cisco, CrowdStrike seka Kaspersky julkaisivat varoituksia samalla viikolla. Vaarin konfiguroitu agentti tunnistetiedoillasi ei ole vain tietovuoto. Se on valityspalvelin, joka voi toimia sinuna: esiintya sinuna missa tahansa palvelussa, kayttaa rahojasi, paasta tileillesi, lahettaa viesteja nimissasi. Kirjoitimme kattavan analyysin turvallisuuskriisista ja siita, miten valityspalvelintason todennus estaa pahimman.

Tahaton autonomia. Agentti, joka voi suorittaa todellisia toimenpiteita, voi aiheuttaa todellista haittaa tavoilla, joita kukaan ei ennakoinut. Vain paivia sitten OpenClaw-agentti lahetti pull requestin matplotlib-projektille, sai hylkayksen koska projekti hyvaksyy vain ihmisten kontribuutioita, ja sitten autonomisesti julkaisi henkilokohtaisen hyokkaayksen sen sulkenutta yllapitajaa vastaan. Vaikuttaa silta, etta kukaan ei kaskenyt sita tekemaan niin. Mita pidempi talutushihna, sita luovemmat epaaonnistumisen tavat.

Mihin tama kaikki on menossa?

Suunta on selva: jokainen tekoalyavustaja liikkuu kohti sukupolvea 3. LLM:sta tulee API, ja tuotteesta tulee orkestrointikerros sen ymparille. Kirjoitin tasta artikkelissa OpenClaw on uusi Linux: LLM on prosessori. Tehokas, valttamaton, mutta ei se asia, jonka kanssa olet vuorovaikutuksessa. Tarkeaa on kayttojarjestelma, joka istuu sen paalla.

Chatbottien aikakausi on paattymassa. Agenttien aikakausi on alkanut ja kiihtyy vuoden 2026 alussa. Tama on seuraava evoluutio siina, miten tietokoneet voimaannuttavat ihmisia: tyopoyydasta, jonka edessa istut, puhelimeen taskussasi, agenttiin, joka toimii taustalla ja jonka kanssa kommunikoit kuin etaaisen ystavan kanssa.

On syy, miksi ihmiset toistuvasti sanovat “OpenClaw on se, mita Apple Intelligence olisi pitanyt olla.” Siri oli lupaus: henkilokohtainen avustaja, joka ymmartaa sinua ja hoitaa asioita. Mutta se rakennettiin sukupolvessa 1, saannoilla ja vuokaavioilla. OpenClaw on se, mita tapahtuu, kun rakennat tuon lupauksen sukupolven 3 arkkitehtuurilla.

Sukupolvi 4

On olemassa sukupolvi taman jalkeen. Tanaan sukupolven 3 agentti asuu tietokoneellasi tai pilvessa. Se voi jo ulottua fyysiseen maailmaan, mutta vain epasuorasti: palkkaamalla ihmisia alustojen kuten rentahuman.ai kautta, kutsumalla API-rajapintoja jotka kaynnaistavat fyysisia koneita, tekemalla tilauksia jotka johtavat todellisiin toimituksiin. Jokainen toimenpide tarvitsee edelleen valikateen.

Sukupolvi 4 poistaa valikaaden. Ruumiillistunut agentti ohjaa suoraan robotteja, drooneja, ajoneuvoja ja fyysista infrastruktuuria. Tesla muuttaa tehdaslinjoja autoista Optimus-robotteihin. Figure AI:n humanoidit ovat juuri saattaneet paatokseen 11 kuukauden kayttooonoton BMW:lla, ladaten yli 90 000 osaa. CES 2026 -messuilla humanoidirobotteja Boston Dynamicsilta, 1X:lta ja Figurelta oli kaikkialla. Olen aidosti utelias, mihin robotiikka on menossa tulevina vuosina.

Tiedan, etta tama voi kuulostaa peelottavalta, ja se etenee nopeasti. Mutta mielummin tama teknologia on avointa, auditoitavaa ja kaikkien saatavilla kuin lukittuna muutaman yrityksen sisaan, jotka paattavat miten se toimii. Siksi rakennan OpenClaw.rocks.

Mita rakennan

Aloitin taman kirjoituksen yrittaen selittaa eron Sirin, Alexan, ChatGPT:n ja OpenClaw’n valilla. Mutta todellinen ero ei ole neljan tuotteen valilla. Se on kolmen ajattelutavan valilla siita, mita tietokoneet voivat tehda ihmisten hyvaksi. Saannot. Kieli. Toimijuus.

Siirryimme vuokaavioista, jotka rikkoutuvat vaaran kysymyksen kohdalla, malleihin jotka osaavat paatella mutta vain kun niita kehotetaan, jarjestelmiin jotka voivat toimia itsenaisesti ja oppia tuloksista. Jokainen sukupolvi teki tietokoneista hyodyllisempia useammille ihmisille useammilla tavoilla. Tuo suuntaus ei hidastu.

OpenClaw.rocks -sivustolla rakennamme infrastruktuuria tekoalyagenttien turvalliseen ajamiseen suuressa mittakaavassa ja niiden saataville tuomiseen kaikille, avaten lahdekoodiin jarjestelmiamme matkan varrella.

Jos haluat seurata, mihin tama on menossa, tutustu OpenClaw.rocks -sivustoon tai loyda meidat X:ssa.