Az OpenClaw alkotója csatlakozik az OpenAI-hoz

Peter Steinberger, az OpenClaw megalkotója, éppen bejelentette, hogy csatlakozik az OpenAI-hoz, hogy “az ügynökök mindenki számára elérhetővé tételén dolgozzon.” Sam Altman megerősítette a hírt, mondván, Steinberger fogja “a személyes ügynökök következő generációját vezetni.” Az OpenClaw egy alapítványhoz kerül.

A hír már mindenhol terjed: TechCrunch, CNBC, Bloomberg, The Register. Az alábbiakban bemutatjuk, mit gondolunk arról, mit jelez ez az AI-ügynök iparág jövőjéről.

Ki is valójában Peter Steinberger

Peter Steinberger (@steipete) egy osztrák fejlesztő, aki a Bécsi Műszaki Egyetemen tanult informatikát. Mielőtt az OpenClaw létezett volna, 13 évet töltött a PSPDFKit építésével, egy PDF-keretrendszerrel, amelyet az Apple belsőleg, a Dropbox, a DocuSign és az SAP használ, és amely egymilliárd eszközön fut.

A PSPDFKit-et 2011-ben alapította, miközben egy hat hónapig váratott amerikai munkavízumra várt. Ami időtöltésnek szánt mellékprojektként indult, vállalati termékké nőtte ki magát. 13 éven át saját forrásból finanszírozta, a csapatot 70 fősre növelte, és semmilyen külső tőkét nem fogadott el, amíg az Insight Partners 2021-ben 100 millió eurót nem fektetett be. Steinberger nem sokkal ezután visszavonult.

Aztán három évre eltűnt. Kiégés 13 évnyi minden hétvégi munka után. Nyíltan beszélt erről: terápia, utazás, másik országba költözés, annak kiderítése, mi jön azután a dolog után, ami meghatározta az embert.

2024 végén újra elkezdett programozni. Megtanulta a modern webfejlesztést, elsajátította a React-et és a TypeScript-et, és elkezdett építeni. Nem egy céget. Egy kísérleti projektet. Egy személyes AI-asszisztenst, ami WhatsApp-hoz csatlakozott.

Abból a kísérleti projektből lett a Clawdbot. Aztán a Moltbot (miután az Anthropic ügyvédei jelentkeztek). Aztán az OpenClaw. Több mint 180 000 GitHub-csillagot gyűjtött, létrehozta a Moltbook-ot (egy közösségi hálózat közel 3 millió AI-ügynökkel mint felhasználóval), és a GitHub történetének leggyorsabban növekvő nyílt forráskódú projektjévé vált. Körülbelül két hónap alatt.

Egyedüli fejlesztőként.

Az első 100x fejlesztő?

A Pragmatic Engineer portrét készített Steinbergerről “I ship code I don’t read” címmel. A számok lélegzetelállítóak: több mint 6600 commit egyedül januárban. Olyan tempóban fejlesztett és szállított, mint egy közepes méretű startup mérnöki csapata.

A titka nem a 20 órás munkanapokban rejlik. 5-10 AI kódoló ügynököt futtat egyszerre, megtartja az architekturális kontrollt, és az implementációt teljes egészében delegálja. Ezt “ügynöki mérnökségnek” nevezi, megkülönböztetve attól, amit “vibe codingnak” hív (amit bevallottan hajnali 3 után csinál, és reggel megbán).

A Hacker News szál tele van emberekkel, akik “szerencsés vibe coderként” söprik le. Ez az értelmezés elvéti a lényeget. Steinberger nem valaki, aki véletlenül lett virális. Ő egy bizonyított terméképítő, 13 évnyi vállalati szoftverszállítási tapasztalattal, aki aztán felfedezte, hogy az AI-ügynökök az amúgy is kivételes teljesítményét még egy nagyságrenddel megsokszorozzák. Amit épített, azért lett virális, mert működött. És azért működött, mert az építője több mint egy évtizede ezen a szinten teljesített.

Ő talán a legkiemelkedőbb példa jelenleg egy új szoftverfejlesztési módszerre. És nem fog megállni a szoftvernél. Ugyanez a minta, egy személy mély szaktudással, aki AI-ügynököket dirigál a termelékenysége megsokszorozására, meg fog ismétlődni a marketingben, a dizájnban, a kutatásban és minden más területen, ahol a szakértelem fontosabb a létszámnál.

A nagy ügynök-duopólium

Akkor miért van szüksége a bolygó legnagyobb AI-cégének erre a személyre? Ez az a kérdés, ami egy érdekes felismeréshez vezet.

Van Linux, és van Windows. Van Android, és van iOS. Minden nagy számítástechnikai paradigma végül kéttáború struktúrába rendeződött: az egyik nyílt, a másik zárt. Az egyik barkácsolóknak, a másik fogyasztóknak. Mindkettő hatalmas. Mindkettő szükséges.

Peter Thiel írt erről a Zero to One-ban. A Coca-Coláról és a Pepsiről szóló érve: egy duopóliumban minden szereplő gyakorlatilag monopóliummal rendelkezik a saját szegmensében. A Coca-Colának monopóliuma van minden Coca-Cola-fogyasztó felett. A Pepsinek monopóliuma van minden Pepsi-fogyasztó felett. A piac hatalmas mindkettő számára, és egyik sem pusztítja el a másikat.

Ezzel a lépéssel úgy véljük, az AI-ügynökök a Linux és Windows pillanatukhoz érkeztek (vagy iOS és Android, ha úgy tetszik).

Már korábban érveltünk amellett, hogy az OpenClaw már most ennek a területnek a Linuxa. Nyílt forráskódú. Ott fut, ahol Ön akarja. Az adatai az Önéi. Ön választja a modellt. Olvashatja a kódot, forkolhatja, bővítheti vagy a saját infrastruktúráján telepítheti. A történelem leggyorsabban növekvő nyílt forráskódú közösségével és egy hobbiistáktól vállalatokig terjedő fejlesztői bázissal rendelkezik.

És most az OpenAI éppen felvette azt a személyt, aki megépítette, azzal a feladattal, hogy “a személyes ügynökök következő generációját” hozza létre. Altman nyilatkozata egyértelmű: “A jövő rendkívül multi-ágens lesz.”

Van egy cinikus olvasat, amit érdemes elismerni. Több HN-kommentelő úgy értékelte ezt, mint marketing-húzást: az OpenAI megvette a hype-ot, megakadályozta a versenytársakat az akvizícióban, és egy olyan narratívát teremtett, miszerint a platformjukra építés életváltoztató eredményekhez vezethet. Egy kommentelő egyenesen fogalmazott: “Az OpenAI marketinget vett, és most senki más nem tudja megvenni az OpenClaw-t és kizárni az OpenAI bevételeit.” Ez valószínűleg szintén igaz. A két olvasat nem zárja ki egymást. Az OpenAI vásárolhat marketinget és szerezhet valódi szakértelmet egyszerre.

Akárhogy is, a kérdés az, hogy az OpenAI valójában mit épít. A GPT-3 óta nem voltak különösebben “nyíltak”. És az üzleti logika a zárt felé mutat: az OpenClaw modellagnosztikus. A felhasználók csatlakoztathatják az Anthropic-ot, a Google-t vagy bármely más szolgáltatót. Ez remek a felhasználóknak, de nem remek egy API-tokeneket árusító cégnek. Egy zárt forráskódú ügynöktermék, szorosan integrálva az OpenAI saját modelljeivel, megoldja ezt a problémát.

Steinberger maga hasonlította a Chrome-hoz és a Chromiumhoz. Mielőtt elfogadta volna, interjúkban elmondta, hogy csak akkor egyezik bele, ha az OpenClaw nyílt forráskódú marad, kifejezetten hivatkozva erre az irányítási modellre. Ez egy sokatmondó analógia. A Chrome a Chromiumra épül. A Google hozzájárul a nyílt forráskódú projekthez, miközben egy kereskedelmi terméket szállít, amely saját fejlesztésű funkciókat, integrációkat és csiszolást ad hozzá. A nyílt forráskódú projekt erőforrásokat és közreműködőket kap. A kereskedelmi termék egy harcban tesztelt motort kap.

A legjobb kimenetel valami ilyesmi lenne. Az OpenClaw magját nyitva tartani, hagyni Steinbergert tovább dolgozni rajta, és egy csiszolt fogyasztói terméket építeni rá. Olyat, ami mélyen integrált az OpenAI modelljeivel, infrastruktúrájával és márkájával. Optimalizálva annak a személynek, aki soha nem nyitott meg terminált. Annak a személynek, akit Steinberger úgy írt le, mint “anyám.” De a történelem óvatosságra int. Az Instagram alapítói 2018-ban elhagyták a Meta-t, miután az ígért függetlenség elpárolgott. Zuckerberg végül az Instagram növekedését fenyegetésként kezelte és megvonta tőle az erőforrásokat. A WhatsApp alapítóinak még rosszabb volt. Jan Koum és Brian Acton a magánélet-központú függetlenség ígéretére adták el a Facebooknak, majd nézték, ahogy a Facebook az adatintegrációt és a hirdetéseket erőltette. Acton lemondott 850 millió dollár be nem vált részvényről, mondván: “Eladtam a felhasználóim magánéletét. Ezzel élek minden nap.” Később társalapítója lett a Signal Foundation-nek.

Steinberger biztosítási kötvénye az alapítvány. Ez a különbség az Instagramhoz képest. Nincs felvásárlás, amit vissza kellene csinálni. Az OpenClaw függetlenül létezik, bármi is történik az OpenAI-on belül. Ha a kapcsolat működik, mindkét fél profitál. Ha nem, a nyílt forráskódú projekt tovább él, a közösség irányítja, nem az OpenAI ütemterve.

Ha így alakul, két tábor lenne. Nyílt és zárt. Barkácsolók és fogyasztók. Mindkettő hatalmas. Mindkettő szükséges.

Miért nem építette meg ezt az OpenAI korábban

Ez az a kérdés, amin érdemes elgondolkodni. Az OpenAI-nak a világ legjobb modelljei között voltak. A legnagyobb felhasználói bázissal rendelkeztek. Van ChatGPT-jük, Codex-ük és most Frontier-jük. Miért nem ők építették meg elsőként a személyes AI-ügynököt?

Valószínűleg két okból.

Először is, egy modell és egy ügynök építése alapvetően különböző probléma. Egy modell szöveget kap és szöveget ad ki. Egy ügynök szándékot kap és eredményeket ad ki. Egy ügynöknek böngésznie kell a weben, fájlokat kell kezelnie, üzeneteket kell küldenie, API-kkal kell kommunikálnia, hibákat kell kezelnie, memóriát kell fenntartania munkamenetek között, és mindezt biztonságosan kell tennie. A modell az agy. Az ügynök az agy plusz a test plusz az ítélőképesség, hogy tudja, mikor cselekedjen és mikor kérdezzen. Az OpenAI kivételes agyak építésében. De Steinberger megépítette a testet. Ő fejlesztette ki az üzenetküldő-integrációt, az eszközorchestrációt, a képességrendszert, a memóriahierarchiát és a böngészőautomatizálást.

Másodszor, és talán ez a fontosabb: biztonság és felelősség. Egy autonóm ügynök, amely shell-parancsokat hajthat végre, üzeneteket küldhet az Ön nevében és hozzáférhet a személyes adataihoz, hatalmas kockázati felület. Egy független nyílt forráskódú fejlesztő kiadhat ilyet, és hagyhatja, hogy a felhasználók döntsenek, mivel érzik jól magukat. Az OpenAI, a márkájával, a szabályozói felügyeletével és a több százmilliós felhasználóbázisával nem engedheti meg magának, hogy gyorsan haladjon és dolgokat törjön el, amikor a “dolgok” valakinek a személyes adatait vagy pénzügyi számláit jelentik. Steinberger bebizonyította, hogy a koncepció működik, és hogy az emberek akarják. Most az OpenAI erre a bizonyítékra építhet, azokkal a védőkorlátokkal, amelyekre egy ekkora cégnek szüksége van.

Ha ez a logika, akkor ez acqui-hire a legtisztább formájában. Az OpenAI megkapja azt a személyt, aki megoldotta azt a nehéz problémát, amit ők még nem oldottak meg. A nyílt forráskódú projekt pedig kap egy alapítványt, folyamatos szponzorációt és a szabadságot, hogy minden modellt támogasson, nem csak az OpenAI-éit.

Mit jelent ez a többiek számára

A biztonsági aggodalmak valósak. Kutatók 341 rosszindulatú képességet találtak a ClawHubon, és a Cisco arra jutott, hogy az OpenClaw “biztonsági rémálom.” Andrej Karpathy úgy jellemezte, mint “az egyik leghihetetlenebb sci-fi-szerű, a felszálláshoz közeli dolgot”, amit valaha látott, majd néhány nappal később úgy jellemezte, mint “egy szemetestűz.” Mindkét kijelentés egyszerre volt igaz.

Pontosan ezért számít a duopólium.

A nyílt tábor gyorsan fog haladni, dolgokat fog eltörni, és a lehetőségek határait fogja feszegetni. A zárt tábor lassabban fog haladni, a biztonságot fogja előtérbe helyezni, és az ügynököket elérhetővé teszi azoknak, akik nem tudják, mi az a terminál. Mindkettőre szükség van. Egy ügynök-ökoszisztéma kizárólag nyílt opcióval megijeszti a biztonsági csapatokat és azt eredményezi, hogy az embereket feltörik. Egy ügynök-ökoszisztéma kizárólag zárt opcióval megöli az innovációt és koncentrálja a hatalmat.

A leghangosabb ellenérv most a HN-en az, hogy nincs védőárok. “Mindenkinek lesz saját OpenClaw-verziója 18 hónapon belül.” “Hetente jelennek meg újak.” “Szó szerint megkérheti a Codex-et, hogy egyik napról a másikra építsen egy egyszerűsített verziót.” A kód nem olyan összetett. Az ötlet nem olyan újszerű. Bárki lemásolhatja.

Valószínűleg mindenben igazuk van. És mégis elvétik a lényeget.

Pontosan ez történt a Linuxszal. A kernel nem volt varázslatos. Tucatnyi disztribúció jelent meg. Bárki forkolhatta. De a Linux mégis nyert, mert a védőárok soha nem a kód volt. A közösség volt, az ökoszisztéma, a közös lendület. Ugyanez a dinamika játszódik le itt. Az OpenClaw 180 000 GitHub-csillaga, a képességpiactere, az integrációi, a dokumentációja, az ezernyi ember, aki most rajta épít: ez nem olyasmi, amit egy Codex-kéréssel lemásolhat egyik napról a másikra.

Átláthatónak kell lennünk a pozíciónkkal kapcsolatban. Mi OpenClaw-ügynököket hosztolunk. A szoftver megalkotója, amelyre a vállalkozásunk épül, éppen csatlakozott ahhoz a céghez, amely legvalószínűbben a zárt alternatívát fogja megépíteni. Érintettek vagyunk ebben a játékban, és minden okunk megvan az elfogultságra.

Íme, miért gondoljuk, hogy a nyílt oldal mégis nyer: általában így szokott lenni. Még a Microsoft is Linuxot futtat az Azure nagy részén ma. A nyílt forráskód biztonságosabb, mert ezernyi szem auditálja a kódot. Alkalmazkodóbb, mert bárki bővítheti. És túléli a vállalati ütemterveket, mert egyetlen cég sem irányítja. Az alapítvány azt jelenti, hogy az OpenClaw nyílt forráskódú marad, modellagnosztikus marad, és a közösség irányítja. Az érdekeink összhangban vannak minden más ember és cég érdekeivel, akik rajta építenek. Ez nem összeférhetetlenség. Ez a nyílt forráskód lényege.

A pillanat

Három évvel ezelőtt a ChatGPT beszélgetőssé tette az AI-t. Tudott Önnel beszélni.

Ma az OpenClaw operatívvá teszi az AI-t. Tud Ön helyett cselekedni.

Steinberger csatlakozása az OpenAI-hoz nem azt jelenti, hogy az OpenClaw-t felszívják. Azt jelenti, hogy a személyes AI-ügynökök koncepciója “érdekes nyílt forráskódú projektből” “a világ legnagyobb AI-cégének alapvető stratégiai prioritásává” lép elő.

A Lex Fridman podcastban Fridman ezt “az ügynöki AI-forradalom kezdetének” nevezte, összehasonlítva a ChatGPT 2022-es indulásával. A különbség az, hogy ezúttal a forradalom arról szól, hogy az AI-t a nyelvtől a cselekvés felé mozdítják. A szöveg generálásától a dolgok elvégzéséig.

Talán a duopólium formálódik. Talán másképp alakul. De íme, mi teszi szokatlanná ezt a paradigmaváltást: a nyílt opció jött előbb. A Linux évtizedekkel a Windows után jött. Az Android évekkel az iPhone után jött. A nyílt alternatívának mindig fel kellett zárkóznia. Ezúttal a nyílt oldalnak van 180 000 csillaga, egy alapítványa és egy közössége, ami itt volt, mielőtt az OpenAI belépett a szobába.

A kérdés nem az lesz, hogy mindenkinek lesz-e személyes AI-ügynöke. A kérdés az lesz, hogy az Öné nyílt vagy zárt.