OpenClaw kūrėjas prisijungia prie OpenAI

Peter Steinberger, OpenClaw kūrėjas, ką tik paskelbė, kad prisijungia prie OpenAI, kad “dirbtų prie agentų prieinamumo visiems.” Sam Altman tai patvirtino, sakydamas, kad Steinberger “varys naujos kartos asmeninius agentus.” OpenClaw pereina į fondą.

Istorija jau visur: TechCrunch, CNBC, Bloomberg, The Register. Štai ką, mūsų manymu, tai signalizuoja apie AI agentų pramonės kryptį.

Kas iš tikrųjų yra Peter Steinberger

Peter Steinberger (@steipete) yra austrų kūrėjas, studijavęs kompiuterių mokslą Vienos technikos universitete. Prieš OpenClaw egzistavimą jis 13 metų kūrė PSPDFKit, PDF karkasą, kurį viduje naudoja Apple, Dropbox, DocuSign ir SAP, ir kuris veikia milijarde įrenginių.

Jis įkūrė PSPDFKit 2011 metais, laukdamas JAV darbo vizos, kurios gavimas užtruko šešis mėnesius. Tai, kas prasidėjo kaip šalutinis projektas laikui užmušti, virto įmonės produktu. Jis bootstrapino jį 13 metų, išaugino komandą iki 70 žmonių ir neėmė jokio išorinio finansavimo, kol Insight Partners 2021 metais investavo 100 milijonų eurų. Steinberger pasitraukė netrukus po to.

Tada jis dingo trejiems metams. Perdegimas po 13 metų darbo kiekvieną savaitgalį. Jis buvo atviras dėl to: terapija, kelionės, persikėlimas į kitą šalį, bandymas suprasti, kas ateina po dalyko, kuris tave apibrėžė.

2024 metų pabaigoje jis vėl pradėjo programuoti. Išmoko šiuolaikinį žiniatinklio kūrimą, įsisavino React ir TypeScript ir pradėjo kurti. Ne įmonę. Žaidimų projektą. Asmeninį AI asistentą, prijungtą prie WhatsApp.

Tas žaidimų projektas tapo Clawdbot. Tada Moltbot (po to, kai Anthropic teisininkai paskambino). Tada OpenClaw. Jis surinko daugiau nei 180 000 GitHub žvaigždučių, paleido Moltbook (socialinį tinklą su beveik 3 milijonais AI agentų kaip vartotojų) ir tapo greičiausiai augančiu atviro kodo projektu GitHub istorijoje. Per maždaug du mėnesius.

Kaip vienas kūrėjas.

Pirmasis 100x kūrėjas?

Pragmatic Engineer profiliavo Steinbergerį antrašte “Siunčiu kodą, kurio neskaitau.” Skaičiai stulbinantys: daugiau nei 6600 commitų vien sausį. Kūrė ir siuntė tempu, kuris atrodo kaip vidutinės stadijos startupo inžinierių komanda.

Jo paslaptis nėra 20 valandų darbo dienos. Jis vienu metu valdo nuo 5 iki 10 AI kodavimo agentų, išlaiko architektūrinę kontrolę ir visiškai deleguoja implementaciją. Jis tai apibūdina kaip “agentinę inžineriją”, skirdamas nuo to, ką vadina “vibe kodavimu” (kurį pripažįsta darąs po 3 valandos nakties ir ryte gailisi).

Hacker News gija pilna žmonių, kurie jį atmeta kaip “vibe koderį”, kuriam pasisekė. Šis rėminimas praleidžia esmę. Steinberger nėra kažkas, kas atsitiktinai tapo viraliniu. Jis yra įrodytas produktų kūrėjas su 13 metų įmonės programinės įrangos pristatymo patirtimi, kuris tada atrado, kad AI agentai padaugina jo ir taip jau išskirtinę produkciją dar vienu eilės tvarka. Tai, ką jis sukūrė, tapo viraliniu, nes tai veikė. Ir tai veikė, nes žmogus, kuris tai kūrė, veikė šiuo lygiu daugiau nei dešimtmetį.

Jis šiuo metu galbūt yra ryškiausias naujo programinės įrangos kūrimo būdo pavyzdys. Ir tai nesustos ties programine įranga. Tas pats modelis, vienas žmogus su giliomis srities žiniomis, orktestruojantis AI agentus savo produkcijos padauginimui, pasireikš rinkodaroje, dizaine, tyrimuose ir kiekvienoje kitoje srityje, kur ekspertizė svarbesnė nei darbuotojų skaičius.

Didysis agentų duopolis

Tai kodėl didžiausiai AI kompanijai planetoje reikia šio žmogaus? Tai klausimas, kuris mus nuveda į kažką įdomaus.

Yra Linux ir yra Windows. Yra Android ir yra iOS. Kiekviena didelė skaičiavimo paradigma galiausiai nusistovėjo į dviejų stovyklų struktūrą: viena atvira, viena uždara. Viena meistrams, viena vartotojams. Abi didžiulės. Abi būtinos.

Peter Thiel apie tai rašė knygoje Zero to One. Jo mintis apie Coca-Cola ir Pepsi: duopolyje kiekvienas žaidėjas faktiškai turi monopolį savo segmente. Cola turi monopolį visiems Cola gėrėjams. Pepsi turi monopolį visiems Pepsi gėrėjams. Rinka yra didžiulė abiem, ir nė vienas nesunaikina kito.

Šiuo žingsniu manome, kad AI agentams artėja jų Linux ir Windows momentas (arba iOS ir Android, jei norite).

Mes jau esame anksčiau teigę, kad OpenClaw jau yra šios erdvės Linux. Jis yra atviro kodo. Jis veikia ten, kur norite. Jūs valdote savo duomenis. Jūs pasirenkate savo modelį. Galite skaityti kodą, forkinti jį, išplėsti arba diegti savo infrastruktūroje. Jis turi greičiausiai augančią atviro kodo bendruomenę istorijoje ir kūrėjų bazę, apimančią nuo mėgėjų iki įmonių.

Ir dabar OpenAI ką tik pasamdė žmogų, kuris tai sukūrė, pavesdami jam kurti “naujos kartos asmeninius agentus.” Altmano pareiškimas yra aiškus: “Ateitis bus nepaprastai multi-agentinė.”

Yra ciniškas skaitymas, kurį verta pripažinti. Keli HN komentatoriai įrėmino tai kaip rinkodaros žingsnį: OpenAI nupirko hype, užblokavo konkurentus nuo jo įsigijimo ir sukūrė naratyvą, kad kūrimas ant jų platformos gali atvesti prie gyvenimą keičiančių rezultatų. Vienas komentatorius tai pasakė tiesiai: “OpenAI nupirko rinkodarą ir dabar kažkas kitas negali nupirkti OpenClaw ir atkirsti OpenAI pajamų.” Tai tikriausiai irgi tiesa. Du skaitymai nėra tarpusavyje nesuderinami. OpenAI gali pirkti rinkodarą ir įgyti tikrą ekspertizę tuo pačiu metu.

Bet kokiu atveju klausimas yra, ką OpenAI iš tikrųjų kurs. Jie nebuvo ypatingai “atviri” nuo GPT-3. Ir verslo logika rodo uždarą kryptį: OpenClaw yra modelio-agnostinis. Vartotojai gali prijungti Anthropic, Google ar bet kurį kitą tiekėją. Tai puiku vartotojams, bet nepuiku kompanijai, kuri parduoda API tokenus. Uždaro kodo agentų produktas, glaudžiai integruotas su OpenAI pačių modeliais, išsprendžia šią problemą.

Steinberger pats padarė palyginimą su Chrome ir Chromium. Prieš sutikdamas, jis pasakojo žurnalistams, kad sutiks su sandoriu tik jei OpenClaw liks atviro kodo, tiesiogiai cituodamas tą valdymo modelį. Tai atskleidžianti analogija. Chrome yra pastatytas ant Chromium. Google prisideda prie atviro kodo projekto, tuo pat metu pristatydama komercinį produktą, kuris prideda nuosavybines funkcijas, integracijas ir šlifavimą. Atviro kodo projektas gauna išteklius ir bendraautorių. Komercinis produktas gauna mūšiuose išbandytą variklį.

Geriausias rezultatas būtų kažkas panašaus. Išlaikyti OpenClaw branduolį atvirą, leisti Steinbergeriui toliau dirbti prie jo ir sukurti šlifuotą vartotojų produktą viršuje. Tokį, kuris giliai integruotas su OpenAI modeliais, infrastruktūra ir prekės ženklu. Optimizuotą žmogui, kuris niekada nėra atidaręs terminalo. Žmogui, kurį Steinberger apibūdino kaip “mano mama.”

Bet istorija duoda priežasčių atsargumui. Instagram įkūrėjai paliko Meta 2018 metais po to, kai žadėta nepriklausomybė išgaravo. Zuckerberg galiausiai traktavo Instagram augimą kaip grėsmę ir atėmė resursus. WhatsApp įkūrėjams buvo dar blogiau. Jan Koum ir Brian Acton pardavė Facebook su privatumo ir nepriklausomybės pažadu, tada stebėjo, kaip Facebook stumia duomenų integraciją ir reklamą. Acton pasitraukė nuo 850 milijonų dolerių neįgytų akcijų, sakydamas “Pardaviau savo vartotojų privatumą. Gyvenu su tuo kiekvieną dieną.” Vėliau jis bendraįkūrė Signal Foundation.

Steinbergerio draudimo polisas yra fondas. Tai skirtumas tarp šito ir Instagram. Nėra įsigijimo, kurį reikėtų atšaukti. OpenClaw egzistuoja nepriklausomai, nepaisant to, kas vyksta OpenAI viduje. Jei santykiai veikia, abi pusės laimi. Jei ne, atviro kodo projektas gyvuoja toliau, valdomas bendruomenės, o ne OpenAI veiksmų plano.

Jei tai taip susiklostys, turėsite dvi stovyklas. Atvirą ir uždarą. Meistrus ir vartotojus. Abi didžiules. Abi būtinas.

Kodėl OpenAI to nebuvo sukūrę anksčiau

Tai klausimas, prie kurio verta sustoti. OpenAI turėjo vienus geriausių modelių pasaulyje. Jie turėjo didžiausią vartotojų bazę. Jie turi ChatGPT, Codex ir dabar Frontier. Kodėl jie pirmieji nesukūrė asmeninio AI agento?

Dvi priežastys, tikriausiai.

Pirma, modelio kūrimas ir agento kūrimas yra fundamentaliai skirtingos problemos. Modelis priima tekstą ir gamina tekstą. Agentas priima ketinimą ir gamina rezultatus. Agentas turi naršyti žiniatinklį, valdyti failus, siųsti žinutes, sąveikauti su API, tvarkyti klaidas, palaikyti atmintį tarp sesijų ir visa tai daryti saugiai. Modelis yra smegenys. Agentas yra smegenys plius kūnas plius sprendimas žinoti, kada veikti ir kada klausti. OpenAI yra nepaprasti kuriant smegenis. Bet Steinberger sukūrė kūną. Jis išsprendė žinučių integraciją, įrankių orkestraciją, įgūdžių sistemą, atminties hierarchiją, naršyklės automatizavimą.

Antra, ir gal svarbiau: saugumas ir atsakomybė. Autonominis agentas, galintis vykdyti shell komandas, siųsti žinutes jūsų vardu ir prieiti prie jūsų asmeninių duomenų, yra didžiulė rizikos erdvė. Vienas atviro kodo kūrėjas gali tai pristatyti ir leisti vartotojams spręsti, su kuo jie patogūs. OpenAI su savo prekės ženklu, reguliacine priežiūra ir šimtais milijonų vartotojų negali sau leisti judėti greitai ir laužyti dalykus, kai “dalykai” reiškia kažkieno asmeninius duomenis ar finansines sąskaitas. Steinberger įrodė, kad koncepcija veikia ir žmonės to nori. Dabar OpenAI gali kurti ant to įrodymo su apsaugomis, kurių reikia jų dydžio kompanijai.

Jei tokia logika, tai yra acqui-hire gryniausia prasme. OpenAI gauna žmogų, kuris išsprendė sunkią problemą, kurios jie dar nebuvo išsprendę. O atviro kodo projektas gauna fondą, nuolatinį rėmimą ir laisvę palaikyti kiekvieną modelį, ne tik OpenAI.

Ką tai reiškia mums visiems

Saugumo problemos yra realios. Tyrėjai rado 341 kenkėjišką įgūdį ClawHub, ir Cisco padarė išvadą, kad OpenClaw yra “saugumo košmaras.” Andrej Karpathy tai pavadino “vienu iš neįtikinamiausių sci-fi takeoff-adjacent dalykų”, kuriuos matė, o po kelių dienų pavadino tai “šiukšliadėžės gaisru.” Abu teiginiai buvo teisingi vienu metu.

Būtent todėl duopolis svarbus.

Atvira stovykla judės greitai, laužys dalykus ir stums galimybių ribas. Uždara stovykla judės lėčiau, teiks pirmenybę saugumui ir padarys agentus prieinamus žmonėms, kurie nežino, kas yra terminalas. Abu reikalingi. Agentų ekosistema tik su atvira galimybe gąsdina saugumo komandas ir žmonės yra nulaužiami. Agentų ekosistema tik su uždara galimybe žudo inovaciją ir koncentruoja galią.

Garsiausias kontrargumentas HN šiuo metu yra tai, kad nėra apkaso. “Visi turės savo OpenClaw versiją per 18 mėnesių.” “Kas savaitę atsiranda naujų.” “Galite tiesiogine prasme paprašyti Codex sukurti supaprastintą versiją per naktį.” Kodas nėra toks sudėtingas. Idėja nėra tokia nauja. Bet kas gali tai pakartoti.

Jie tikriausiai teisūs dėl viso to. Ir jie praleidžia esmę.

Būtent taip nutiko su Linux. Branduolys nebuvo magija. Atsirado dešimtys distribucijų. Bet kas galėjo jį forkinti. Bet Linux vis tiek laimėjo, nes apkasas niekada nebuvo kodas. Tai buvo bendruomenė, ekosistema, bendras pagreitis. Ta pati dinamika vyksta čia. OpenClaw 180 000 GitHub žvaigždučių, jo įgūdžių prekyvietė, integracijos, dokumentacija, tūkstančiai žmonių, šiuo metu kuriančių ant jo: to nepakartosi promptindamas Codex per naktį.

Turėtume būti skaidrūs dėl to, kur stovime. Mes talpiname OpenClaw agentus. Programinės įrangos kūrėjas, ant kurios mūsų verslas pastatytas, ką tik prisijungė prie kompanijos, kuri greičiausiai kurs uždarą alternatyvą. Turime interesų šiame žaidime ir visas priežastis būti šališkiems.

Štai kodėl manome, kad atvira pusė vis tiek laimi: paprastai laimi. Net Microsoft valdo Linux didžiojoje dalyje Azure šiandien. Atviras kodas yra saugesnis, nes tūkstančiai akių audituoja kodą. Jis prisitaikantis, nes bet kas gali jį išplėsti. Ir jis pergyvena korporatyvinius planus, nes jokia viena kompanija jo nekontroliuoja. Fondas reiškia, kad OpenClaw lieka atviro kodo, modelio-agnostinis ir valdomas bendruomenės. Mūsų interesai suderinti su kiekvieno kito žmogaus ir kompanijos, kuriančios ant jo. Tai nėra interesų konfliktas. Tai visa atviro kodo esmė.

Momentas

Prieš trejus metus ChatGPT padarė AI pokalbinį. Jis galėjo su jumis kalbėtis.

Šiandien OpenClaw daro AI operacinį. Jis gali veikti už jus.

Steinbergerio prisijungimas prie OpenAI nereiškia, kad OpenClaw yra absorbuojamas. Tai reiškia, kad asmeninių AI agentų koncepcija pereina nuo “įdomaus atviro kodo projekto” prie “pagrindinio strateginio prioriteto didžiausiai AI kompanijai planetoje.”

Lex Fridman podcaste Fridman tai pavadino “agentinio AI revoliucijos pradžia”, palygindamas su ChatGPT paleidimu 2022 metais. Skirtumas yra tas, kad šį kartą revoliucija yra apie AI perkėlimą nuo kalbos prie veiksmo. Nuo teksto generavimo prie dalykų atlikimo.

Galbūt duopolis formuojasi. Galbūt tai susiklostys kitaip. Bet štai kas daro šį paradigmos pokytį neįprastą: atviras variantas atėjo pirmas. Linux atėjo dešimtmečiais po Windows. Android atėjo metais po iPhone. Atvira alternatyva visada turėjo vytis. Šį kartą atvira pusė turi 180 000 žvaigždučių, fondą ir bendruomenę, kuri buvo čia prieš OpenAI įžengiant į kambarį.

Klausimas bus ne ar visi turės asmeninį AI agentą. Klausimas bus ar jūsiškis yra atviras ar uždaras.