Skapari OpenClaw gengur til liðs við OpenAI

Peter Steinberger, skapari OpenClaw, tilkynnti nýlega að hann gangi til liðs við OpenAI til að “vinna að því að koma umboðsmönnum til allra.” Sam Altman staðfesti þetta og sagði að Steinberger myndi “knýja næstu kynslóð persónulegra umboðsmanna.” OpenClaw verður flutt til sjálfseignarstofnunar.

Fréttirnar eru þegar alls staðar: TechCrunch, CNBC, Bloomberg, The Register. Hér er okkar sýn á hvað þetta segir okkur um framtíð gervigreindarumboðsmannaiðnaðarins.

Hver er Peter Steinberger í raun

Peter Steinberger (@steipete) er austurrískur forritari sem lærði tölvunarfræði við Tækniháskólann í Vín. Áður en OpenClaw var til eyddi hann 13 árum í að byggja PSPDFKit, PDF ramma sem Apple notar innanhúss, sem Dropbox, DocuSign og SAP nota, og sem keyrir á milljarði tækja.

Hann stofnaði PSPDFKit árið 2011, meðan hann beið eftir bandarísku atvinnuleyfi sem tók sex mánuði að berast. Aukaverkefni sem hófst til þess að drepa tímann varð að fyrirtækjavöru. Hann fjármagnaði það sjálfur í 13 ár, jók teymið í 70 manns og tók ekkert utanaðkomandi fjármagn þar til Insight Partners fjárfesti 100 milljónir evra árið 2021. Steinberger dró sig í hlé skömmu síðar.

Síðan hvarf hann í þrjú ár. Kulnun eftir 13 ára vinnu á hverri helgi. Hann hefur verið opinn um það: meðferð, ferðalög, flutningur til annars lands, tilraun til að komast að því hvað kæmi á eftir hlutnum sem skilgreindi hann.

Seint á árinu 2024 byrjaði hann aftur að forrita. Kenndi sér nútíma vefþróun, React og TypeScript og byrjaði að byggja. Ekki fyrirtæki. Leiksvæðisverkefni. Persónulegan gervigreindaraðstoðarmann tengdan WhatsApp.

Leiksvæðisverkefnið varð að Clawdbot. Síðan Moltbot (eftir að lögfræðingar Anthropic höfðu samband). Síðan OpenClaw. Það safnaði yfir 180.000 GitHub stjörnum, varð til Moltbook (samfélagsnet með tæplega 3 milljónum gervigreindarumboðsmanna sem notendum) og varð hraðast vaxandi opinn hugbúnaður í sögu GitHub. Á um tveimur mánuðum.

Sem einn forritari.

Fyrsti 100x forritarinn?

Pragmatic Engineer gerði grein fyrir Steinberger undir fyrirsögninni “I ship code I don’t read.” Tölurnar eru sláandi: yfir 6.600 innlegg í janúar einum. Byggt og afhent á hraða sem lítur út eins og hugbúnaðarteymi meðalstórs sprotafyrirtækis.

Leyndarmál hans eru ekki 20 stunda vinnudagar. Hann keyrir 5 til 10 gervigreindarforritaraumbðosmenn samtímis, heldur arkitektúrstýringu og framselur útfærslu algjörlega. Hann lýsir þessu sem “agentic engineering,” og aðgreinir það frá því sem hann kallar “vibe coding” (sem hann viðurkennir að gera eftir klukkan 3 á nóttunni og sjái eftir á morgnana).

Hacker News umræðan er full af fólki sem vísar honum á bug sem “vibe coder” sem átti heppni. Þessi túlkun missir af aðalatriðinu. Steinberger er ekki einhver sem rataði óvart á veiruvinsældir. Hann er sannreyndur vörubyggjari með 13 ára reynslu af afhendingu fyrirtækjahugbúnaðar sem uppgötvaði síðan að gervigreindarumboðsmenn margfalda afköstin hans, sem þegar voru óvenjuleg, um enn eitt stærðarstigið. Verkefnið hans varð veiruvinsælt vegna þess að það virkaði. Og það virkaði vegna þess að maðurinn sem byggði það hafði starfað á þessu stigi í yfir áratug.

Hann er hugsanlega mest áberandi dæmið um nýja leið til að byggja hugbúnað. Og það mun ekki staldra við hugbúnað. Sama mynstrið, ein manneskja með djúpa sérfræðiþekkingu sem stýrir gervigreindarumboðsmönnum til að margfalda framleiðni sína, mun endurtaka sig í markaðssetningu, hönnun, rannsóknum og öllum öðrum sviðum þar sem sérfræðiþekking skiptir meira máli en fjöldi starfsfólks.

Hin mikla tvíeinkastefna umboðsmanna

Svo hvers vegna þarf stærsta gervigreindafyrirtæki jarðar þennan mann? Þetta er spurningin sem leiðir okkur á áhugaverðan stað.

Það er Linux og það er Windows. Það er Android og það er iOS. Hvert stórt tölvunarparadigm hefur að lokum sest í tveggja flokka uppbyggingu: annar opinn, hinn lokaður. Annar fyrir nörda, hinn fyrir neytendur. Báðir gríðarstórir. Báðir nauðsynlegir.

Peter Thiel skrifaði um þetta í Zero to One. Sjónarmið hans um Coke og Pepsi: í tvíeinkastefnu hefur hvor aðili í raun einokun á sínum markhópi. Coke hefur einokun á öllum Coke-drekkurum. Pepsi hefur einokun á öllum Pepsi-drekkurum. Markaðurinn er gríðarstór fyrir báða og hvorugur eyðileggur hinn.

Með þessu skrefi teljum við að gervigreindarumboðsmenn séu að fá sinn Linux og Windows stund (eða iOS og Android, ef þið kjósið).

Við höfum haldið því fram áður að OpenClaw sé þegar Linux þessa sviðs. Það er opinn hugbúnaður. Hann keyrir hvar sem þið viljið. Þið eigið gögnin ykkar. Þið veljið módel ykkar. Þið getið lesið kóðann, afritað hann, stækkað hann eða keyrt hann á ykkar eigin innviðum. Hann hefur hraðast vaxandi opna hugbúnaðarsamfélagið í sögunni og þróunargrunn sem spannar frá áhugamönnum til fyrirtækja.

Og nú hefur OpenAI ráðið einmitt manneskjuna sem byggði hann, með það hlutverk að byggja “næstu kynslóð persónulegra umboðsmanna.” Yfirlýsing Altmans er skýr: “Framtíðin verður afar fjöl-umboðsleg.”

Vert er að viðurkenna kyníska túlkun. Nokkrir HN-athugendur túlkuðu þetta sem markaðsleik: OpenAI keypti eflingarfylgið, hindraði keppinauta frá kaupum og skapaði frásögn um að bygging á vettvangi þeirra geti leitt til lífsbreytandi árangurs. Einn athugandi orðaði það beint: “OpenAI keypti markaðssetningu og nú getur enginn annar keypt OpenClaw og lokað OpenAI tekjur út.” Það er líklega líka satt. Þessar tvær túlkanir útiloka ekki hvor aðra. OpenAI getur keypt markaðssetningu og öðlast raunverulega sérfræðiþekkingu á sama tíma.

Hvort sem er, spurningin er hvað OpenAI byggir raunverulega. Þeir hafa ekki verið sérstaklega “opnir” síðan GPT-3. Og viðskiptalógíkin bendir í lokaða átt: OpenClaw er módel-óháð. Notendur geta tengt Anthropic, Google eða hvaða annan þjónustuaðila sem er. Það er frábært fyrir notendur en ekki frábært fyrir fyrirtæki sem selur API tóka. Lokaður umboðsmannahugbúnaður, náið samþættur við eigin módel OpenAI, leysir þann vanda.

Steinberger sjálfur dró samlíkinguna við Chrome og Chromium. Áður en hann samþykkti sagði hann í viðtölum að hann myndi aðeins samþykkja ef OpenClaw héldi áfram sem opinn hugbúnaður og vísaði sérstaklega til þess stjórnunarmódels. Þetta er afhjúpandi samlíking. Chrome er byggt ofan á Chromium. Google leggur til opna hugbúnaðarverkefnisins á meðan þeir afhenda viðskiptavöru sem bætir við séreinkennlegum eiginleikum, samþættingum og frágangi. Opna hugbúnaðarverkefnið fær auðlindir og þátttakendur. Viðskiptavaran fær bardagaprófaða vél.

Besta niðurstaðan væri eitthvað á þann veg. Halda OpenClaw kjarnanum opnum, láta Steinberger halda áfram að vinna að honum og byggja fágaða neytendavöru ofan á hann. Eina sem er djúpt samþætt við módel, innviði og vörumerki OpenAI. Bjartsýni fyrir manneskjuna sem hefur aldrei opnað skipanalínu. Manneskjuna sem Steinberger lýsti sem “mamma mín.” En sagan gefur ástæður til varúðar. Stofnendur Instagram yfirgáfu Meta árið 2018 eftir að sjálfstæðið sem þeim var lofað guðnaði. Zuckerberg meðhöndlaði vöxt Instagram að lokum sem ógn og svelti það af auðlindum. Stofnendum WhatsApp farnast verr. Jan Koum og Brian Acton seldu til Facebook á loforði um friðhelgimiðað sjálfstæði og horfðu síðan á Facebook þrýsta á gagnasamþættingu og auglýsingar. Acton gekk frá 850 milljónum dollara í óáunnum hlutabréfum og sagði: “Ég seldi friðhelgi notenda minna. Ég lifi með því á hverjum degi.” Hann stofnaði síðan Signal Foundation.

Trygging Steinbergers er sjálfseignarstofnunin. Það er munurinn á þessu og Instagram. Engin yfirtaka er til að afturkalla. OpenClaw er til sjálfstætt sama hvað gerist inni hjá OpenAI. Ef sambandið virkar njóta báðir aðilar góðs. Ef ekki lifir opna hugbúnaðarverkefnið áfram, stýrt af samfélaginu, ekki af vegvísi OpenAI.

Ef þetta gengur eftir yrðu tvær fylkingar. Opin og lokuð. Nördar og neytendur. Báðar gríðarstórar. Báðar nauðsynlegar.

Hvers vegna OpenAI hafði ekki byggt þetta áður

Þetta er spurningin sem vert er að dveljast við. OpenAI átti meðal bestu módela heims. Þeir áttu stærstu notendagrunninn. Þeir eiga ChatGPT, Codex og nú Frontier. Hvers vegna byggðu þeir ekki persónulegan gervigreindarumboðsmann fyrst?

Líklega af tveimur ástæðum.

Í fyrsta lagi: að byggja módel og að byggja umboðsmann eru grundvallarólík vandamál. Módel tekur við texta og framleiðir texta. Umboðsmaður tekur við ásetningi og framleiðir niðurstöður. Umboðsmaður þarf að vafra um vefinn, stjórna skrám, senda skilaboð, eiga samskipti við API, meðhöndla villur, viðhalda minni þvert á lotur og gera allt þetta á öruggan hátt. Módelið er heilinn. Umboðsmaðurinn er heilinn plús líkaminn plús dómgreindin til að vita hvenær á að bregðast við og hvenær á að spyrja. OpenAI er framúrskarandi í að byggja heila. En Steinberger byggði líkamann. Hann þróaði skilaboðasamþættinguna, verkfærastýringuna, hæfnikerfið, minnisstigveldið og vafrasjálfvirknikuna.

Í öðru lagi, og kannski mikilvægara: öryggi og ábyrgð. Sjálfstýrður umboðsmaður sem getur keyrt skipanalínuskipanir, sent skilaboð í þínu nafni og nálgast persónuleg gögn þín er gríðarlegt áhættuyfiborð. Einstaklingur í opnum hugbúnaði getur afhent slíkt og látið notendur ákveða hvað þeim finnst viðunandi. OpenAI, með vörumerki sínu, eftirliti frá yfirvöldum og hundruðum milljóna notenda, hefur ekki efni á að fara hratt og brjóta hluti þegar “hlutir” þýðir persónuleg gögn eða fjárhagsreikninga fólks. Steinberger sannaði að hugmyndin virkar og að fólk vilji hana. Nú getur OpenAI byggt á þeirri sönnun með þeim öryggisráðstöfunum sem fyrirtæki á þeirra stærðarskala þarfnast.

Ef þetta er rökfræðin er um acqui-hire í hreinustu merkingu að ræða. OpenAI fær manneskjuna sem leysti erfiða vandamálið sem þeir höfðu ekki leyst. Og opna hugbúnaðarverkefnið fær sjálfseignarstofnun, áframhaldandi styrk og frelsið til að styðja öll módel, ekki bara frá OpenAI.

Hvað þetta þýðir fyrir okkur hin

Öryggisáhyggjurnar eru raunverulegar. Rannsakendur fundu 341 illgjarn hæfni á ClawHub og Cisco komst að þeirri niðurstöðu að OpenClaw sé “öryggismartröð.” Andrej Karpathy kallaði þetta “eitt af ótrúlegustu sci-fi takeoff-nálægu hlutunum” sem hann hefði séð, og nokkrum dögum síðar kallaði hann þetta “ruslaíldsbruna.” Báðar fullyrðingarnar voru sannar á sama tíma.

Einmitt þess vegna skiptir tvíeinkastefnan máli.

Opni flokkurinn mun fara hratt, brjóta hluti og ýta mörkum þess sem er mögulegt. Lokaði flokkurinn mun fara hægar, forgangsraða öryggi og gera umboðsmenn aðgengilega fólki sem veit ekki hvað skipanalína er. Báða þarf. Umboðsmannavistkerfi með aðeins opnum valkosti hryllir öryggisteymin og fólk verður tölvusnáprað. Umboðsmannavistkerfi með aðeins lokuðum valkosti drepur nýsköpun og þjappar saman valdi.

Hávæðasta gagnrökin á HN núna er að enginn varnargröftur sé til. “Allir munu hafa sína eigin útgáfu af OpenClaw innan 18 mánaða.” “Nýjar koma vikulega.” “Þú getur bókstaflega beðið Codex um að byggja minna útgáfu á nóttinni.” Kóðinn er ekki svo flókinn. Hugmyndin er ekki svo ný. Hver sem er getur endurskapað hana.

Þeir hafa líklega rétt fyrir sér í öllu þessu. Og þeir missa af aðalatriðinu.

Þetta er nákvæmlega það sem gerðist með Linux. Kjarninn var ekki galdur. Tugir dreifinga komu fram. Hver sem er gat afritað hann. En Linux sigraði samt, vegna þess að varnargröfturinn var aldrei kóðinn. Það var samfélagið, vistkerfið, sameiginlegt skriðþunga. Sama aflfræðin er að spila sér út hér. 180.000 GitHub stjörnur OpenClaw, hæfnimarkaðurinn þess, samþættingar þess, skjöl þess, þúsundir manna sem byggja á því núna: þetta er ekki eitthvað sem þú endurskapar á nóttinni með Codex leiðbeiningum.

Við eigum að vera gagnsæ um hvar við stöndum. Við hýsum OpenClaw umboðsmenn. Skapari hugbúnaðarins sem fyrirtæki okkar byggir á gekk nýlega til liðs við fyrirtækið sem mest líklegt er að byggi lokaðan valkostinn. Við höfum persónulega hagsmuni í þessu og allar ástæður til að vera hlutdræg.

Hér er hvers vegna við teljum að opna hliðin vinni samt: hún gerir það yfirleitt. Jafnvel Microsoft keyrir Linux á meirihluta Azure í dag. Opinn hugbúnaður er öruggari vegna þess að þúsundir auga endurskoða kóðann. Hann er sveigjanlegri vegna þess að hver sem er getur stækkað hann. Og hann lifir lengur en vegvísar fyrirtækja vegna þess að ekkert eitt fyrirtæki stjórnar honum. Sjálfseignarstofnunin þýðir að OpenClaw heldur áfram sem opinn hugbúnaður, heldur áfram að vera módel-óháður og er stýrt af samfélaginu. Hagsmunir okkar eru í samræmi við alla aðra einstaklinga og fyrirtæki sem byggja á honum. Þetta er ekki hagsmunaárekstur. Þetta er allur tilgangur opins hugbúnaðar.

Augnablikið

Fyrir þremur árum gerði ChatGPT gervigreind samræðuhæfa. Hún gat talað við þig.

Í dag gerir OpenClaw gervigreind rekstrarhæfa. Hún getur aðhafst fyrir þig.

Steinberger sem gengur til liðs við OpenAI þýðir ekki að OpenClaw sé verið að gleypa. Það þýðir að hugmyndin um persónulega gervigreindarumboðsmenn er að útskrifast frá “áhugaverðu opna hugbúnaðarverkefni” yfir í “kjarnastefnumótandi forgang stærsta gervigreindafyrirtækis jarðar.”

Á Lex Fridman þáttaröð kallaði Fridman þetta “upphaf umboðsmannalegrar gervigreindarbyltingarinnar” og bar saman við setningu ChatGPT á markað árið 2022. Munurinn er sá að í þetta sinn snýst byltingin um að færa gervigreind frá tungumáli til aðgerða. Frá því að búa til texta til þess að koma hlutum í verk.

Kannski er tvíeinkastefnan að myndast. Kannski þróast hún á annan veg. En hér er það sem gerir þessa hugmyndabreytingu óvenjulega: opni valkosturinn kom fyrst. Linux kom áratugum eftir Windows. Android kom árum eftir iPhone. Opni valkosturinn þurfti alltaf að ná í. Í þetta sinn hefur opna hliðin 180.000 stjörnur, sjálfseignarstofnun og samfélag sem var hér áður en OpenAI kom inn í herbergið.

Spurningin verður ekki hvort allir eigi persónulegan gervigreindarumboðsmann. Hún verður hvort þinn sé opinn eða lokaður.