OpenClaw radītājs pievienojas OpenAI

Peter Steinberger, OpenClaw radītājs, tikko paziņoja, ka pievienojas OpenAI, lai “strādātu pie tā, lai aģenti būtu pieejami visiem.” Sam Altman to apstiprināja, sakot, ka Steinberger “virzīs nākamās paaudzes personālos aģentus.” OpenClaw pāriet uz fondu.

Stāsts jau ir visur: TechCrunch, CNBC, Bloomberg, The Register. Lūk, ko, mūsuprāt, tas signalizē par AI aģentu nozares virzību.

Kas patiesībā ir Peter Steinberger

Peter Steinberger (@steipete) ir Austrijas izstrādātājs, kurš studēja datorzinātnes Vīnes Tehnoloģiskajā universitātē. Pirms OpenClaw pastāvēšanas viņš 13 gadus veltīja PSPDFKit veidošanai, PDF ietvaram, ko iekšēji izmanto Apple, Dropbox, DocuSign un SAP, un kas darbojas uz miljarda ierīču.

Viņš nodibināja PSPDFKit 2011. gadā, gaidot ASV darba vīzu, kuras saņemšana aizņēma sešus mēnešus. Tas, kas sākās kā blakusprojekts laika kavēšanai, pārvērtās par uzņēmuma produktu. Viņš to bootstrapoja 13 gadus, izaudzēja komandu līdz 70 cilvēkiem un neņēma nevienu ārējo finansējumu, līdz Insight Partners 2021. gadā investēja 100 miljonus eiro. Steinberger atkāpās drīz pēc tam.

Tad viņš pazuda uz trim gadiem. Izdegšana pēc 13 gadiem darba katru nedēļas nogali. Viņš ir bijis atklāts par to: terapija, ceļošana, pārcelšanās uz citu valsti, mēģinājums saprast, kas nāk pēc lietas, kas tevi definēja.

gada beigās viņš atkal sāka programmēt. Apguva mūsdienīgu tīmekļa izstrādi, apguva React un TypeScript un sāka būvēt. Ne uzņēmumu. Rotaļprojektu. Personālu AI asistentu, kas savienots ar WhatsApp.

Šis rotaļprojekts kļuva par Clawdbot. Tad Moltbot (pēc tam, kad Anthropic juristi piezvanīja). Tad OpenClaw. Tas savāca vairāk nekā 180 000 GitHub zvaigžņu, uzsāka Moltbook (sociālo tīklu ar gandrīz 3 miljoniem AI aģentu kā lietotājiem) un kļuva par visstraujāk augošo atvērtā koda projektu GitHub vēsturē. Aptuveni divu mēnešu laikā.

Kā vientuļš izstrādātājs.

Pirmais 100x izstrādātājs?

Pragmatic Engineer profilēja Steinbergeru ar virsrakstu “Es piegādāju kodu, ko nelasu.” Skaitļi ir pārsteidzoši: vairāk nekā 6600 commitu tikai janvārī. Būvēja un piegādāja tempā, kas izskatās pēc vidējas stadijas startupa inženieru komandas.

Viņa noslēpums nav 20 stundu darba dienas. Viņš vienlaikus darbina no 5 līdz 10 AI kodēšanas aģentiem, saglabā arhitektūras kontroli un pilnībā deleģē implementāciju. Viņš to raksturo kā “aģentu inženieriju”, nošķirot to no tā, ko viņš sauc par “vibe kodēšanu” (ko viņš atzīst, ka dara pēc pulksten 3 naktī un no rīta nožēlo).

Hacker News pavediens ir pilns ar cilvēkiem, kas viņu noraida kā “vibe kodētāju”, kuram paveicās. Šis ietvars palaiž garām būtību. Steinberger nav kāds, kas nejauši kļuva virāls. Viņš ir pierādīts produktu veidotājs ar 13 gadu pieredzi uzņēmuma programmatūras piegādē, kurš tad atklāja, ka AI aģenti reizina viņa jau tā izcilo rezultātu par vēl vienu pakāpi. Lieta, ko viņš uzbūvēja, kļuva virāla, jo tā darbojās. Un tā darbojās, jo cilvēks, kas to būvēja, bija darbojies šādā līmenī vairāk nekā desmitgadi.

Viņš pašlaik, iespējams, ir visievērojamākais piemērs jaunam programmatūras būvēšanas veidam. Un tas neapstāsies pie programmatūras. Tas pats modelis, viens cilvēks ar dziļām jomas zināšanām, kas orķestrē AI aģentus sava rezultāta pavairošanai, izpaudīsies mārketingā, dizainā, pētniecībā un katrā citā jomā, kur ekspertīze ir svarīgāka par darbinieku skaitu.

Lielais aģentu duopols

Tad kāpēc lielākajam AI uzņēmumam uz planētas ir vajadzīgs šis cilvēks? Tas ir jautājums, kas mūs aizved interesantā virzienā.

Ir Linux un ir Windows. Ir Android un ir iOS. Katra lielā datošanas paradigma galu galā ir nostabilizējusies divu nometņu struktūrā: viena atvērta, otra slēgta. Viena meistariem, otra patērētājiem. Abas milzīgas. Abas nepieciešamas.

Peter Thiel par to rakstīja grāmatā Zero to One. Viņa arguments par Coca-Cola un Pepsi: duopolā katram spēlētājam faktiski ir monopols pār savu segmentu. Cola ir monopols pār visiem Cola dzērājiem. Pepsi ir monopols pār visiem Pepsi dzērājiem. Tirgus ir milzīgs abiem, un neviens neiznīcina otru.

Ar šo soli mēs uzskatām, ka AI aģentiem ir priekšā viņu Linux un Windows brīdis (vai iOS un Android, ja jums tā labāk patīk).

Mēs jau esam iepriekš apgalvojuši, ka OpenClaw jau ir šīs jomas Linux. Tas ir atvērtā koda. Tas darbojas tur, kur vēlaties. Jūs esat savu datu īpašnieks. Jūs izvēlaties savu modeli. Jūs varat lasīt kodu, forkot to, paplašināt vai izvietot savā infrastruktūrā. Tam ir vēsturē visstraujāk augošā atvērtā koda kopiena un izstrādātāju bāze, kas aptver gan hobijistus, gan uzņēmumus.

Un tagad OpenAI tikko pieņēma darbā cilvēku, kas to uzbūvēja, uzdodot viņam uzdevumu veidot “nākamās paaudzes personālos aģentus.” Altmana paziņojums ir nepārprotams: “Nākotne būs ārkārtīgi multi-aģenta.”

Ir cinisks lasījums, ko ir vērts atzīt. Vairāki HN komentētāji ierāmēja to kā mārketinga gājienu: OpenAI nopirka hype, bloķēja konkurentus no tā iegādes un radīja stāstījumu, ka būvēšana uz viņu platformas var novest pie dzīvi mainošiem rezultātiem. Viens komentētājs to izteica tieši: “OpenAI nopirka mārketingu, un tagad kāds cits nevar nopirkt OpenClaw un izslēgt OpenAI ieņēmumus.” Tas droši vien arī ir taisnība. Abi lasījumi nav savstarpēji izslēdzoši. OpenAI var pirkt mārketingu un iegūt patiesu ekspertīzi vienlaikus.

Jebkurā gadījumā jautājums ir, ko OpenAI patiesībā būvēs. Viņi nav bijuši īpaši “atvērti” kopš GPT-3. Un biznesa loģika norāda uz slēgto: OpenClaw ir modeļa-agnostisks. Lietotāji var pieslēgt Anthropic, Google vai jebkuru citu pakalpojumu sniedzēju. Tas ir lieliski lietotājiem, bet nav lieliski uzņēmumam, kas pārdod API tokenus. Slēgtā koda aģentu produkts, cieši integrēts ar OpenAI pašu modeļiem, atrisina šo problēmu.

Steinberger pats vilka paralēli ar Chrome un Chromium. Pirms piekrišanas viņš stāstīja žurnālistiem, ka piekritīs darījumam tikai tad, ja OpenClaw paliks atvērtā koda, tieši atsaucoties uz šo pārvaldības modeli. Tā ir atklājoša analoģija. Chrome ir būvēts virs Chromium. Google iegulda atvērtā koda projektā, vienlaikus piegādājot komerciālu produktu, kas pievieno patentētas funkcijas, integrācijas un noslīpējumu. Atvērtā koda projekts iegūst resursus un līdzautorus. Komerciālais produkts iegūst kaujās pārbaudītu dzinēju.

Labākais iznākums būtu kaut kas līdzīgs. Saglabāt OpenClaw kodolu atvērtu, ļaut Steinbergeram turpināt pie tā strādāt un uzbūvēt noslīpētu patērētāju produktu virsū. Tādu, kas ir dziļi integrēts ar OpenAI modeļiem, infrastruktūru un zīmolu. Optimizēts cilvēkam, kurš nekad nav atvēris termināli. Cilvēkam, kuru Steinberger raksturoja kā “mana mamma.”

Bet vēsture dod iemeslus piesardzībai. Instagram dibinātāji pameta Meta 2018. gadā pēc tam, kad solītā neatkarība iztvaikoja. Zuckerberg galu galā uzskatīja Instagram izaugsmi par draudu un liedza tam resursus. WhatsApp dibinātājiem gāja vēl sliktāk. Jan Koum un Brian Acton pārdeva Facebook ar privātuma un neatkarības solījumu, tad vēroja, kā Facebook spieda datu integrāciju un reklāmas. Acton aizgāja no 850 miljoniem dolāru neiegūtajās akcijās, sakot “Es pārdevu savu lietotāju privātumu. Es ar to dzīvoju katru dienu.” Viņš pēc tam līdzdibināja Signal Foundation.

Steinbergera apdrošināšanas polise ir fonds. Tā ir atšķirība starp šo un Instagram. Nav iegādes, ko atgriezt. OpenClaw pastāv neatkarīgi neatkarīgi no tā, kas notiek OpenAI iekšienē. Ja attiecības darbojas, iegūst abas puses. Ja nē, atvērtā koda projekts dzīvo tālāk, pārvaldīts kopienas, nevis OpenAI ceļveža vadībā.

Ja tas tā izspēlējas, jums būtu divas nometnes. Atvērtā un slēgtā. Meistari un patērētāji. Abas milzīgas. Abas nepieciešamas.

Kāpēc OpenAI to nebija uzbūvējis iepriekš

Šis ir jautājums, pie kura ir vērts pakavēties. OpenAI bija starp labākajiem modeļiem pasaulē. Viņiem bija lielākā lietotāju bāze. Viņiem ir ChatGPT, Codex un tagad Frontier. Kāpēc viņi pirmie neuzbūvēja personālu AI aģentu?

Divi iemesli, iespējams.

Pirmkārt, modeļa būvēšana un aģenta būvēšana ir fundamentāli atšķirīgas problēmas. Modelis saņem tekstu un ražo tekstu. Aģents saņem nodomu un ražo rezultātus. Aģentam ir jāpārlūko tīmeklis, jāpārvalda faili, jāsūta ziņojumi, jāsadarbojas ar API, jāapstrādā kļūdas, jāuztur atmiņa starp sesijām un jādara tas viss droši. Modelis ir smadzenes. Aģents ir smadzenes plus ķermenis plus spriedums zināt, kad rīkoties un kad jautāt. OpenAI ir izcils smadzeņu būvēšanā. Bet Steinberger uzbūvēja ķermeni. Viņš atrisināja ziņojumapmaiņas integrāciju, rīku orķestrēšanu, prasmju sistēmu, atmiņas hierarhiju, pārlūka automatizāciju.

Otrkārt, un varbūt svarīgāk: drošība un atbildība. Autonoms aģents, kas var izpildīt čaulas komandas, sūtīt ziņojumus jūsu vārdā un piekļūt jūsu personīgajiem datiem, ir milzīga riska virsma. Atsevišķs atvērtā koda izstrādātājs var to piegādāt un ļaut lietotājiem izlemt, ar ko viņi ir apmierināti. OpenAI ar savu zīmolu, regulatīvo uzraudzību un simtiem miljonu lietotāju nevar atļauties ātri virzīties un lauzt lietas, kad “lietas” nozīmē kāda personīgos datus vai finanšu kontus. Steinberger pierādīja, ka koncepcija darbojas un cilvēki to vēlas. Tagad OpenAI var būvēt uz šī pierādījuma ar aizsardzības mehānismiem, kas vajadzīgi viņu lieluma uzņēmumam.

Ja tā ir loģika, tas ir acqui-hire tīrākajā nozīmē. OpenAI iegūst cilvēku, kas atrisināja grūto problēmu, ko viņi vēl nebija atrisinājuši. Un atvērtā koda projekts iegūst fondu, pastāvīgu sponsorēšanu un brīvību atbalstīt katru modeli, ne tikai OpenAI.

Ko tas nozīmē pārējiem

Drošības bažas ir reālas. Pētnieki atrada 341 ļaunprātīgu prasmi ClawHub, un Cisco secināja, ka OpenClaw ir “drošības murgs.” Andrej Karpathy to nosauca par “vienu no neticamākajām sci-fi takeoff-adjacent lietām”, ko viņš redzējis, un pēc dažām dienām to nosauca par “atkritumu konteinera ugunsgrēku.” Abi apgalvojumi bija patiesi vienlaicīgi.

Tieši tāpēc duopols ir svarīgs.

Atvērtā nometne virzīsies ātri, lauzīs lietas un bīdīs iespējamā robežas. Slēgtā nometne virzīsies lēnāk, prioritizēs drošību un padarīs aģentus pieejamus cilvēkiem, kas nezina, kas ir terminālis. Abi ir vajadzīgi. Aģentu ekosistēma tikai ar atvērtu izvēli biedē drošības komandas un cilvēki tiek uzlauzti. Aģentu ekosistēma tikai ar slēgtu izvēli nogalina inovāciju un koncentrē varu.

Skaļākais pretarguments HN šobrīd ir tāds, ka nav aizsarggrāvja. “Visiem būs sava OpenClaw versija 18 mēnešu laikā.” “Katru nedēļu parādās jaunas.” “Jūs burtiski varat lūgt Codex uzbūvēt saīsinātu versiju pa nakti.” Kods nav tik sarežģīts. Ideja nav tik oriģināla. Jebkurš var to atkārtot.

Viņiem, iespējams, ir taisnība par visu to. Un viņi palaiž garām būtību.

Tieši tā notika ar Linux. Kodols nebija maģija. Parādījās desmitiem distribūciju. Jebkurš varēja to forkot. Bet Linux tik un tā uzvarēja, jo aizsarggrāvis nekad nebija kods. Tā bija kopiena, ekosistēma, dalītais impulss. Tā pati dinamika izpaužas šeit. OpenClaw 180 000 GitHub zvaigžņu, tā prasmju tirgus, integrācijas, dokumentācija, tūkstošiem cilvēku, kas pašlaik uz tā būvē: to nevar atkārtot, promptojot Codex pa nakti.

Mums jābūt caurskatāmiem par to, kur mēs stāvam. Mēs mitinām OpenClaw aģentus. Programmatūras radītājs, uz kuras mūsu bizness ir būvēts, tikko pievienojās uzņēmumam, kas visticamāk būvēs slēgto alternatīvu. Mums ir iesaiste šajā spēlē un katrs iemesls būt neobjektīviem.

Lūk, kāpēc mēs uzskatām, ka atvērtā puse tik un tā uzvar: parasti uzvar. Pat Microsoft darbina Linux lielākajā daļā Azure šodien. Atvērtais kods ir drošāks, jo tūkstošiem acu pārbauda kodu. Tas ir pielāgojamāks, jo jebkurš var to paplašināt. Un tas pārdzīvo korporatīvos ceļvežus, jo neviens uzņēmums to nekontrolē. Fonds nozīmē, ka OpenClaw paliek atvērtā koda, modeļa-agnostisks un kopienas pārvaldīts. Mūsu intereses ir saskaņotas ar katru citu personu un uzņēmumu, kas uz tā būvē. Tā nav interešu konflikts. Tā ir visa atvērtā koda būtība.

Brīdis

Pirms trim gadiem ChatGPT padarīja AI sarunu spējīgu. Tas varēja ar jums runāt.

Šodien OpenClaw padara AI operatīvu. Tas var rīkoties jūsu vietā.

Steinbergera pievienošanās OpenAI nenozīmē, ka OpenClaw tiek absorbēts. Tas nozīmē, ka personālo AI aģentu koncepcija absolvē no “interesanta atvērtā koda projekta” par “planētas lielākā AI uzņēmuma stratēģisko pamatprioritāti.”

Lex Fridman podkāstā Fridman to nosauca par “aģentu AI revolūcijas sākumu”, salīdzinot ar ChatGPT palaišanu 2022. gadā. Atšķirība ir tāda, ka šoreiz revolūcija ir par AI pārvietošanu no valodas uz darbību. No teksta ģenerēšanas uz lietu paveikšanu.

Varbūt duopols veidojas. Varbūt tas izspēlēsies citādi. Bet lūk, kas padara šo paradigmas maiņu neparastu: atvērtā iespēja nāca pirmā. Linux nāca gadu desmitiem pēc Windows. Android nāca gadiem pēc iPhone. Atvērtajai alternatīvai vienmēr bija jāpanāk. Šoreiz atvērtajai pusei ir 180 000 zvaigžņu, fonds un kopiena, kas bija šeit pirms OpenAI ienāca telpā.

Jautājums nebūs par to, vai visiem būs personāls AI aģents. Jautājums būs par to, vai jūsējais ir atvērts vai slēgts.