Twórca OpenClaw dołącza do OpenAI

Peter Steinberger, twórca OpenClaw, właśnie ogłosił, że dołącza do OpenAI, by “pracować nad udostępnieniem agentów wszystkim.” Sam Altman potwierdził tę informację, mówiąc, że Steinberger będzie “napędzał kolejną generację osobistych agentów.” OpenClaw przechodzi pod zarząd fundacji.

Wiadomość jest już wszędzie: TechCrunch, CNBC, Bloomberg, The Register. Oto, co naszym zdaniem to sygnalizuje o kierunku, w jakim zmierza branża agentów AI.

Kim naprawdę jest Peter Steinberger

Peter Steinberger (@steipete) to austriacki programista, który studiował informatykę na Politechnice Wiedeńskiej. Zanim powstał OpenClaw, spędził 13 lat budując PSPDFKit, framework PDF używany wewnętrznie przez Apple, przez Dropbox, DocuSign i SAP, i na miliardzie urządzeń.

Założył PSPDFKit w 2011 roku, czekając na amerykańską wizę pracowniczą, na którą czekał sześć miesięcy. To, co zaczęło się jako poboczny projekt, by zabić czas, przekształciło się w produkt korporacyjny. Finansował go samodzielnie przez 13 lat, rozbudował zespół do 70 osób i nie przyjął żadnego zewnętrznego finansowania, dopóki Insight Partners nie zainwestował 100 milionów euro w 2021 roku. Steinberger wycofał się niedługo potem.

Potem zniknął na trzy lata. Wypalenie zawodowe po 13 latach pracy w każdy weekend. Mówił o tym otwarcie: terapia, podróże, przeprowadzka do innego kraju, próba zrozumienia, co przychodzi po tym, co Cię definiowało.

Pod koniec 2024 roku zaczął znowu programować. Nauczył się nowoczesnego tworzenia stron internetowych, opanował React i TypeScript i zaczął budować. Nie firmę. Projekt eksperymentalny. Osobistego asystenta AI podłączonego do WhatsApp.

Ten eksperymentalny projekt stał się Clawdbotem. Potem Moltbotem (po tym, jak odezwali się prawnicy Anthropic). Potem OpenClaw. Zgromadził ponad 180 000 gwiazdek na GitHub, zrodził Moltbook (sieć społecznościową z prawie 3 milionami agentów AI jako użytkownikami) i stał się najszybciej rosnącym projektem open source w historii GitHub. W ciągu około dwóch miesięcy.

Jako samotny programista.

Pierwszy programista 100x?

The Pragmatic Engineer sportretował Steinbergera pod nagłówkiem “I ship code I don’t read.” Liczby są oszałamiające: ponad 6600 commitów w samym styczniu. Rozwijał i dostarczał w tempie, które wygląda jak zespół inżynieryjny średniej wielkości startupu.

Jego sekret to nie 20-godzinne dni pracy. Uruchamia od 5 do 10 agentów kodujących AI jednocześnie, utrzymuje kontrolę architektoniczną i deleguje implementację w całości. Opisuje to jako “inżynierię agentyczną”, odróżniając ją od tego, co nazywa “vibe codingiem” (co, jak przyznaje, robi po 3 w nocy i żałuje rano).

Wątek na Hacker News jest pełen osób odrzucających go jako “vibe codera”, który miał szczęście. To ujęcie mija się z sednem sprawy. Steinberger nie jest kimś, kto przypadkowo stał się viralowy. To sprawdzony twórca produktów z 13-letnim doświadczeniem w dostarczaniu oprogramowania korporacyjnego, który odkrył, że agenty AI mnożą jego i tak wyjątkową produktywność o kolejny rząd wielkości. To, co zbudował, stało się viralowe, bo działało. A działało, bo osoba, która to budowała, operowała na tym poziomie od ponad dekady.

Jest być może najwybitniejszym przykładem nowego sposobu tworzenia oprogramowania. I nie skończy się na oprogramowaniu. Ten sam wzorzec, jedna osoba z głęboką wiedzą domenową orkiestrująca agentów AI w celu pomnożenia swojej produktywności, powtórzy się w marketingu, designie, badaniach i każdej innej dziedzinie, gdzie ekspertyza liczy się bardziej niż liczba ludzi.

Wielki duopol agentów

Dlaczego więc największa firma AI na świecie potrzebuje tej osoby? To pytanie prowadzi nas w interesujące miejsce.

Jest Linux i jest Windows. Jest Android i jest iOS. Każdy wielki paradygmat komputerowy ostatecznie ustabilizował się w strukturze dwóch obozów: jeden otwarty, jeden zamknięty. Jeden dla majsterkowiczów, jeden dla konsumentów. Oba ogromne. Oba konieczne.

Peter Thiel pisał o tym w Zero to One. Jego argument dotyczący Coca-Coli i Pepsi: w duopolu każdy gracz ma faktycznie monopol na swój własny segment. Coca-Cola ma monopol na wszystkich pijących Coca-Colę. Pepsi ma monopol na wszystkich pijących Pepsi. Rynek jest ogromny dla obu, a żaden nie niszczy drugiego.

Wraz z tym ruchem uważamy, że agenty AI stoją u progu swojego momentu Linux i Windows (albo iOS i Android, jeśli Pan/Pani woli).

Argumentowaliśmy już wcześniej, że OpenClaw jest już Linuxem tej przestrzeni. Jest open source. Działa, gdzie chcesz. Dane należą do Ciebie. Wybierasz model. Możesz czytać kod, forkować go, rozszerzać lub wdrażać na własnej infrastrukturze. Ma najszybciej rosnącą społeczność open source w historii i bazę programistów obejmującą od hobbystów po przedsiębiorstwa.

A teraz OpenAI właśnie zatrudniło osobę, która to zbudowała, powierzając jej stworzenie “następnej generacji osobistych agentów.” Oświadczenie Altmana jest jednoznaczne: “Przyszłość będzie wyjątkowo multiagentowa.”

Jest cyniczne odczytanie, które warto uznać. Kilku komentatorów HN zinterpretowało to jako zagrywkę marketingową: OpenAI kupiło hype, zablokowało konkurencję przed przejęciem i stworzyło narrację, że budowanie na ich platformie może prowadzić do zmieniających życie rezultatów. Jeden komentator ujął to dosadnie: “OpenAI kupiło marketing i teraz nikt inny nie może kupić OpenClaw i odciąć przychodów OpenAI.” To prawdopodobnie też jest prawda. Te dwa odczytania nie wykluczają się wzajemnie. OpenAI może jednocześnie kupować marketing i pozyskiwać prawdziwą ekspertyzę.

Tak czy inaczej, pytanie brzmi, co OpenAI faktycznie zbuduje. Nie byli szczególnie “open” od czasu GPT-3. A logika biznesowa wskazuje na zamknięty model: OpenClaw jest agnostyczny wobec modeli. Użytkownicy mogą podłączyć Anthropic, Google lub dowolnego innego dostawcę. To świetne dla użytkowników, ale nie dla firmy, która sprzedaje tokeny API. Zamknięty produkt agentowy, ściśle zintegrowany z własnymi modelami OpenAI, rozwiązuje ten problem.

Sam Steinberger porównał to do Chrome’a i Chromium. Zanim zaakceptował ofertę, powiedział dziennikarzom, że zgodzi się tylko jeśli OpenClaw pozostanie open source, wyraźnie powołując się na ten model zarządzania. To wymowna analogia. Chrome jest zbudowany na Chromium. Google przyczynia się do projektu open source, jednocześnie dostarczając komercyjny produkt z własnościowymi funkcjami, integracjami i dopracowaniem. Projekt open source zyskuje zasoby i kontrybutorów. Produkt komercyjny zyskuje sprawdzony silnik.

Najlepszy scenariusz wyglądałby właśnie tak. Utrzymanie otwartego rdzenia OpenClaw, pozwolenie Steinbergerowi dalej nad nim pracować i zbudowanie dopracowanego produktu konsumenckiego na wierzchu. Takiego, który jest głęboko zintegrowany z modelami, infrastrukturą i marką OpenAI. Zoptymalizowanego dla osoby, która nigdy nie otworzyła terminala. Osoby, którą Steinberger opisał jako “moja mama.” Ale historia daje powody do ostrożności. Założyciele Instagrama odeszli z Meta w 2018 roku, gdy obiecana im niezależność wyparowała. Zuckerberg ostatecznie potraktował wzrost Instagrama jako zagrożenie i pozbawił go zasobów. Założyciele WhatsApp mieli jeszcze gorzej. Jan Koum i Brian Acton sprzedali Facebookowi z obietnicą niezależności skupionej na prywatności, a potem patrzyli, jak Facebook naciskał na integrację danych i reklamy. Acton zrezygnował z 850 milionów dolarów nienabytych akcji, mówiąc: “Sprzedałem prywatność moich użytkowników. Żyję z tym każdego dnia.” Następnie współzałożył Signal Foundation.

Polisą ubezpieczeniową Steinbergera jest fundacja. To różnica między tym a Instagramem. Nie ma przejęcia do cofnięcia. OpenClaw istnieje niezależnie, niezależnie od tego, co dzieje się wewnątrz OpenAI. Jeśli współpraca zadziała, obie strony skorzystają. Jeśli nie, projekt open source żyje dalej, zarządzany przez społeczność, a nie przez roadmapę OpenAI.

Jeśli tak się to potoczy, byłyby dwa obozy. Otwarty i zamknięty. Majsterkowicze i konsumenci. Oba ogromne. Oba konieczne.

Dlaczego OpenAI nie zbudowało tego wcześniej

To pytanie, nad którym warto się zastanowić. OpenAI miało jedne z najlepszych modeli na świecie. Mieli największą bazę użytkowników. Mają ChatGPT, Codex i teraz Frontier. Dlaczego nie zbudowali osobistego agenta AI jako pierwsi?

Prawdopodobnie z dwóch powodów.

Po pierwsze, budowanie modelu i budowanie agenta to zasadniczo różne problemy. Model otrzymuje tekst i produkuje tekst. Agent otrzymuje intencję i produkuje rezultaty. Agent musi przeglądać internet, zarządzać plikami, wysyłać wiadomości, komunikować się z API, obsługiwać błędy, utrzymywać pamięć między sesjami i robić to wszystko bezpiecznie. Model to mózg. Agent to mózg plus ciało plus osąd, by wiedzieć, kiedy działać, a kiedy pytać. OpenAI jest wyjątkowe w budowaniu mózgów. Ale Steinberger zbudował ciało. Opracował integrację z komunikatorami, orkiestrację narzędzi, system umiejętności, hierarchię pamięci i automatyzację przeglądarki.

Po drugie, i być może ważniejsze: bezpieczeństwo i odpowiedzialność prawna. Autonomiczny agent, który może wykonywać polecenia powłoki, wysyłać wiadomości w Pana/Pani imieniu i uzyskiwać dostęp do danych osobowych, stanowi ogromną powierzchnię ataku. Niezależny programista open source może coś takiego wypuścić i pozwolić użytkownikom zdecydować, z czym czują się komfortowo. OpenAI, z ich marką, nadzorem regulacyjnym i setkami milionów użytkowników, nie może sobie pozwolić na szybkie działanie i psucie rzeczy, gdy “rzeczy” oznaczają czyjeś dane osobowe lub konta finansowe. Steinberger udowodnił, że koncept działa i że ludzie tego chcą. Teraz OpenAI może budować na tym dowodzie z zabezpieczeniami, jakich potrzebuje firma tej wielkości.

Jeśli taka jest logika, to jest acqui-hire w najczystszej postaci. OpenAI zyskuje osobę, która rozwiązała trudny problem, którego oni jeszcze nie rozwiązali. A projekt open source zyskuje fundację, stałe wsparcie i wolność wspierania każdego modelu, nie tylko tych od OpenAI.

Co to oznacza dla reszty z nas

Obawy dotyczące bezpieczeństwa są realne. Badacze znaleźli 341 złośliwych umiejętności na ClawHub, a Cisco stwierdziło, że OpenClaw to “koszmar bezpieczeństwa.” Andrej Karpathy nazwał to “jedną z najbardziej niesamowitych, przypominających sci-fi rzeczy bliskich momentu startu”, jakie widział, a kilka dni później nazwał to “pożarem na śmietniku.” Oba stwierdzenia były prawdziwe w tym samym czasie.

Właśnie dlatego duopol ma znaczenie.

Otwarty obóz będzie szedł szybko, łamał rzeczy i przesuwał granice możliwości. Zamknięty obóz będzie szedł wolniej, stawiał bezpieczeństwo na pierwszym miejscu i czynił agentów dostępnymi dla osób, które nie wiedzą, czym jest terminal. Oba są potrzebne. Ekosystem agentów z wyłącznie otwartą opcją przeraża zespoły bezpieczeństwa i naraża ludzi na hakowanie. Ekosystem agentów z wyłącznie zamkniętą opcją zabija innowację i koncentruje władzę.

Najgłośniejszy kontrargument na HN w tej chwili brzmi, że nie ma fosy obronnej. “Każdy będzie miał swoją wersję OpenClaw w ciągu 18 miesięcy.” “Co tydzień pojawiają się nowe.” “Można dosłownie poprosić Codex o zbudowanie okrojonej wersji z dnia na dzień.” Kod nie jest aż tak złożony. Pomysł nie jest aż tak nowatorski. Każdy może go powtórzyć.

Prawdopodobnie mają rację we wszystkim. I tracą z oczu sedno.

Dokładnie tak stało się z Linuxem. Jądro nie było magiczne. Pojawiły się dziesiątki dystrybucji. Każdy mógł je sforkować. Ale Linux i tak wygrał, bo fosą nigdy nie był kod. Była nią społeczność, ekosystem, wspólny impet. Ta sama dynamika rozgrywa się tutaj. 180 000 gwiazdek GitHub OpenClaw, jego rynek umiejętności, integracje, dokumentacja, tysiące ludzi, którzy teraz na nim budują: tego nie da się powtórzyć, prosząc Codex z dnia na dzień.

Powinniśmy być transparentni co do naszej pozycji. Hostujemy agentów OpenClaw. Twórca oprogramowania, na którym zbudowana jest nasza firma, właśnie dołączył do firmy, która najprawdopodobniej zbuduje zamkniętą alternatywę. Mamy skórę w tej grze i wszelkie powody, by być stronniczymi.

Oto dlaczego uważamy, że otwarta strona i tak wygrywa: zazwyczaj tak jest. Nawet Microsoft uruchamia Linuxa na większości Azure dzisiaj. Open source jest bezpieczniejsze, bo tysiące oczu audytuje kod. Jest bardziej elastyczne, bo każdy może je rozszerzyć. I przetrwa korporacyjne roadmapy, bo żadna pojedyncza firma go nie kontroluje. Fundacja oznacza, że OpenClaw pozostaje open source, pozostaje agnostyczny wobec modeli i jest zarządzany przez społeczność. Nasze interesy są zbieżne z interesami każdej innej osoby i firmy budującej na nim. To nie jest konflikt interesów. To jest cały sens open source.

Moment

Trzy lata temu ChatGPT uczynił AI konwersacyjną. Mogła z Panem/Panią rozmawiać.

Dziś OpenClaw czyni AI operacyjną. Może działać w Pana/Pani imieniu.

Dołączenie Steinbergera do OpenAI nie oznacza, że OpenClaw jest wchłaniany. Oznacza, że koncepcja osobistych agentów AI przechodzi od “interesującego projektu open source” do “kluczowego priorytetu strategicznego największej firmy AI na świecie.”

W podkaście Lexa Fridmana Fridman nazwał to “początkiem rewolucji agentycznej AI,” porównując do premiery ChatGPT w 2022 roku. Różnica polega na tym, że tym razem rewolucja dotyczy przejścia AI od języka do działania. Od generowania tekstu do załatwiania spraw.

Może duopol się formuje. Może potoczy się inaczej. Ale oto, co czyni tę zmianę paradygmatu niezwykłą: otwarta opcja pojawiła się pierwsza. Linux pojawił się dekady po Windows. Android pojawił się lata po iPhonie. Otwarta alternatywa zawsze musiała nadrabiać. Tym razem otwarta strona ma 180 000 gwiazdek, fundację i społeczność, która była tu, zanim OpenAI weszło do pokoju.

Pytanie nie będzie brzmieć, czy każdy będzie miał osobistego agenta AI. Pytanie będzie brzmieć, czy Pana/Pani agent będzie otwarty czy zamknięty.