Andrej Karpathy to jedna z tych postaci, bez których trudno opowiedzieć historię nowoczesnej sztucznej inteligencji. Współzałożyciel OpenAI, były dyrektor ds. AI w Tesli, wykładowca Stanforda, a dziś twórca własnego start-upu edukacyjnego Eureka Labs. W tym artykule przyglądam się jego drodze, najgłośniejszym projektom i temu, dlaczego jego głos nadal kształtuje sposób, w jaki myślimy o uczeniu maszynowym.
Kim jest Andrej Karpathy
Andrej Karpathy urodził się w 1986 roku w Bratysławie, a jako nastolatek wyjechał z rodziną do Kanady. Doktorat obronił w 2015 roku na Uniwersytecie Stanforda pod opieką Fei-Fei Li, jednej z pionierek wizji komputerowej. Już w trakcie studiów dał się poznać jako autor wyjątkowo czytelnych tekstów technicznych i otwartego kodu. Jego osobista strona karpathy.ai pełni do dziś rolę wizytówki: zwięzły opis kariery, lista publikacji, linki do projektów i bloga, którym śledzi cała branża.
Co ciekawe, Karpathy nigdy nie ukrywał, że nauka uczenia maszynowego to dla niego pasja graniczna z hobby. Jeszcze jako doktorant prowadził kurs CS231n na Stanfordzie, czyli legendarny już wykład o sieciach konwolucyjnych w wizji komputerowej. Materiały do CS231n przez lata były punktem startu dla tysięcy inżynierów na całym świecie – również w Polsce.
OpenAI: pierwszy etap kariery Andreja Karpathy
W 2015 roku Karpathy dołączył do grona założycieli OpenAI jako research scientist. To był moment, kiedy laboratorium dopiero formułowało swoją misję: rozwijać sztuczną inteligencję ogólną w sposób bezpieczny i otwarty. Pracował tam nad uczeniem ze wzmocnieniem, modelami języka i generatywnymi sieciami neuronowymi. Ten okres ukształtował jego sposób myślenia – łączenie ambitnych celów badawczych z konkretnym, działającym kodem.
Po pięciu latach przerwy, w 2023 roku, Karpathy wrócił do OpenAI na krótki epizod, zanim ostatecznie postawił na własną drogę. Jeśli interesuje Cię szerszy kontekst tego, jak rozwija się ekosystem dużych modeli językowych, warto pamiętać, że wiele dzisiejszych standardów branżowych powstawało właśnie wtedy, w gronie pierwszych badaczy OpenAI.
Tesla i budowa Autopilota od podstaw
Najgłośniejszy zawodowo rozdział to lata 2017-2022, kiedy Andrej Karpathy kierował zespołem AI w Tesli i odpowiadał za rozwój systemu Autopilot oraz Full Self-Driving. Pod jego kierownictwem firma porzuciła klasyczne podejście oparte na radarze i mapach, stawiając na tzw. vision-only – czyli sieci neuronowe analizujące obraz z kamer w czasie rzeczywistym.
To była decyzja inżynieryjnie ryzykowna i finansowo kosztowna. Wymagała zbudowania całej infrastruktury danych, własnego superkomputera Dojo i procesów etykietowania wideo na ogromną skalę. Karpathy wielokrotnie tłumaczył tę filozofię na konferencjach Tesla AI Day, pokazując, że samochód autonomiczny to przede wszystkim problem percepcji, a nie reguł. Można powiedzieć, że jego zespół próbował nauczyć auto patrzeć na drogę tak, jak robi to człowiek – tylko z lepszym refleksem i bez ulegania emocjom.
Powrót do nauczania i narodziny Eureka Labs
W lipcu 2024 roku Karpathy ogłosił założenie Eureka Labs – firmy, którą sam opisuje jako „AI+Education company”. Pomysł jest prosty w opisie i trudny w realizacji: stworzyć szkołę, w której nauczyciel-człowiek projektuje materiały, a asystent AI prowadzi ucznia przez nie indywidualnie, dopasowując tempo i przykłady. Pierwszym kursem ma być LLM101n, czyli przewodnik po budowie własnego modelu językowego od zera.
To bardzo Karpathy’owska decyzja. Łączy dwa wątki, które przewijają się przez całą jego karierę: pracę nad fundamentami AI i obsesyjne tłumaczenie ich innym. W jednym z wpisów na platformie X napisał krótko o swojej filozofii edukacyjnej: „the goal is to make it easy for anyone to learn anything”. To zdanie dobrze oddaje ducha całego projektu.
Nowy rozdział: Dołączenie do Anthropic
Gdy wydawało się, że Karpathy w pełni poświęci się wyłącznie budowaniu własnego startupu, branżą wstrząsnęła kolejna niespodziewana wiadomość. Badacz oficjalnie ogłosił, że dołącza do zespołu Anthropic – twórców rodziny modeli Claude i głównych rywali OpenAI.
Dla wielu obserwatorów ten krok to inżynieryjny transfer roku. Anthropic od dawna słynie z rygorystycznego, czysto naukowego podejścia do kwestii bezpieczeństwa AI (AI safety) oraz doskonałej architektury mechanistycznej interpretowalności (wglądu w to, jak myślą sieci neuronowe). Połączenie unikalnych umiejętności Karpathy’ego w optymalizacji dużych modeli (czego dowodem były projekty takie jak nanoGPT) z zapleczem badawczym i mocą obliczeniową Anthropic może przynieść przełomowe rezultaty. Co istotne, Karpathy nie porzuca swoich edukacyjnych ambicji – zadeklarował, że praca nad rozwojem asystentów sztucznej inteligencji w nowym zespole będzie bezpośrednio wspierać misję Eureka Labs, tworząc synergię między najnowocześniejszymi modelami komercyjnymi a otwartą edukacją.
Najważniejsze osiągnięcia Andreja Karpathy w pigułce
Spróbujmy zebrać dorobek Karpathy’ego w bardziej uporządkowany sposób. Po pierwsze, jego prace badawcze nad opisywaniem obrazów językiem naturalnym – słynne Deep Visual-Semantic Alignments z 2014 roku to do dziś jedna z najczęściej cytowanych publikacji w obszarze łączenia wizji i języka. Po drugie, kurs CS231n, który stał się nieformalnym standardem nauczania głębokiego uczenia. Po trzecie, biblioteki i mini-projekty na GitHubie – od nanoGPT, czyli minimalistycznej implementacji modelu w stylu GPT, po micrograd, edukacyjną bibliotekę pokazującą, jak działa autograd w 100 liniach kodu.
Po czwarte wreszcie – jego seria wykładów na YouTube „Neural Networks: Zero to Hero„. To kilkanaście godzin nagrań, w których Karpathy buduje sieci neuronowe od pojedynczego neuronu do działającego transformera. Jeśli chcesz zrozumieć, jak działa GPT „od środka”, to prawdopodobnie najlepszy darmowy materiał, jaki istnieje. Wiele dzisiejszych workflowów wyrosło właśnie z idei popularyzowanych przez Karpathy’ego.
Dlaczego głos Karpathy’ego się liczy
W branży, w której hype potrafi przykryć fakty, Andrej Karpathy zachowuje rzadką cechę: mówi prosto i konkretnie. Nie obiecuje superinteligencji w przyszłym kwartale, ale nie udaje też, że nic ważnego się nie dzieje. Jego wpisy na X, posty na blogu i wykłady są często cytowane przez innych badaczy jako punkt odniesienia – również wtedy, gdy się z nimi nie zgadzają.
Ciekawym przykładem tego stylu jest jego niedawna wypowiedź dotycząca tzw. „vibe coding” – sposobu pracy z modelami językowymi, w którym programista bardziej opisuje intencję niż pisze kod linia po linii. Cytat krąży po sieci w wielu wariantach, ale sam Karpathy zwraca uwagę, że to wygodne podejście do prototypów, a nie sposób na produkcję. Tego typu trzeźwe komentarze sprawiają, że jego konto na platformie X czyta się jak nieformalny kompas po świecie modeli językowych.
Co dalej z Andrejem Karpathym
Trudno przewidzieć, jak ukształtuje się przyszłość Eureka Labs w obliczu jego zaangażowania w Anthropic. Edukacja to rynek, w którym łatwo o efektowne demo i trudno o trwały model biznesowy, ale teraz Karpathy zyskał bezpośredni dostęp do najnowocześniejszych laboratoriów badawczych na świecie. Jeśli komuś ma się udać realne zintegrowanie zaawansowanych modeli językowych z poważną dydaktyką, to właśnie jemu.







