OpenAI ogłosiła premierę ChatGPT Agent. Jest to nowa funkcja w aplikacji ChatGPT, która pozwala modelowi sztucznej inteligencji samodzielnie wykonywać złożone zadania na wirtualnym komputerze. Nowość została udostępniona 17 lipca 2025 roku dla użytkowników planów Pro, Plus i Team. ChatGPT Agent to autonomiczny system, który aktywnie działa w imieniu użytkownika. Co na przykład robi dokładnie? Klika, przeszukuje internet, analizuje pliki i tworzy prezentacje z poziomu jednego interfejsu.
Od Operatora do Agenta. Integracja rozwiązań OpenAI
Wprowadzenie ChatGPT Agent to efekt połączenia wcześniejszych narzędzi opracowanych przez OpenAI: Operatora oraz Deep Research. Operator umożliwiał użytkownikom zlecanie AI wykonania praktycznych zadań, takich jak tworzenie raportów, rezerwacje czy edycja dokumentów. Z kolei Deep Research specjalizował się w pogłębionej analizie informacji dostępnych w internecie. Oba rozwiązania były testowane oddzielnie, ale to właśnie ich integracja pozwoliła stworzyć agenta działającego jak zdalny pomocnik.
Poprzez ChatGPT Agent użytkownik może delegować złożone zadania AI w intuicyjny sposób. Wystarczy opisać: „Stwórz prezentację na podstawie tego raportu i wyślij ją e-mailem”. Agent ChatGPT wykona wszystkie kroki tego zadania, obsługując przy tym aplikacje, przeglądarkę i terminal wewnątrz specjalnie przygotowanego środowiska.

Co potrafi nowy agent?
ChatGPT Agent działa na wirtualnym komputerze, do którego ma dostęp wyłącznie użytkownik. Jak wspomnieliśmy wcześniej, agent może nie tylko przeszukiwać internet, ale również otwierać aplikacje, zarządzać plikami, korzystać z terminala czy edytować dokumenty. Jego zadania mogą obejmować m.in.:
- Tworzenie prezentacji na podstawie przesłanych danych lub wskazanych źródeł,
- Zarządzanie kalendarzem – np. wyszukiwanie dogodnych terminów i planowanie spotkań,
- Zakupy online – porównywanie ofert, wybór produktów i przygotowanie zamówienia (z potwierdzeniem użytkownika),
- Tworzenie arkuszy kalkulacyjnych i analiz danych,
- Wysyłanie e-maili z wcześniej przygotowaną treścią.
Agent może wykonać sekwencję kroków: przeszukać strony internetowe, pobrać pliki, przekształcić dane i dostarczyć użytkownikowi gotowy rezultat. W niektórych przypadkach użytkownik nadal musi jednak zatwierdzać niektóre działania.
Wirtualny komputer z pełną kontrolą użytkownika
ChatGPT Agent działa w odizolowanym środowisku tzw. wirtualnym komputerze. Wyposażono je w graficzną i tekstową przeglądarkę internetową, terminal, edytory dokumentów oraz możliwość korzystania z API. To właśnie w tym środowisku agent wykonuje zadania, krok po kroku, tak jak zrobiłby to człowiek przy własnym komputerze.
Użytkownik może w każdej chwili podglądać działania agenta za pomocą funkcji „replay”, czyli odtworzenia kolejnych kroków, które zostały podjęte w trakcie realizacji zadania. Wbudowane są również mechanizmy pozwalające przerwać działanie agenta lub zażądać potwierdzenia, jeśli ma on wykonać istotne lub nieodwracalne operacje (np. wysłanie wiadomości e-mail).
Zabezpieczenia przed nadużyciami
OpenAI podkreśla, że system wyposażono w zaawansowane zabezpieczenia, w tym ochronę przed tzw. prompt injection czyli próbami oszukania agenta przez spreparowane dane wejściowe. Wszystkie zadania realizowane są z zachowaniem prywatności użytkownika. Środowisko agenta nie ma bowiem dostępu do urządzenia lokalnego, plików osobistych ani aplikacji poza platformą OpenAI.
Dla kogo jest dostępny ChatGPT Agent?
ChatGPT Agent został udostępniony 17 lipca 2025 roku i obecnie jest dostępny dla użytkowników korzystających z płatnych planów: Pro, Plus oraz Team. Użytkownicy planu Pro mogą wykonać do 400 działań agenta miesięcznie, natomiast subskrybenci planów Plus i Team mają do dyspozycji po 40 akcji miesięcznie.
Funkcja będzie w kolejnych tygodniach stopniowo rozszerzana na inne grupy użytkowników, w tym klientów planów Enterprise oraz Education. OpenAI zapowiada również wprowadzenie agenta na rynki objęte regulacjami Unii Europejskiej i Europejskiego Obszaru Gospodarczego, choć konkretne daty nie zostały jeszcze ogłoszone.
Użytkownicy mogą aktywować nową funkcję poprzez interfejs ChatGPT, klikając w zakładkę „Actions” lub bezpośrednio wydając polecenie wymagające działania agenta.
Co już działa, a na co jeszcze trzeba poczekać?
Choć ChatGPT Agent to duży krok naprzód, jego możliwości nie są jeszcze w pełni rozwinięte. Obecnie agent nie działa w tle. Oznacza to, że nie można mu zlecić długoterminowego monitorowania czy cyklicznych zadań bez aktywnego udziału użytkownika. Ponadto realizacja bardziej złożonych projektów może zająć od 20 do 30 minut.
Kolejnym ograniczeniem jest konieczność potwierdzania niektórych kroków. Oczywiście z jednej strony zwiększa to bezpieczeństwo, ale z drugiej utrudnia pełną automatyzację. ChatGPT Agent nie posiada też jeszcze funkcji tworzenia harmonogramów czy zapamiętywania zadań na później.
Co dalej?
OpenAI zapowiada dalszy rozwój agenta pod kątem prędkości działania oraz elastyczności. Celem jest stworzenie systemu, który będzie mógł samodzielnie realizować złożone, powtarzalne procesy z minimalnym nadzorem człowieka. Firma zapowiada także wdrażanie rozwiązań umożliwiających tworzenie własnych agentów wyspecjalizowanych w konkretnych typach zadań.
W oczekiwaniu na wprowadzenie ChatGPT Agent w Europie i w Polsce, potencjalni użytkownicy już spekulują czy niedługo nie zobaczymy podobnego rozwiązania na przykład w Gemini.


