Poniższy artykuł stanowi podsumowanie i analizę pierwszego dnia z serii „12 Days of OpenAI”, podczas której firma OpenAI, każdego dnia (w dni robocze) prezentuje nowe osiągnięcia, narzędzia i rozwiązania związane z AI. Dzięki temu cyklowi OpenAI chce pokazać, nad czym intensywnie pracowała w ostatnich miesiącach i przedstawić społeczności użytkowników najnowsze innowacje.
Pierwsze ogłoszenia dotyczą wprowadzenia modelu o nazwie o1 (czyt. „o jeden”) oraz nowego wariantu subskrypcji „ChatGPT Pro”. Wśród głównych zmian wyróżniają się poprawiona inteligencja i szybkość modelu, nowe tryby obliczeniowe, a także zwiększoną funkcjonalność w zakresie multimodalności, czyli przetwarzania nie tylko tekstu, ale i obrazu.
Nowy model o1: kolejny krok w kierunku AGI
Pierwszym i najważniejszym ogłoszeniem jest wprowadzenie modelu o1. Twórcy podkreślają, że model ten powstał w odpowiedzi na opinie użytkowników dotyczące wcześniejszej wersji, o1 Preview, która była dostępna dla wybranych subskrybentów. Poprzednia odsłona spotkała się z zainteresowaniem, lecz użytkownicy zwracali uwagę, że chcieliby więcej inteligencji, większą szybkość oraz lepsze radzenie sobie z rozmaitymi formatami danych, w tym z obrazami.
OpenAI podkreśla, że model o1 stanowi duży krok naprzód w stosunku do obecnych modeli, takich jak GPT-4. Wzrost „surowej inteligencji” w zakresie rozumienia i rozwiązywania złożonych problemów jest wyraźny, a wyniki testów prezentowane przez firmę wskazują na odczuwalną poprawę w dziedzinach takich jak matematyka, kodowanie, czy testy analityczne. Ważnym punktem jest tu zdolność do lepszego rozumienia kontekstu i łączenia różnych kompetencji w jednym modelu. W efekcie o1 może być traktowany jako wszechstronny asystent – zarówno dla naukowców i inżynierów, jak i twórców treści poszukujących pomocy w tworzeniu kompleksowych materiałów.
Szybkość, elastyczność i większa kontrola nad złożonością problemów
Jednym z częstych zarzutów użytkowników wobec modeli AI jest czas oczekiwania na odpowiedzi w sytuacjach, gdy zadanie nie jest szczególnie trudne. W przypadku wcześniejszej wersji (o1 Preview) zdarzało się, że model zastanawiał się zbyt długo nad prostymi pytaniami. W nowym o1 twórcy wprowadzili mechanizmy pozwalające dostosować „głębokość rozumowania” do złożoności problemu. Oznacza to, że przy prostych zadaniach reakcja modelu jest szybsza, co poprawia ogólny komfort korzystania z narzędzia.
Jednocześnie, gdy użytkownik dostarcza trudne zagadnienia – np. wymagające złożonej analizy matematycznej, chemicznej czy programistycznej – model potrafi zainwestować więcej czasu i mocy obliczeniowej w „myślenie”. Dzięki temu osoby, które wykorzystują AI do rozwiązywania skomplikowanych problemów, mogą liczyć na bardziej przemyślane, precyzyjne i trafne odpowiedzi.
Multimodalność w modelu o1
Kolejnym istotnym udoskonaleniem jest wprowadzenie możliwości multimodalnego wprowadzania danych. Oznacza to, że o1 potrafi przetwarzać nie tylko tekst, ale również obrazy. W praktyce pozwala to na dostarczanie modelowi danych wizualnych (np. schematów, rysunków, fotografii) i proszenie go o interpretację, analizę lub wykorzystanie tych informacji do rozwiązania zadania. Na przykład, jeśli użytkownik wgra zdjęcie szkicu przedstawiającego hipotetyczne rozwiązanie problemu inżynieryjnego, model może zinterpretować ten obraz i wykonać obliczenia, szacując parametry (np. wymaganą powierzchnię chłodzenia w próżni kosmicznej dla centrum danych).
Multimodalność otwiera drzwi do szerokiej gamy nowych zastosowań – od edukacji, przez badania naukowe, aż po kreatywne projekty artystyczne. Połączenie analizy obrazu z rozumieniem tekstu pozwala modelowi o1 stać się bardziej uniwersalnym narzędziem, zdolnym do kompleksowej analizy danych o różnej naturze.
Model o1 dla płatnych kont użytkowników ChatGPT Plus jest w tym momencie ograniczony do 25 zapytań na 72h.
ChatGPT Pro: nowa subskrypcja dla najbardziej wymagających
Drugim ważnym punktem pierwszego dnia „12 Days of OpenAI” jest wprowadzenie nowej subskrypcji ChatGPT Pro. Ta kosztująca 200 dolarów miesięcznie oferta skierowana jest do najbardziej zaawansowanych, a zarazem wymagających użytkowników, którzy potrzebują stałego i nieograniczonego dostępu do najnowocześniejszych modeli, takich jak o1.
Co wyróżnia ChatGPT Pro?
- Nielimitowany dostęp do modeli: Użytkownicy Pro nie będą musieli martwić się limitami wykorzystania w ciągu miesiąca.
- Dostęp do specjalnego trybu o1 Pro Mode: Jest to wersja modelu o1 z jeszcze większą mocą obliczeniową i możliwością głębszej analizy złożonych problemów. Tryb ten został stworzony z myślą o najbardziej zaawansowanych przypadkach użycia, takich jak skomplikowane badania, projekty naukowe czy analizy rynkowe.
- Zaawansowana obsługa głosu (Advanced Voice Mode): Użytkownicy otrzymują także rozszerzone możliwości wprowadzania i odbierania danych głosowych, co dodatkowo upraszcza komunikację z modelem.
Inną istotną zaletą ChatGPT Pro jest większa niezawodność i wyższy poziom „pewności” odpowiedzi. Deweloperzy podkreślają, że choć modele takie jak o1 już cechują się wysoką dokładnością, to tryb Pro Mode gwarantuje jeszcze lepszą jakość wyników, co z kolei przekłada się na oszczędność czasu i lepsze rezultaty w pracach badawczych czy komercyjnych.
Narzędzia dla twórców i programistów
OpenAI zapowiedziało również, że w najbliższych dniach planuje wprowadzić kolejne funkcje, które szczególnie ucieszą deweloperów i osoby tworzące aplikacje oparte na sztucznej inteligencji. Wspomniano o przyszłych udoskonaleniach w zakresie funkcji API, takich jak obsługa structured outputs (strukturalizowanych wyników), function calling (bezpośrednie wywoływanie funkcji) oraz szersze możliwości wykorzystania obrazów w ramach API.
Nowe możliwości mają ułatwić życie programistom integrującym AI w swoich produktach. Wyobraźmy sobie na przykład aplikację, która przyjmuje zapytanie tekstowe oraz zdjęcie i w odpowiedzi generuje gotowy raport. Dzięki udoskonaleniom w modelu o1, narzędzia do tego typu zadań staną się łatwiejsze w implementacji, bardziej wydajne i precyzyjne.
Dlaczego te zmiany są ważne?
Wprowadzone innowacje można interpretować jako kolejny etap dojrzewania branży AI. Z jednej strony OpenAI skupia się na zwiększaniu dostępności potężnych modeli dla jak najszerszego grona użytkowników – zarówno hobbystów, jak i profesjonalistów. Z drugiej strony, nowa oferta ChatGPT Pro i tryb o1 Pro Mode wychodzą naprzeciw oczekiwaniom najbardziej wymagających grup klientów, dla których niezawodność i wydajność przekładają się bezpośrednio na wartość biznesową i naukową.
Integracja obrazu i tekstu w jednym modelu to ważny krok w kierunku bardziej uniwersalnej sztucznej inteligencji. Dzięki temu specjaliści z wielu dziedzin – od inżynierii przez nauki przyrodnicze po badania rynku – mogą korzystać z AI jako z inteligentnego, wielofunkcyjnego asystenta. W dłuższej perspektywie może to doprowadzić do powstania nowych standardów, w których inteligentne modele staną się powszechnie wykorzystywanym narzędziem w edukacji, biznesie i nauce.
OpenAI zapowiada, że to dopiero początek „12 Days of OpenAI”. W kolejnych dniach firma ma zamiar prezentować nowe rozwiązania, uzupełniające i rozwijające to, co zostało pokazane pierwszego dnia. Mają to być zarówno niespodzianki dla deweloperów, jak i użytkowników końcowych, którzy korzystają z ChatGPT i innych narzędzi firmy.
W miarę rozwoju cyklu możemy spodziewać się ujawnienia kolejnych funkcji, usprawnień i integracji. Być może zobaczymy ulepszenia w dziedzinach takich jak bezpieczeństwo i etyka stosowania AI, kolejne tryby analizy danych czy możliwości automatyzacji zadań, które dotychczas wymagały intensywnego zaangażowania człowieka.