OpenAI, ogłosił premierę swojego najnowszego modelu językowego o nazwie ChatGPT o1. Nowa seria modeli AI została zaprojektowana tak, aby poświęcać więcej czasu na myślenie przed udzieleniem odpowiedzi, co pozwala im na rozwiązywanie bardziej złożonych problemów w nauce, kodowaniu i matematyce.
Przełom w rozumowaniu
ChatGPT o1 reprezentuje znaczący krok w kierunku sztucznej inteligencji o zdolnościach zbliżonych do ludzkiego myślenia. Dzięki zastosowaniu nowego algorytmu optymalizacji i specjalnie dobranego zestawu danych treningowych, model ten potrafi rozwiązywać skomplikowane zadania, które były poza zasięgiem jego poprzedników.
„Model jest zdecydowanie lepszy w rozwiązywaniu testów z matematyki na poziomie akademickim niż ja, a byłem studentem matematyki” – przyznaje Bob McGrew, dyrektor ds. badań w OpenAI. ChatGPT o1 osiągnął wynik w 89. percentylu w konkursach programistycznych Codeforces i zajął miejsce wśród 500 najlepszych studentów w kwalifikacjach do Amerykańskiej Olimpiady Matematycznej (AIME).
Nowa filozofia projektowania
W przeciwieństwie do poprzednich modeli, które były szkolone głównie na podstawie wzorców z danych treningowych, ChatGPT o1 został przeszkolony z wykorzystaniem uczenia ze wzmocnieniem. Ta technika pozwala modelowi uczyć się poprzez nagrody i kary, co skutkuje głębszym zrozumieniem i lepszymi umiejętnościami rozwiązywania problemów.
Jerry Tworek, lider zespołu badawczego OpenAI, podkreśla, że ChatGPT o1 „został przeszkolony przy użyciu zupełnie nowego algorytmu optymalizacji i nowego zestawu danych, specjalnie dostosowanego do jego potrzeb”. Dzięki temu model jest nie tylko bardziej precyzyjny, ale również mniej podatny na błędy i halucynacje.
Nie we wszystkich zadaniach jest lepszy…
ChatGPT o1-mini: Szybsza i tańsza alternatywa
Wraz z premierą ChatGPT o1, OpenAI wprowadza również ChatGPT o1-mini – mniejszą i tańszą wersję modelu. ChatGPT o1-mini doskonale radzi sobie w dziedzinach STEM, zwłaszcza w matematyce i kodowaniu, niemal dorównując pełnej wersji o1 w testach takich jak AIME i Codeforces. Jest to atrakcyjna opcja dla aplikacji, które wymagają zaawansowanego rozumowania bez konieczności posiadania szerokiej wiedzy ogólnej.
Dostępność i koszty
Użytkownicy ChatGPT Plus i Team otrzymują dostęp do ChatGPT o1-preview i ChatGPT o1-mini już dziś, podczas gdy użytkownicy Enterprise i Edu będą mogli korzystać z nich na początku przyszłego tygodnia. OpenAI planuje również udostępnić ChatGPT o1-mini wszystkim darmowym użytkownikom ChatGPT w najbliższej przyszłości.
Uwaga!, nawet dla płatnych użytkowników ChatGPT o1-preview w wersji bez API ma ograniczenia – 30 wiadomości na tydzień1 50 wiadomości to limit dla o1-mini!
Dla deweloperów, ChatGPT o1-preview jest dostępny w API w cenie 15 dolarów za milion tokenów wejściowych i 60 dolarów za milion tokenów wyjściowych. Dla porównania, GPT-4o kosztuje odpowiednio 5 i 15 dolarów. Jest więc około 3x droższy. Mimo wyższych kosztów, OpenAI argumentuje, że cena jest uzasadniona ze względu na przełomowe możliwości nowego modelu.
Interfejs bliski człowiekowi
Jednym z najbardziej zauważalnych aspektów o1 jest sposób, w jaki prezentuje swoje procesy myślowe. Model pokazuje krok po kroku, jak dochodzi do odpowiedzi, używając zwrotów takich jak „Zastanawiam się nad…” czy „Pozwól, że to przeanalizuję…”. Ma to na celu uczynienie interakcji z AI bardziej transparentną i zrozumiałą dla użytkownika.
Model w pewnych aspektach wydaje się bardziej ludzki niż poprzednie wersje. Choć wciąż nie jest to myślenie na poziomie człowieka, sposób prezentacji rozumowania jest krokiem w tym kierunku
Bob McGrew
Wyzwania i ograniczenia
Mimo imponujących zdolności, ChatGPT o1 ma swoje ograniczenia. Jest wolniejszy i droższy w użyciu niż GPT-4o, a jego wiedza ogólna o świecie jest mniej rozwinięta. Ze względów bezpieczeństwa, nie posiada również zdolności przeglądania internetu ani przetwarzania plików i obrazów. OpenAI podkreśla jednak, że jest to wersja „preview”, a dalsze prace nad usprawnieniem modelu trwają.
Krok w kierunku przyszłości
ChatGPT o1 jest ważnym elementem w dążeniu OpenAI do stworzenia autonomicznych systemów zdolnych do podejmowania decyzji i wykonywania działań na rzecz użytkownika. „Spędziliśmy wiele miesięcy pracując nad rozumowaniem, ponieważ uważamy, że jest to krytyczny przełom” – mówi McGrew. „Fundamentalnie, jest to nowa modalność dla modeli, aby móc rozwiązywać naprawdę trudne problemy”.