Znaczącym elementem sukcesu Google’a było udowodnienie, że AI jest zdolne do przeprowadzenia procesu rozumowania, niezbędnego w matematyce.
System Deep Mind Google’a zdołał osiągnąć znaczący postęp w jednym z najtrudniejszych testów dla AI – geometrii. Przyjrzymy się, jak dokładnie to osiągnięcie zostało zrealizowane i dlaczego jest to tak ważne.
Naukowcy z Google Deepmind AI opublikowali obszerny dokument na ten temat na łamach magazynu Nature.
Tworzenie syntetycznych danych
Zacznijmy od podstawowego problemu, z którym zmierzył się Google, czyli braku odpowiednich danych do treningu AI. W obliczu tego wyzwania, zespół Google’a poszedł innowacyjną drogą, tworząc syntetyczne dane. W praktyce oznaczało to generowanie pół miliarda diagramów geometrycznych oraz stu milionów dowodów matematycznych. To podejście umożliwiło AI nauczenie się rozwiązywania problemów geometrycznych, bez konieczności korzystania z już istniejących danych.
Zastosowanie hybrydowego modelu AI
Kolejnym krokiem było połączenie dwóch metod inżynierii AI – metod symbolicznych i sieci neuronowych (neural network). Metody symboliczne są to starsze metody AI, które działają na zasadach logiki i wiedzy, wymagając zestawu reguł do rozwiązywania problemów. Więcej na temat metod symbolicznych dowiesz się z podcastów Prof. Ryszarda Tadeusiewicza, który trzykrotnie był rektorem Akademii Górniczo-Hutniczej. Sieci neuronowe, z drugiej strony, skupiają się na rozpoznawaniu wzorców i mogą działać w bardziej kreatywny sposób, nie opierając się wyłącznie na sztywnych regułach.
Hybrydowy model AI Google’a, AlphaGeometry, wykorzystuje zarówno symboliczne rozumowanie, jak i statystyczne przewidywania oparte na modelu językowym, aby efektywnie rozwiązywać problemy geometryczne. Te dwa podejścia były wykorzystywane w różnych momentach procesu:
Wykorzystanie modelu symbolicznego:
- Generowanie syntetycznych dowodów: Na początkowym etapie, model symboliczny był używany do generowania syntetycznych dowodów. Te dowody składały się z losowych sekwencji prostych, ale logicznie niepodważalnych kroków, takich jak „dane są dwa punkty A i B, skonstruuj kwadrat ABCD”. Tym samym umożliwiono modelowi AI uczenie się na podstawie szerokiego zakresu problemów geometrycznych, nie ograniczając go do ludzkich estetycznych uprzedzeń.
- Rozwiązanie standardowych problemów: Model symboliczny był także wykorzystywany do rozwiązywania standardowych problemów geometrycznych, szczególnie tam, gdzie rozwiązania mogły być osiągnięte przez stosowanie serii ustalonych, krok po kroku, algorytmów.
Wykorzystanie modelu językowego:
- Dostosowywanie do konstrukcji pomocniczych: Po wstępnym trenowaniu na syntetycznych dowodach, model językowy został dostosowany do podzbioru dowodów, które wymagały dodatkowych konstrukcji. To pozwoliło modelowi lepiej skupić się na zadaniu podczas wyszukiwania dowodów. Model językowy był stosowany, gdy wymagano kreatywności w tworzeniu nowych konstrukcji lub metod rozwiązania, które nie były bezpośrednio wynikiem zastosowania istniejących reguł geometrycznych.
- Rozwiązywanie trudniejszych problemów: W przypadkach bardziej skomplikowanych problemów geometrycznych, gdzie wymagane były dłuższe dowody i bardziej złożone konstrukcje, model językowy był kluczowym elementem. Wykorzystanie modelu językowego pozwoliło na tworzenie dłuższych i bardziej złożonych dowodów, co było konieczne do rozwiązania trudniejszych problemów, takich jak te z IMO (Międzynarodowej Olimpiady Matematycznej).
Ta hybrydowa metoda pozwoliła na efektywne rozwiązywanie problemów geometrycznych, wykorzystując logiczne myślenie silnika symbolicznego i kreatywność sieci neuronowych.
Wyniki testu IMO-AG-30
Test IMO-AG-30 to zestaw 30 zaawansowanych problemów geometrycznych, które są wykorzystywane do oceny wydajności i zdolności rozwiązywania problemów przez systemy sztucznej inteligencji (AI) i algorytmy komputerowe. Nazwa „IMO-AG-30” pochodzi od Międzynarodowej Olimpiady Matematycznej (International Mathematical Olympiad – IMO), która jest jednym z najbardziej prestiżowych konkursów matematycznych na świecie dla uczniów szkół średnich.
Metoda | Rozwiązane problemy (z 30) | |
---|---|---|
Algebra komputerowa | Metoda Wu (poprzedni stan techniki) | 10 |
Baza Gröbnera | 4 | |
Wyszukiwanie (podobne do ludzkiego) | GPT-4 | 0 |
Metoda pełnego kąta | 2 | |
Baza danych dedukcyjna (DD) | 7 | |
DD + heurystyki zaprojektowane przez człowieka | 9 | |
DD + AR (nasze) | 14 | |
DD + AR + pomocnicze konstrukcje GPT-4 | 15 | |
DD + AR + heurystyki zaprojektowane przez człowieka | 18 | |
AlphaGeometry | 25 | |
• Bez wstępnego trenowania | 21 | |
• Bez fine-tuningu | 23 |
Porównanie wyników na wykresie
Rozumowanie i analiza krytyczna – kluczowe aspekty sukcesu
Znaczącym elementem sukcesu Google’a było udowodnienie, że AI jest zdolne do przeprowadzenia procesu rozumowania, niezbędnego w matematyce. Ta zdolność do logicznego myślenia, analizy krytycznej, sprawdzania spójności i rozwiązywania sprzeczności ma ogromne znaczenie. Dzięki temu AI może być wykorzystywane nie tylko w matematyce, ale również w innych dziedzinach, takich jak inżynieria, architektura, fizyka czy badania medyczne.
Obraz tytułowy autorstwa Freepik, a nie AI.