Nowa technika automatycznej klasyfikacji faz układów fizycznych może pomóc naukowcom w badaniu nowych materiałów. Kiedy woda zamarza, przechodzi z fazy ciekłej do stałej, co powoduje drastyczne zmiany w jej właściwościach, takich jak gęstość i objętość. Przejścia fazowe w wodzie są tak powszechne, że większość z nas nawet o nich nie myśli, ale przejścia fazowe w nowych materiałach lub złożonych układach fizycznych to ważny obszar badań. Aby w pełni zrozumieć te układy, naukowcy muszą być w stanie rozpoznawać fazy i wykrywać przejścia między nimi. Jednak jak kwantyfikować zmiany fazowe w nieznanym układzie, często nie jest jasne, zwłaszcza gdy dane są skąpe.
Nowatorskie podejście do fazowych diagramów
Naukowcy z MIT i Uniwersytetu w Bazylei w Szwajcarii zastosowali generatywne modele sztucznej inteligencji, opracowując nowy framework uczenia maszynowego, który automatycznie mapuje diagramy fazowe dla nowych układów fizycznych.
Ich podejście oparte na uczeniu maszynowym wspomaganym przez fizykę jest bardziej efektywne niż pracochłonne, manualne techniki opierające się na wiedzy teoretycznej. Co ważne, dzięki wykorzystaniu modeli generatywnych, nie wymaga ogromnych, oznakowanych zbiorów danych treningowych używanych w innych technikach uczenia maszynowego.
Taki framework może pomóc naukowcom w badaniu właściwości termodynamicznych nowych materiałów lub wykrywaniu splątania w układach kwantowych. Ostatecznie ta technika może umożliwić naukowcom autonomiczne odkrywanie nieznanych faz materii.
Wykrywanie przejść fazowych za pomocą AI
Przejścia fazowe, takie jak przejście materiału z przewodnika do nadprzewodnika, są przedmiotem szczególnego zainteresowania naukowców. Te przejścia można wykrywać, identyfikując „parametr porządkowy”, czyli wielkość, która jest ważna i oczekuje się, że ulegnie zmianie.
W przeszłości naukowcy polegali na wiedzy fizycznej, aby ręcznie budować diagramy fazowe. Jest to nie tylko żmudne dla złożonych systemów, ale także może być niemożliwe dla nieznanych systemów o nowych zachowaniach.
Ostatnio naukowcy zaczęli używać uczenia maszynowego do budowy klasyfikatorów, które mogą rozwiązywać to zadanie, ucząc się klasyfikować statystykę pomiarową jako pochodzącą z określonej fazy układu fizycznego.
Generatywne modele w służbie fizyki
Zespół z MIT wykazał, jak generatywne modele mogą być używane do rozwiązywania tego zadania klasyfikacyjnego znacznie bardziej efektywnie i w sposób zgodny z fizyką.
Modele generatywne, takie jak te, które napędzają ChatGPT i Dall-E, zazwyczaj działają, szacując rozkład prawdopodobieństwa pewnych danych, które wykorzystują do generowania nowych punktów danych, które pasują do tego rozkładu.
Jednak gdy dostępne są symulacje układu fizycznego za pomocą sprawdzonych technik naukowych, badacze otrzymują model jego rozkładu prawdopodobieństwa za darmo. Ten rozkład opisuje statystyki pomiarowe układu fizycznego.
Wiedza głębiej zakorzeniona w modelu
Wkład zespołu z MIT polega na tym, że ten rozkład prawdopodobieństwa również definiuje model generatywny, na którym można skonstruować klasyfikator. Wtykają oni model generatywny w standardowe formuły statystyczne, aby bezpośrednio skonstruować klasyfikator zamiast uczyć go na próbkach.
Ten generatywny klasyfikator może określić, w jakiej fazie znajduje się układ przy danym parametrze, takim jak temperatura czy ciśnienie. Ponieważ badacze bezpośrednio szacują rozkłady prawdopodobieństwa pomiarów z układu fizycznego, klasyfikator ma wiedzę o systemie.
Zastosowania w przyszłości
Naukowcy mogą również używać tego podejścia do rozwiązywania różnych zadań binarnej klasyfikacji w układach fizycznych, na przykład do wykrywania splątania w układach kwantowych czy określania, która teoria jest najlepsza do rozwiązania danego problemu. Mogą również lepiej zrozumieć i poprawić modele językowe, takie jak ChatGPT, identyfikując, jakie parametry należy dostroić, aby chatbot dawał najlepsze odpowiedzi.
W przyszłości badacze chcą również zbadać teoretyczne gwarancje dotyczące liczby pomiarów potrzebnych do skutecznego wykrywania przejść fazowych i oszacować ilość obliczeń, które to wymaga.
Prace te były częściowo finansowane przez Szwajcarską Narodową Fundację Nauki, MIT-Switzerland Lockheed Martin Seed Fund i MIT International Science and Technology Initiatives.
źródło: mit.edu