Molecule.one z sukcesem zastosowało GPT 5.4 dla ulepszenia rekacji chemicznej

Sztuczna inteligencja coraz częściej pomaga naukowcom w matematyce, fizyce czy biologii. Jednak chemia organiczna stawia jej szczególnie twardy warunek: nie wystarczy dobrze rozumować. Hipoteza musi przetrwać kontakt z realnym laboratorium, odczynnikami, aparaturą i eksperymentalnym chaosem. OpenAI wspólnie z Molecule.one sprawdziło, czy model GPT 5.4 może wejść głębiej w proces badawczy. Efekt? AI pomogła poprawić trudną reakcję chemiczną ważną dla chemii medycznej.

Spis treści

Dlaczego chemicy przejmują się jedną reakcją

Badana reakcja to sprzęganie Chan Lam. Dla niespecjalisty brzmi to jak techniczny detal, ale dla chemików medycznych może oznaczać różnicę między cząsteczką, którą da się zbadać, a cząsteczką, która pozostaje tylko pomysłem na papierze.

Sprzęganie Chan Lam pozwala tworzyć wiązania węgiel azot. Takie wiązania często występują w małocząsteczkowych lekach. Problem polega na tym, że reakcja nie działa równie dobrze dla wszystkich typów związków.

Szczególnie kłopotliwe były sulfonamidy pierwszorzędowe łączone z kwasami boronowymi. Sulfonamidy pojawiają się w lekach stosowanych między innymi w onkologii, chorobach zakaźnych i jako diuretyki. Są więc cenne, ale ich użycie w tej konkretnej wersji reakcji historycznie dawało niskie wydajności.

A w chemii wydajność ma znaczenie. Jeżeli reakcja daje mało produktu albo dużo produktów ubocznych, badacze tracą czas, materiał i często rezygnują z obiecujących cząsteczek.

GPT 5.4 dostał otwarty cel

OpenAI połączyło GPT 5.4 z systemem Maria od Molecule.one. Maria to agentowa platforma chemiczna zintegrowana z wysokoprzepustowym laboratorium, czyli miejscem, gdzie można prowadzić tysiące małych eksperymentów równolegle.

Model nie dostał gotowej odpowiedzi. Otrzymał szerokie zadanie: poprawić jedną z ważnych klas reakcji chemicznych. Naukowcy przygotowali prompty sterujące i oceniające, a system wygenerował oraz uszeregował tysiące możliwych propozycji badawczych.

Chemicy wybrali cztery najlepsze pomysły do testów laboratoryjnych. Najciekawszy okazał się projekt OAI M1 03.

Zaskakujący dodatek: TEMPO

W projekcie OAI M1 03 GPT 5.4 wskazał sulfonamidy pierwszorzędowe jako trudną, ale wartościową klasę substratów. Następnie zaproponował użycie łagodnych utleniaczy, w tym TEMPO, aby poprawić wyniki sprzęgania Chan Lam.

Dla chemików była to sugestia zaskakująca i interesująca. Nie chodziło o oczywistą zmianę warunków reakcji, lecz o pomysł, który trzeba było sprawdzić na dużej liczbie przykładów.

Maria AI przekształciła wysokopoziomowy plan w konkretne instrukcje laboratoryjne. Ludzie nadal ingerowali w proces, ale głównie na poziomie kontroli i korekt. Największą zmianą było uniknięcie DMSO jako rozpuszczalnika, ponieważ chemicy obawiali się, że może reagować z silniejszymi utleniaczami używanymi jako porównanie.

10 080 reakcji w trzy miesiące

Cały proces trwał trzy miesiące. Rozpoczął się od pierwszego promptu 4 marca, a 4 czerwca wyniki OAI M1 03 zostały przekazane niezależnym ekspertom.

W dwóch cyklach eksperymentalnych Maria Lab przeprowadziło łącznie 10 080 reakcji. OpenAI porównuje tę skalę do pracy chemika, który wykonuje trzy reakcje dziennie przez ponad dekadę.

To ważne, bo chemia lubi płatać figle. Reakcja może wyglądać świetnie na jednej parze substratów, a potem zawieść przy szerszym zestawie cząsteczek. Tysiące eksperymentów pozwoliły sprawdzić nie tylko to, czy TEMPO działa, ale też gdzie działa lepiej, gdzie słabiej i jak wypada na tle innych dodatków.

System przetestował dziesięć utleniaczy. Po pierwszej rundzie danych zaproponował bardziej ukierunkowaną drugą rundę eksperymentów. Jednym z praktycznych wniosków było to, że TEMPO można zastąpić tańszym analogiem, 4 hydroksy TEMPO, przy niewielkiej utracie skuteczności.

Wyniki: więcej produktu, więcej użytecznych reakcji

Po optymalizacji warunków wydajność poprawiła się dla 88 procent testowanych kwasów boronowych i 83 procent sulfonamidów. Średnia wydajność wzrosła z 16,6 procent do 25,2 procent.

Jeszcze ciekawszy jest wzrost liczby reakcji przekraczających próg 30 procent wydajności. Przed optymalizacją było to 15,6 procent przypadków. Po optymalizacji 37,5 procent.

Dla chemika medycznego taka różnica może być bardzo praktyczna. Nie każda reakcja musi być idealna, ale musi dawać wystarczająco dużo produktu, by można było iść dalej: oczyścić związek, zbadać go i porównać z innymi kandydatami.

Czy wynik przetrwał poza mikroskalą

Wysokoprzepustowe eksperymenty prowadzi się w bardzo małej skali. To świetne do szybkiego testowania, ale pojawia się pytanie: czy wynik nie jest artefaktem mikrolitrowego formatu?

Dlatego chemicy powtórzyli reprezentatywne reakcje ręcznie, w klasycznej skali laboratoryjnej. Wynik był obiecujący. Wydajność wzrosła dla 11 z 14 par substratów, a w ośmiu przypadkach wzrost był ponad dwukrotny.

To nie kończy sprawy, ale wzmacnia wiarygodność odkrycia. Bench scale validation, czyli walidacja przy stole laboratoryjnym, jest standardowym krokiem przed pełniejszą publikacją wyników naukowych.

AI nie działała sama

OpenAI określa projekt jako niemal autonomiczny, ale nie w pełni autonomiczny. To ważne rozróżnienie.

GPT 5.4 proponował idee, projektował eksperymenty, analizował dane i wskazywał kolejne hipotezy. Maria AI przekładała plany na instrukcje laboratoryjne i prowadziła wysokoprzepustowe testy. Ludzie wybierali propozycje, nadzorowali proces, poprawiali szczegóły eksperymentalne, obsługiwali część prac laboratoryjnych i niezależnie sprawdzali końcowy wynik.

To nie jest opowieść o AI zastępującej naukowców. To raczej przykład nowego układu pracy: model, wyspecjalizowany agent, automatyczne laboratorium i chemicy działają w jednej pętli badawczej.

Co z pozostałymi pomysłami

W ciągu trzymiesięcznego projektu testowano nie tylko OAI M1 03. Spośród czterech propozycji wygenerowanych przez GPT 5.4 i wybranych do badań, OAI M1 02 oraz OAI M1 04 również zostały eksperymentalnie potwierdzone w Maria Lab. OAI M1 01 zostało obalone.

To szczególnie ciekawe, bo pokazuje normalny rytm nauki. Nie każda hipoteza działa. Wartość systemu nie polega więc na nieomylności, ale na szybkim generowaniu sensownych, testowalnych pomysłów i uczeniu się z wyników.

Eksperci patrzą z zainteresowaniem

Preprint opisujący OAI M1 03 został oceniony przez czterech zewnętrznych ekspertów chemii. Według OpenAI ich oceny wspierały tezę, że wynik jest nowy i wart pokazania społeczności naukowej.

Tim Cernak, Associate Professor of Medicinal Chemistry na University of Michigan, ujął to krótko: „The merger of high throughput experimentation and modern AI represents a new frontier of scientific discovery”.

To trafne podsumowanie. Siłą projektu nie jest pojedynczy algorytm ani pojedynczy robot laboratoryjny. Siłą jest połączenie: AI generuje hipotezy, laboratorium szybko je sprawdza, a ludzie nadają kierunek i kontrolują jakość.

Ograniczenia, których nie wolno pomijać

OpenAI wyraźnie zaznacza, że ten wynik nie dowodzi, iż AI potrafi samodzielnie prowadzić program badawczy od początku do końca. Potrzebna była specjalistyczna infrastruktura, nadzór chemików i ręczna walidacja.

Nie wiadomo też jeszcze, jak szeroko metoda zadziała poza badanym zakresem. Trzeba sprawdzić więcej substratów, dokładniej poznać mechanizm działania dodatków, określić granice reakcji i odtworzyć wynik w niezależnych laboratoriach.

Są także kwestie bezpieczeństwa. OpenAI podkreśla, że projekt celowo ograniczono do legalnego i wartościowego problemu chemii medycznej. Badania nie dotyczyły toksyn, broni chemicznej ani projektowania szkodliwych związków. System miał zabezpieczenia, a ludzie kontrolowali, które propozycje trafiają do fizycznego laboratorium.

Dlaczego to może mieć znaczenie dla przyszłości leków

Odkrywanie leków często zaczyna się od pytania: jaką cząsteczkę warto przetestować? Ale zaraz potem pojawia się drugie, bardziej przyziemne pytanie: czy da się ją zrobić?

Lepsza synteza oznacza więcej cząsteczek do sprawdzenia. Więcej cząsteczek oznacza większą szansę na znalezienie obiecujących kandydatów. W tym sensie poprawienie jednej reakcji może mieć konsekwencje wykraczające poza samą reakcję.

Projekt OpenAI i Molecule.one pokazuje wczesny, ale konkretny obraz przyszłej pracy naukowej. AI nie tylko odpowiada na pytania. Może pomagać je formułować, testować i poprawiać. A gdy wynik trzeba sprawdzić w laboratorium, najlepiej działa nie sama, lecz razem z ludźmi.

To właśnie może być najważniejsza lekcja z tego eksperymentu: przyszłość chemii nie musi należeć ani do samotnego naukowca, ani do autonomicznej maszyny. Może należeć do dobrze zaprojektowanego zespołu, w którym człowiek i AI prowadzą badania szybciej, szerzej i z większą precyzją.

Częste pytania

Jak GPT 5.4 pomogło w poprawie reakcji chemicznej sprzęgania Chan Lam?

GPT 5.4, współpracując z systemem Maria od Molecule.one, zaproponowało nowe podejścia do trudnej reakcji, w tym użycie łagodnych utleniaczy, takich jak TEMPO, co poprawiło wydajność sprzęgania Chan Lam.

Dlaczego sulfonamidy pierwszorzędowe były problematyczne w badanej reakcji?

Sulfonamidy pierwszorzędowe, łączone z kwasami boronowymi, historycznie dawały niskie wydajności w reakcji sprzęgania Chan Lam, co stanowiło wyzwanie dla chemików medycznych.

Jakie były wyniki eksperymentów przeprowadzonych przez Maria Lab?

W ciągu trzech miesięcy przeprowadzono 10 080 reakcji, co doprowadziło do poprawy wydajności dla 88 procent testowanych kwasów boronowych i 83 procent sulfonamidów.

Czy wyniki eksperymentów były wiarygodne poza mikroskalą?

Tak, chemicy powtórzyli reprezentatywne reakcje w klasycznej skali laboratoryjnej, co potwierdziło wzrost wydajności dla 11 z 14 par substratów, wzmacniając wiarygodność odkrycia.

Jakie ograniczenia związane z badaniami podkreśla OpenAI?

OpenAI zaznacza, że wyniki nie dowodzą, iż AI może samodzielnie prowadzić badania, ponieważ wymagana była specjalistyczna infrastruktura, nadzór chemików oraz ręczna walidacja.