Ludzki genom to jak gigantyczna księga życia. Składa się z ponad trzech miliardów liter DNA, które zapisują instrukcje funkcjonowania naszego organizmu. Litery tu udało się wprawdzie odczytać już ponad dwadzieścia lat temu. Jednak ich pełne zrozumienie wciąż pozostaje jednym z największych wyzwań biologii. Co oznaczają drobne różnice między genomami różnych osób? Jak wpływają na zdrowie, rozwój, ryzyko chorób?Na te pytania próbują odpowiadać biologowie z całego świata, ale teraz z pomocą przychodzi im sztuczna inteligencja. Zespół Google DeepMind opracował bowiem nowy model AlphaGenome, który potrafi przewidywać wpływ nawet pojedynczych zmian w DNA na szereg procesów biologicznych.
Czym jest AlphaGenome?
AlphaGenome to następca słynnego AlphaFold czyli modelu, który nauczył się przewidywać strukturę białek i zrewolucjonizował badania nad nimi. Tym razem celem jest coś równie ambitnego: zrozumienie funkcji i znaczenia całych sekwencji DNA. Mowa tu także o tzw. niekodujących regionach, które mimo że nie tworzą białek, pełnią kluczową rolę w regulacji genów. Dzięki AlphaGenome naukowcy będą mogli szybciej i skuteczniej analizować działanie genomu i wpływ mutacji na zdrowie człowieka
Jak działa AlphaGenome?
AlphaGenome to zaawansowany model sztucznej inteligencji, który analizuje niezwykle długie sekwencje DNA – nawet do miliona „liter”, czyli par zasad. Jego zadaniem jest przewidywanie, jak konkretna sekwencja wpływa na funkcjonowanie genów. Dzięki temu możemy się dowiedzieć, jakie skutki mogą mieć pojedyncze zmiany tej sekwencji (warianty genetyczne). Innymi słowy, AlphaGenome działa jak wirtualne laboratorium, które potrafi zasymulować reakcje komórek na zmiany w DNA. Wszystko to bez potrzeby prowadzenia czasochłonnych eksperymentów.
Głębokie uczenie i transformery w orężu genetyki
AlphaGenome oparte jest na nowoczesnej architekturze tzw. transformerach (tej samej technologii, która napędza duże modele językowe, jak GPT). Ale zamiast tekstu, model uczy się wzorców i zależności w długich ciągach DNA. Na początkowym etapie wykorzystuje warstwy konwolucyjne do wychwytywania krótkich sekwencji i powtarzalnych motywów. Następnie, transformery umożliwiają „rozmowę” pomiędzy odległymi fragmentami DNA. Jest to kluczowe, ponieważ elementy regulujące geny mogą znajdować się bardzo daleko od samych genów.
Dzięki takiej architekturze AlphaGenome potrafi przewidywać wiele istotnych właściwości molekularnych. Gdzie zaczynają się i kończą geny? Jak są splicingowane (czyli przycinane i łączone)? Jak dużo RNA powstaje na ich podstawie? Czy dane miejsce w DNA jest dostępne dla białek regulatorowych? Oraz wiele innych.

Model został wytrenowany na ogromnych zbiorach danych pochodzących z międzynarodowych projektów, takich jak ENCODE czy GTEx. Dostarczyły one informacji na temat funkcjonowania genomów w różnych typach komórek. Co ciekawe, mimo swojej złożoności, AlphaGenome okazał się niezwykle wydajny. Jego trening trwał zaledwie cztery godziny i zużył tylko połowę zasobów potrzebnych do wytrenowania wcześniejszego modelu – Enformera.
Co wyróżnia AlphaGenome?
Na tle wcześniejszych modeli analizujących sekwencje DNA, AlphaGenome robi ogromny krok naprzód. Nie tylko łączy różne typy predykcji w jednym narzędziu, ale robi to z niespotykaną dotąd dokładnością i skalą. Co dokładnie sprawia, że ten model jest tak wyjątkowy?
Długi kontekst
Jedną z największych przewag AlphaGenome jest jego zdolność do analizy bardzo długich fragmentów DNA – aż do miliona par zasad – przy jednoczesnym zachowaniu precyzji na poziomie pojedynczej litery. To ważne, bo elementy regulujące geny często znajdują się daleko od samych genów. Wcześniejsze modele musiały wybierać między długością analizowanego fragmentu a dokładnością predykcji.
Multimodalność
AlphaGenome potrafi przewidzieć wiele różnych zjawisk biologicznych na podstawie jednej sekwencji DNA. Może wskazać, czy mutacja zwiększy ekspresję genu, zmieni jego wzorzec splicingu, czy wpłynie na dostępność fragmentu DNA dla białek regulatorowych. Dzięki temu naukowcy nie muszą już używać osobnych modeli do analizy różnych aspektów działania genomu. Bowiem AlphaGenome robi to wszystko naraz.
Szybka ocena mutacji
Co więcej, model potrafi błyskawicznie ocenić wpływ dowolnej zmiany w sekwencji DNA. Porównując przewidywania dla zmutowanej i niezmutowanej sekwencji, AlphaGenome wskazuje, jak dana mutacja zmienia funkcjonowanie genomu na poziomie molekularnym. To szczególnie ważne w badaniach nad chorobami rzadkimi i nowotworami, gdzie pojedyncza mutacja może mieć ogromne znaczenie.
Nowy wgląd w splicing
Po raz pierwszy model AI może też bezpośrednio przewidywać miejsca i intensywność splicingu czyli procesu niezwykle istotnego w kontekście wielu chorób genetycznych, takich jak rdzeniowy zanik mięśni czy niektóre postacie mukowiscydozy. AlphaGenome daje naukowcom nowe narzędzie do badania, jak zmiany w DNA wpływają na ten proces i jakie mogą mieć konsekwencje zdrowotne.
Dlaczego to ważne? Przełom dla badań genetycznych
AlphaGenome to narzędzie, które może radykalnie zmienić sposób prowadzenia badań nad genami, chorobami i leczeniem. Dzięki zdolności do szybkiej i precyzyjnej analizy wpływu mutacji, model ten otwiera nowe możliwości w wielu dziedzinach biologii i medycyny.

Diagnozowanie rzadkich chorób i nowotworów
W przypadku rzadkich chorób genetycznych i niektórych nowotworów, lekarze i badacze często mają do czynienia z niewielką liczbą pacjentów i unikalnymi, słabo poznanymi mutacjami. Tradycyjne metody identyfikacji przyczyny choroby mogą być czasochłonne i kosztowne. AlphaGenome pozwala błyskawicznie ocenić, które warianty genetyczne mogą rzeczywiście wpływać na funkcjonowanie komórki. Znacznie przyspiesza to diagnostykę i szukanie metod leczenia.
Przykładem może być białaczka limfoblastyczna T-komórkowa (T-ALL), w której AlphaGenome pomogło potwierdzić mechanizm aktywacji genu TAL1 przez konkretną mutację w niekodującej części DNA.
Nowe narzędzie dla biologii syntetycznej
AlphaGenome może również wspierać rozwój biologii syntetycznej – dziedziny, która projektuje sztuczne sekwencje DNA w celu tworzenia organizmów o pożądanych cechach. Przewidując, jak dana sekwencja będzie regulowana w różnych typach komórek, model może pomóc w konstruowaniu genów, które będą aktywne tylko w konkretnych warunkach, na przykład tylko w neuronach, a nie w mięśniach.
Przyspieszenie badań podstawowych
Wreszcie, AlphaGenome może znacznie przyspieszyć badania podstawowe, których celem jest zrozumienie, jak działa genom. Dzięki możliwościom modelu, naukowcy mogą szybciej mapować funkcjonalne elementy DNA i badać, które sekwencje są kluczowe dla działania konkretnych komórek. W rezultacie mogą lepiej zrozumieć, jak regulowane są geny i jakie mechanizmy kierują rozwojem, różnicowaniem czy odpowiedzią na bodźce środowiskowe.
Ograniczenia i kolejne wyzwania AlphaGenome
Jednym z wyzwań, które nadal stoją przed AlphaGenome, jest dokładne przewidywanie wpływu bardzo odległych elementów regulacyjnych czyli na przykład takich, które znajdują się ponad 100 tysięcy par zasad od danego genu. Choć model radzi sobie z analizą długich sekwencji, to uchwycenie wpływu tak dalekich interakcji biologicznych nadal wymaga wielu badań.

Wrażliwość na kontekst komórkowy
Innym ograniczeniem jest trudność w pełnym uwzględnieniu kontekstu komórkowego czyli tego, że ten sam fragment DNA może działać inaczej w różnych typach komórek i tkanek. AlphaGenome potrafi przewidywać wiele cech w różnych kontekstach, ale dalsze prace mają na celu poprawę jego dokładności w analizie specyficznych dla danego typu komórek wzorców regulacyjnych.
Nie zastępuje diagnostyki indywidualnej
Ważne jest również, by nie przeceniać możliwości modelu w kontekście tzw. personalizowanej medycyny. AlphaGenome nie został zaprojektowany ani przetestowany jako narzędzie do przewidywania ryzyka chorób u konkretnych osób. Zamiast tego skupia się na analizie pojedynczych wariantów genetycznych i ich potencjalnego wpływu na molekularne mechanizmy działania genomu.
Co dalej z AlphaGenome?
Zespół DeepMind zapowiada dalsze prace nad rozszerzaniem możliwości AlphaGenome. Zarówno przez zwiększenie zakresu danych treningowych (np. o nowe gatunki czy dodatkowe typy pomiarów), jak i przez udostępnianie modelu społeczności naukowej. Obecnie model dostępny jest interfejs API dla niekomercyjnych zastosowań badawczych, a w przyszłości planowane jest jego pełne upublicznienie.
To właśnie współpraca z badaczami z całego świata ma pomóc w odkrywaniu kolejnych zastosowań AlphaGenome oraz w rozwiązywaniu jego ograniczeń.


