AI od Google przewiduje wpływ mutacji DNA na zdrowie


Dotychczas szukanie mutacji w DNA i przewidywanie ich skutków było jak szukanie igły w stogu siana.
Dotychczas szukanie mutacji w DNA i przewidywanie ich skutków było jak szukanie igły w stogu siana.

Należący do Google DeepMind opracował nowy model sztucznej inteligencji, który tworzy prognozy skutków mutacji DNA. Nawet niewielkie zmiany w kodzie genetycznym mogą mieć poważne konsekwencje dla zdrowia, a ich poznanie odgrywa kluczową rolę w opartej na genetyce prewencji.

Chodzi dokładnie o tzw. mutacje missensowne (mutacje zmiany sensu), polegające na zmianie pojedynczego nukleoidu w DNA, które skutkują powstaniem innego aminokwasu w białku. Takie niewielkie anomalie mogą mieć duże i dalekosiężne skutki.

Dotychczas ich identyfikacja i ocena ryzyka były jak szukanie igły w stogu siana. W ludzkim genomie znajduje się 71 milionów możliwych wariantów mutacji zmiany sensu, a przeciętny człowiek jest nosicielem ponad 9000 z nich. Większość jest wprawdzie nieszkodliwa, jednak niektóre zostały skojarzone z chorobami genetycznymi, takimi jak anemia sierpowata, mukowiscydoza czy cukrzyca typu 2. Z 4 milionów wariantów mutacji zmiany sensu, które zostały wykryte u ludzi, dotychczas tylko 2 procent zostało sklasyfikowanych jako albo patogenne, albo łagodne. Kosztowało to lata żmudnych i kosztownych badań. Badanie wpływu pojedynczego wariantu trwa miesiące.

Model językowy wytrenowany na sekwencjach DNA

DeepMind – firma-córka Google – opracowała narzędzie, które może przyspieszyć ten proces. AlphaMissense jestem nowym modelem uczenia maszynowego, który analizuje warianty zmiany sensu i oblicza prawdopodobieństwo wpływu mutacji na rozwój choroby z 90-procentową dokładnością.

Algorytm AI powstał w oparciu o inny przełomowy model DeepMind przewidujący struktury setek milionów białek na podstawie ich składu aminokwasowego. AlphaMissense działa podobnie jak duży model językowy, taki jak ChatGPT. Został ona przeszkolony na bazie danych biologicznych człowieka i wie, jak powinny wyglądać normalne sekwencje aminokwasów w białkach. Jeśli zostanie mu przedstawiona nieprawidłowa sekwencja, może zwrócić na nią uwagę, podobnie jak w przypadku niewłaściwego słowa w zdaniu.

– To model językowy, ale trenowany na sekwencjach białek – mówi Jun Cheng, współautor artykułu opublikowanego w czasopiśmie naukowym Science, który opisuje działanie modelu.

Pushmeet Kohli, wiceprezes DeepMind ds. badań, porównuje działanie modelu do książki kucharskiej: AlphaMissense przewiduje, co może się stać, jeśli użyjesz niewłaściwego składnika w przepisie.

Szybsza diagnoza rzadkich chorób genetycznych

Model potrafi określić stopień patogeniczności w skali od 0 do 10 dla każdego z 71 milionów możliwych wariantów mutacji zmiany sensu. Im wyższy wynik, tym większe prawdopodobieństwo, że mutacja wywoła chorobę lub będzie z nią związana. W pracach nad systemem, naukowcy DeepMind współpracowali z Genomics England, organem rządowym zajmującym się badaniem danych genetycznych gromadzonych przez brytyjską służbę zdrowia (National Health Service). W artykule opublikowanym w Science naukowcy dowiedli 90-procentową dokładność AlphaMissense dla 89% sklasyfikowanych wariantów.

O ile AlphaFold już teraz wspomaga proces odkrywania nowych leków i pozwala doskonalić terapie raka, AlphaMissense pomoże przyspieszyć badania nad wariantami genetycznymi, umożliwiając szybsze diagnozowanie chorób i znajdowanie nowych metod leczenia. Przykładowo, system może pomóc nakierować lekarzy na podejrzenie chorób genetycznych u dzieci.

Czytaj także: Czy lekarze mogą bezpiecznie używać ChatGPT w pracy?