Med-Gemini: Nowy model medyczny AI lepszy niż ChatGPT


Med-Gemini to najnowszy model od Google i DeepMing (zdjęcie: Google)
Med-Gemini to najnowszy model od Google i DeepMing (zdjęcie: Google)

Multimodalna AI od Google i DeepMind potrafi zrozumieć kontekst choroby, co znacznie poprawia dokładność diagnozowania. Med-Gemini zdał amerykański egzamin medyczny odpowiadając poprawnie na 91,1% pytań.

AI naśladuje sposób wnioskowania lekarzy

Google i DeepMind opublikowały pierwsze informacje o Med-Gemini – grupie modeli AI do zastosowań w medycynie. Przeprowadzone przez naukowców firmy badania sugerują, że dokładnością znacznie wyprzeda GPT-4 OpenAI i poprzedni model Google, czyli Med-PaLM-2.

Med-Gemini wyróżnia umiejętność zrozumienia kontekstu objawów choroby, jak czas i kolejność ich wystąpienia. Brak tej zdolności był dotąd źródłem wielu błędów w diagnozowaniu. Oprócz samej wiedzy medycznej, a tę AI już posiada, nie same objawy, ale także ich sekwencja mają znaczenie. Przykładem jest gorączka i wysypka u dziecka. Każdy lekarz wie, że nie można ich traktować na równi, ignorując informację, czy pierwsza była gorączka czy wysypka. Pozornie proste pytania mogą szybko naprowadzić doświadczonego medyka na trop choroby. Ta umiejętność zestawienia symptomów z kontekstem czasu i miejsca ich pojawienia się, która wynika z praktyki lekarskiej, dotąd była domeną lekarza. Okazuje się, że także i tego może nauczyć się AI.

Med-Gemini to model multimodalny, który może agregować i analizować różne rodzaje danych: zapisy w EDM, zdjęcia medyczne, dane genetyczne itd. (zdjęcie: Google)
Med-Gemini to model multimodalny, który może agregować i analizować różne rodzaje danych: zapisy w EDM, zdjęcia medyczne, dane genetyczne itd. (zdjęcie: Google)

AI przeglądnie EDM, sprawdzi aktualne wytyczne medyczne

Aby wbudować element kontekstowości w sposób pracy AI, programiści Google przyjęli nowe podejście: zamiast tworzyć jedno rozwiązanie jak ChatGPT, opracowali rodzinę powiązanych ze sobą modeli dla ochrony zdrowia. Każdy z nich dedykowany jest innemu scenariuszowi, np. interpretacja danych z elektronicznej dokumentacji medycznej, analiza obrazów radiologicznych i patologicznych, interpretacja badań EKG. Według naukowców, takie podejście pozwoliło zwiększyć precyzję oceny danych.

Med-Gemini ma jeszcze jedną przewagę w stosunku do ChatGPT. Model OpenAI jest statyczny: ChatGPT Plus (płatna wersja) korzysta z informacji do kwietnia 2023 roku, a ChatGPT (wcześniej 3.5, bezpłatny) – do stycznia 2022. Model od Google uzupełniono o dodatkową warstwę, dzięki której może on wyszukiwać aktualne informacje dotyczące analizowanego problemu medycznego w Internecie i włączyć nowe dane do odpowiedzi. To ważne, bo diagnozowanie i leczenie powinno opierać się na najbardziej aktualnej wiedzy i wytycznych naukowych.

Rekordowa dokładność w testach na 91,1%

W 14 medycznych testach porównawczych wykazano wyższą dokładność Med-Gemini w stosunku do konkurentów. W 10 z nich, nowy model pokonał rodzinę modeli GPT-4. Do tego Med-Gamini zdał amerykański egzamin medyczny (United States Medical Licensing Examination, USMLE) odpowiadając poprawnie na 91,1% pytań.

Liczba poprawnych odpowiedzi kolejnych modeli AI (marzec 2022 - marzec 2024) w amerykańskim egzaminie medycznych. Med-Gemini uzyskał rekordowy poziom 91,1% punktów (zdjęcie: Google)
Liczba poprawnych odpowiedzi kolejnych modeli AI (marzec 2022 – marzec 2024) w amerykańskim egzaminie medycznych. Med-Gemini uzyskał rekordowy poziom 91,1% punktów (zdjęcie: Google)

To o 4,6% więcej niż dotychczasowych lider, czyli Med-PaLM 2. Naukowcy Google sugerują, że Med-Gemini gotowy jest do zastosowań w warunkach rzeczywistych, „przewyższając ekspertów-ludzi w zadaniach takich jak podsumowanie tekstu medycznego i generowanie skierowań.” Do tego posiada „obiecujący potencjał w badaniach medycznych i edukacji”. Teraz model musi przejść walidację na rzeczywistych danych w warunkach klinicznych.