Medyczny model AI od Google pobił kolejny rekord dokładności


Nowy model AI od Google odpowiada poprawnie na 92,6% pytań medycznych.
Nowy model AI od Google odpowiada poprawnie na 92,6% pytań medycznych.

Technologia generatywnej sztucznej inteligencji Med-PaLM 2 potrafi odpowiadać na pytania dotyczące zagadnień medycznych z dokładnością 92,6% – wynika z badania opublikowanego w czasopiśmie naukowym Nature.

Wynik 92,6% już tylko o włos dzieli średni poziom poprawnych odpowiedzi przez lekarzy, który wynosi 92,9%. Czy to oznacza, że wkrótce generatywna sztuczna inteligencja zostanie zakwalifikowana jako wyrób medyczny?

Cel: AI w każdym gabinecie lekarskim

Med-PaLM to generatywna technologia sztucznej inteligencji, która wykorzystuje duży model językowy opracowany przez Google do odpowiadania na pytania dotyczące medycyny. W testach badacze wykorzystali zestaw sześciu zbiorów pytań MultiMedQA. Wśród nich znalazły się zarówno zagadnienia z dziedziny nauk medycznych jak i pytania dotyczące zdrowia zadawane przez pacjentów. Dla utrudnienia, dodano jeszcze zbiór HealthSearchQA, czyli najczęściej pojawiających się w internecie pytań o zdrowie.

Wszystkie pytania zostały zadane modelowi PaLM, który składa się z 540 miliardów parametrów, czyli reguł analizowania danych. Następnie odpowiedzi zostały poddane weryfikacji człowieka pod względem zrozumienia, poprawności ścieżki dedukcji oraz możliwych błędów, np. stronniczości.

Na początek model wykazał się dokładnością 67,6% poprawnych odpowiedzi w amerykańskim egzaminie licencyjnym z medycyny. Spore błędy występowały w odpowiedziach na pytania pacjentów. Po dostrojeniu modelu, powstał Med-PaLM o dokładności 92,6%.

Google nie kryje ambicji, aby jego model AI był pierwszym tego rodzaju narzędziem, który na stałe wejdzie do praktyki medycznej. – Mamy nadzieję, że systemy LLM, takie jak Med-PaLM, zdemokratyzują dostęp do wysokiej jakości informacji medycznych, szczególnie w regionach o ograniczonej liczbie specjalistów – mówi Vivek Natarajan, badacz sztucznej inteligencji w Google biorący udział w badaniu.

Natarajan twierdzi, że dzięki dalszemu rozwojowi AI oraz rygorystycznej walidacji bezpieczeństwa i skuteczności, Med-PaLM wejdzie do praktyki klinicznej, zmniejszając obciążenia administracyjne, pomagając w podejmowaniu decyzji klinicznych i czyniąc opiekę zdrowotną bardziej dostępną, sprawiedliwą i bezpieczną.

Krótka historia sukcesu Med-PaLM 2

W marcu br. Google przetestował Med-PaLM 2 na pytaniach z amerykańskiego egzaminu licencyjnego z medycyny, w którym osiągnął poziom „eksperta” z dokładnością 85%. Miesiąc później firma ogłosiła, że Med-PaLM 2 będzie dostępny do testów dla wybranych klientów Google Cloud. Szybkość postępów i uczenia się AI pozwala przypuszczać, że dokładność modeli AI w medycynie będzie zbliżała się do 100%.

Organy zajmujące się dopuszczaniem urządzeń medycznych na rynek będą miały twardy orzech do zgryzienia, bo generatywna AI nie jest regulowana i weryfikacja bezpieczeństwa klinicznego zastosowania będzie skomplikowana.

Czytaj także: Wszystko o AI i ChatGPT w ochronie zdrowia – pobierz specjalny numer OSOZ