„AI dyrygent” od Microsoft diagnozuje jak lekarz

Dodano: 13.08.2025


Microsoft AI Diagnostic Orchestrator naśladuje proces diagnozowania lekarza
Microsoft AI Diagnostic Orchestrator naśladuje proces diagnozowania lekarza

Żaden inny model AI nie zrobił takiego wrażenia na środowisku medycznym jak MAI-DxO od Microsoft. Daje on przedsmak tego, jak sztuczna inteligencja może sekwencyjnie diagnozować najbardziej złożone przypadki kliniczne, z którymi problem mają nawet doświadczeni lekarze.

Chodzi o „dyrygenta diagnostycznego” Microsoft AI Diagnostic Orchestrator (MAI-DxO), który diagnozuje do 85% przypadków klinicznych opisanych w New England Journal of Medicine (NEJM), czyli z ponad czterokrotnie wyższą skutecznością w porównaniu z grupą doświadczonych lekarzy. Do tego diagnoza przeprowadzana przez MAI-DxO jest tańsza, bo wymaga przeprowadzania mniejszej ilości badań laboratoryjnych i diagnostyki obrazowej.

AI symuluje grupę lekarzy z różnych dziedzin

Ochrona zdrowia ma trzy bazowe problemy: rosnące koszty nie przekładające się na poziom opieki i wyniki leczenia, ograniczona dostępność do opieki ze względu na kolejki do specjalistów oraz wynikająca z tego opóźniona diagnoza i leczenie. Nie wspominając o błędach diagnozowania pozostających nadal mało zbadanym problemem. Dlatego pacjenci coraz częściej zwracają się o pomoc do Google, a ostatnio także do rozwiązań generatywnej AI. Bing i Copilot od Microsoftu odnotowuje codziennie ponad 50 milionów zapytań związanych ze zdrowiem.

Ogólnodostępna AI jak ChatGPT czy Copilot zdaje już egzaminy medyczne zdobywając więcej punktów niż doświadczeni lekarze. W zaledwie trzy lata, genAI przeszła drogę od systematycznie oblewanych testów do prawie 100% poprawności odpowiedzi na pytania z amerykańskiego egzaminu państwowego na medycynę (USMLE). Ale krytycy podkreślają, że odpowiadanie na pytania wielokrotnego wyboru, faworyzujące zapamiętywanie zamiast głębokiego zrozumienia problemu, to nie to samo co diagnozowanie pacjenta w gabinecie lekarskim.

Dlatego naukowcy skupiają się na modelach AI zbudowanych z różnych warstw, aby możliwie wiernie naśladować to, jak lekarz prowadzi wywiad, kieruje na badania i na tej podstawie stawia diagnozę. Jednym słowem chodzi o zdekodowanie sposobu rozumowania klinicznego.

I wszystko wskazuje na to, że to się udało. MAI-DxO opiera się na diagnostyce sekwencyjnej, która jest podstawą podejmowania decyzji medycznych. W tym procesie lekarz rozpoczyna od wstępnego wywiadu z pacjentem, a następnie iteracyjnie dobiera kolejne pytania i badania diagnostyczne, aby na tej podstawie dojść do ostatecznej diagnozy. Na przykład, gdy na wizytę zgłasza się pacjent z kaszlem i gorączką, lekarz osłucha pacjenta, zapyta o czas trwania dolegliwości, a w razie wątpliwości zleceni badania krwi oraz prześwietlenie klatki piersiowej.

Bądź na bieżąco z najnowszymi technologiami w medycynie. Kliknij na obrazek i zapisz się do newslettera OSOZ
Bądź na bieżąco z najnowszymi technologiami w medycynie. Kliknij na obrazek i zapisz się do newslettera OSOZ

Aby sprawdzić skuteczność MAI-DxO, eksperci Microsoft po raz pierwszy zdecydowali się przetestować model na ekstremalnie złożonych przypadkach chorób, które co tydzień są publikowane w New England Journal of Medicine (NEJM) – jednym z najbardziej prestiżowych czasopism naukowych w dziedzinie medycyny na świecie. Ich poprawna diagnoza wymaga doświadczenia, ogromnej wiedzy, współpracy wielu specjalistów oraz przeprowadzenia badań diagnostycznych.

Naukowcy stworzyli interaktywne zadania oparte na serii 304 przypadków klinicznych z NEJM. Przedstawili je następnie modelowi AI oraz lekarzom. W dochodzeniu do diagnozy mogli oni zadawać dowolne pytania i zlecać badania. W ocenie skuteczności wzięto pod uwagę dokładność diagnostyczną oraz koszty zleconych badań.

AI zdiagnozowała poprawnie 85% przypadków, lekarze – 20%

Aby sprawdzić wydajność modelu, testom poddano także klasyczne modele genAI jak GPT, Llama, Claude, Gemini, Grok i DeepSeek. Microsoft AI Diagnostic Orchestrator (MAI-DxO) – który jest nakładką na istniejące modele – został zaprojektowany do symulowania wirtualnego panelu lekarzy o różnorodnych podejściach diagnostycznych, współpracujących w celu rozwiązania przypadków diagnostycznych.

Takie podejście ma kilka zalet. Koordynatory AI mogą integrować różne źródła danych, zwiększając bezpieczeństwo i elastycznie modyfikując proces diagnozy. Do tego są bardziej transparentni w działaniu i audytowalni, co ma ogromne znaczenie w medycynie – lekarze korzystający z AI chcą zrozumieć, jak model doszedł do takiego, a nie innego wniosku.

MAI-Dx Orchestrator może zadawać pytania uzupełniające, zlecać badania lub stawiać diagnozy, a następnie sprawdzać koszty i weryfikować własne rozumowanie przed podjęciem decyzji o dalszym postępowaniu (grafika: Microsoft)
MAI-Dx Orchestrator może zadawać pytania uzupełniające, zlecać badania lub stawiać diagnozy, a następnie sprawdzać koszty i weryfikować własne rozumowanie przed podjęciem decyzji o dalszym postępowaniu (grafika: Microsoft)

Wyniki testów zaskoczyły wszystkich. MAI-DxO poprawił wydajność diagnostyczną testowanych modeli. Najlepszą konfiguracją okazało się połączenie MAI-DxO z o3 firmy OpenAI. W takim zestawieniu system poprawnie rozszyfrował 85,5% przypadków testowych z NEJM. Dla porównania: 21 praktykujących lekarzy z USA i Wielkiej Brytanii z 5–20-letnim doświadczeniem klinicznym osiągnęło średnią dokładność diagnozy na poziomie 20%.

Do tego MAI-DxO może być dowolnie konfigurowalny. Przykładowo, można z góry określić ograniczenia kosztowe dotyczące realizowanych badań, a model dobiera optymalnie kompromisowe rozwiązanie uwzględniając cenę testów diagnostycznych. To zresztą odpowiada warunkom rzeczywistym, ponieważ lekarze też muszą kierować się rachunkiem ekonomicznym podczas podejmowania decyzji diagnostycznych. Bez takich ograniczeń system AI mógłby domyślnie zlecać wszystkie możliwe badania – niezależnie od kosztów, dyskomfortu pacjenta lub opóźnień w opiece. Oprócz tego okazało się, że MAI-DxO zapewnia nie tylko wyższą dokładność diagnostyczną, ale i niższe całkowite koszty badań w porównaniu z lekarzami.

Diagnoza bez AI będzie ryzykowna

Żaden lekarz nie jest jednak w stanie sam diagnozować złożone przypadki opisane w NEJM. Lekarze rodzinni mają szeroką, ale ogólną wiedzę o najczęściej występujących schorzeniach w różnych grupach wiekowych i narządach. Z kolei specjaliści, jak reumatolodzy, koncentrują się na jednym układzie, obszarze chorób, a nawet schorzeniu. Sztuczna inteligencja nie ma natomiast takich ograniczeń, wykazując się zdolnościami rozumowania klinicznego, które w wielu aspektach przewyższają zdolności poszczególnych lekarzy.

Pobierz 242-stronicowy raport "AI w ochronie zdrowia"
Pobierz 242-stronicowy raport „AI w ochronie zdrowia”

Co to oznacza? Nowy model pokazuje, że AI może być stosowana przez pacjentów do rutynowej diagnozy, a w przypadku złożonych przypadków klinicznych stanowi dla lekarzy cenne wsparcie. Jeśli takie podejście się przyjmie, znacznie zwiększy się przepustowość systemu zdrowia, bo pacjenci będą mogli po części diagnozować się sami, a lekarze zyskają czas dla tych, którzy naprawdę potrzebują pomocy lekarskiej. Obliczenia Microsoft sugerują, że AI zredukuje niepotrzebne koszty opieki zdrowotnej.

Chociaż MAI-DxO doskonale radzi sobie z najbardziej złożonymi wyzwaniami diagnostycznymi, konieczne są dalsze testy w celu oceny jego działania w przypadku prostych przypadków klinicznych. Do tego w przeprowadzonych badaniach lekarze nie mieli dostępu do literatury medycznej ani do AI, aby nie zakłócać wyników.

Ten przykład pokazuje jednak, że AI może diagnozować pacjentów. To szansa na to, aby chorzy błyskawicznie mogli rozpocząć leczenie bez opóźnień spowodowanych kolejkami albo niedostępnością lekarzy.