Magazyn Nature: AI lepsza w analizie EDM niż lekarz


45% podsumowań EDM stworzonych przez AI osiągnęło dokładność na poziomie lekarza, a 36% – wyższą
45% podsumowań EDM stworzonych przez AI osiągnęło dokładność na poziomie lekarza, a 36% – wyższą

Sztuczna inteligencja o wiele lepiej niż ludzie radzi sobie z podsumowaniem danych z dokumentacji medycznej – wynika z badania opublikowanego w czasopiśmie Nature Medicine.

Międzynarodowy zespół naukowców sprawdził, czy duże modele językowe (LLM) nadają się do analizy informacji z elektronicznej dokumentacji medycznej oraz porównał ich wydajność z lekarzami. Zaskoczenia nie było: LLM mają zdolności kognitywne i analityczne, jakich brakuje ludziom. Z jednym wyjątkiem.

Problem ilości danych w EDM

Każdy lekarz podejmuje decyzje diagnostyczne albo terapeutyczne na podstawie danych zgromadzonych w dokumentacji medycznej: wyników badań laboratoryjnych, zapisek innych lekarzy specjalistów oraz wywiadów. Nawet jeśli robią to z należytą starannością, przetworzenie dużej ilości danych jest czasami niemożliwe ze względu na brak czasu albo nadmiar danych. A to może prowadzić do błędów.

Problemu nie rozwiązuje nawet zwiększenie czasu na wizytę pacjenta, co zresztą w praktyce jest niewykonalne.

Już teraz lekarze spędzają ok. dwóch godzin dziennie na tworzeniu EDM. Pielęgniarki poświęcają dokumentacji nawet 60% swojego czasu. Tak duże obciążenie biurokracją prowadzi do wypalenia zawodowego, stresu i gorszych wyników leczenia pacjentów.

Naukowcy postanowili sprawdzić, czy w procesie przeglądania danych z EDM, lekarzy mogłaby wesprzeć sztuczna inteligencja. W tym celu ocenili osiem różnych LLM w czterech zadaniach polegających na podsumowaniu danych klinicznych: pytań pacjentów, raportów radiologicznych, dialogu między lekarzem a pacjentem oraz notatek z postępów leczenia.

EDM przewyższa możliwości kognitywne ludzi

45% podsumowań stworzonych przez najprecyzyjniejsze LLM osiągnęło dokładność na poziomie lekarza, a 36% – wyższą. Takie wyniki uzyskano, gdy skuteczność mierzono za pomocą matematycznych wskaźników jakości. Oceny dla LLM były jeszcze wyższe, gdy podsumowania ocenili ludzie. Wyjątkiem były raporty radiologiczne, gdzie zwięzłość podsumowań LLM była niższa niż w przypadku ekspertów medycznych.

Badanie wykazało, że LLM mogą tak samo albo i lepiej niż człowiek robić podsumowania danych z dokumentacji medycznej pacjenta. Aby włączyć tę technologię do pracy lekarzy, wymagane są jednak dalsze prace. Jakiekolwiek błędy AI mogłyby być potencjalnie groźne dla zdrowia pacjenta. Ale eksperci podkreślają jednocześnie, że lekarze także popełniają błędy, bo nie są w stanie nawet przejrzeć wszystkich danych z EDM, a co dopiero uwzględnić je w procesie diagnozy lub leczenia. Ponieważ trudno mierzyć ich skalę, nie wiadomo, jaki mają wpływ na leczenie.

Wnioski z badania do optymistyczna wiadomość dla lekarzy. Jeśli uda się zaangażować AI do tworzenia i analizy EDM, lekarze będą mogli więcej czasu poświęcić dla pacjentów.