Naukowcy sięgają do Big Data, aby wygrać walkę z rakiem


HARMONY szuka korelacji w danych, aby opracować nowe metody leczenia nowotworów krwi.
HARMONY szuka korelacji w danych, aby opracować nowe metody leczenia nowotworów krwi.

Alians HARMONY ma ambitny cel: doprowadzić do przełomu w badaniach naukowych nad nowymi lekami. Zaglądamy za kulisy europejskiego projektu, którego celem jest opracowanie nowych metod leczenia nowotworów krwi z pomocą analiz Big Data.

Łączenie rozproszonej wiedzy

Do projektu bazującego na partnerstwie publiczno-prywatnym i współfinansowanego ze środków UE przystąpiło 100 organizacji z 18 państwo Europy. Członkowie inicjatywy przekazali już ponad 100 000 zestawów danych. Zanonimizowane i zharmonizowane dane są następnie analizowane przez algorytmy AI na Platformie HARMONY Big Data. Jest to jeden z czołowych projektów tego typu w skali świata współfinansowany w modelu partnerstwa publiczno-prywatnego, w tym ze środków europejskich.

Naukowcy skupili się na znalezieniu odpowiedzi na cztery pytania:

  • Jak diagnozować pacjentów szybciej i z większą precyzją?
  • Jakie są najlepsze praktyki postępowania klinicznego, które mogłyby pomóc lekarzom w procesie podejmowania decyzji dotyczących leczenia?
  • Jak zaspokoić zaniedbane potrzeby pacjentów cierpiących na nowotwory krwi?
  • Jak przyspieszyć postęp w opracowywaniu nowych leków?

Odpowiedzi mogą kryć się w danych. Jednak zadanie nie jest proste, bo analizie trzeba poddać dane różnego rodzaju, pochodzące z różnych źródeł i do tego często przechowywane w różnych formatach. W analizach Big Data zasada jest prosta: im więcej danych wysokiej jakości, tym większa szansa na znalezienie wartościowych korelacji między nimi.

Nowe podejście do badań w medycynie

Naukowcy wzięli pod lupę 7 rodzajów nowotworów krwi będącymi jednymi z najbardziej skomplikowanych raków. Aby lepiej poznać charakterystykę choroby, analizie poddano dane m.in. z elektronicznych kartotek medycznych, dane genetyczne, dane z badań klinicznych, wyniki badań laboratoryjnych i diagnostyki obrazowej, dane demograficzne. Te heterogeniczne, wbrew pozorom nieporównywalne na pierwszy rzut oka informacje, muszą być w pierwszym etapie poddane procesowi harmonizacji.

W ten sposób opisy, obrazy, wyniki badań zamienia się w spójną bazę. W laboratoriach danych naukowcy musieli najpierw przeanalizować tysiące danych składowych, ocenić ich jakość i przydatność, a następnie ujednolicić do postaci, którą algorytmy sztucznej inteligencji są w stanie odczytać. W tym celu posłużono się technikami, które zostały opracowane w ostatnich latach. Jedną z nich jest tzw. Observational Medical Outcomes Partnership (OMOP) wykorzystująca międzynarodowe standardy terminologii medycznej, takie jak SNOMED lub LOINC, pozwalając na semantyczne ujednolicenie informacji. Innym narzędziem jest technologia Spark, swego rodzaju silnik analityczny służący do przetwarzania danych na dużą skalę.

Gdy w grę wchodzą dane szczególnie wrażliwe, jednym z priorytetów było także opracowanie standardów bezpieczeństwa danych oraz zgodność procedur z rozporządzeniem o ochronie danych osobowych RODO. Alians HARMONY stworzył ponadto wewnętrzny kodeks etyczny określający kwestie przejrzystości prac naukowych i odpowiedzialności.

Zaufanie ważniejsze niż technologia

Aby zaplecze techniczne, metody badawcze oraz infrastruktura techniczna mogły zostać zaangażowane w misji poszukiwania nowej wiedzy na temat nowotworów krwi, potrzebne było spełnienie jeszcze jednego warunku – zbudowanie zaufanej platformy współpracy dla organizacji publicznych i firm prywatnych z całej Europy.

Platforma HARMONY Big Data bazuje bowiem na danych przekazywanych przez partnerów z 18 krajów Europy reprezentujących spektrum podmiotów rynku ochrony zdrowia: firmy farmaceutyczne, biobanki, szpitale, organizacje prowadzące badania kliniczne itd.

Platforma Big Data HARMONY pozwala harmonizować dane z różnych źródeł i poddawać je analizie Big Data.
Platforma Big Data HARMONY pozwala harmonizować dane z różnych źródeł i poddawać je analizie Big Data.

Naukowców połączył jeden cel jakim jest zrozumienie charakterystyki nowotworów krwi, bliższe poznanie ich molekularnego krajobrazu. Tego rodzaju bezprecedensowe projekty wymagają zaufania, ale też odwagi i otwarcia się na innowacje. Posiadanie odpowiedniej technologii to za mało. O wiele ważniejszym jest przełamanie silosów danych, przekonanie do dzielenia się danymi organizacjach, które – ze zrozumiałych względów – bardzo restrykcyjnie podchodzą do kwestii przetwarzania danych medycznych.

W analizach Big Data każdy pojedynczy element układanki, czyli każdy zestaw danych, może okazać się brakującym elementem, kluczem do nowych metod leczenia albo predykcji rozwoju choroby. Na wiele pytań dotyczących nowotworów hematologicznych nadal nie ma odpowiedzi. Aby sprostać nowym wyzwaniom badawczym, trzeba sięgać po nowe narzędzia uzupełniające klasyczne metody.

Jak uniknąć marnotrawstwa danych?

Według Statista, do maja 2023 roku na całym świecie zarejestrowano ponad 454 tys. różnych badań klinicznych. Po ich zakończeniu, zebrane dane w większości przypadków są archiwizowane i zamykane w lokalnych bazach danych. Gdyby choć część z nich poddać analizom Big Data, nauka mogłaby dokonać wielu przełomowych odkryć.

Podejście do wykorzystania danych wtórnych w medycynie musi się zmienić, jeżeli chcemy przyspieszyć proces opracowywania nowych leków oraz poprawić standardy leczenia. Aby tak się stało, potrzebne jest bardziej liberalne prawo w zakresie analizy danych wtórnych do badań naukowych. Z drugiej strony konieczne jest podnoszenie świadomości społecznej w zakresie dzielenia się danymi oraz zagwarantowanie, że korzyści z przetwarzania danych wracają do obywateli.

Dzielenie się danymi w bezpieczny i przejrzysty sposób do celów badawczych jest nową formą krwiodawstwa w dobie cyfryzacji i Big Data. W perspektywie długofalowej, ma moc ratowania ludzkiego życia dzięki. Na podstawie prowadzonych cały czas analiz, HARMONY Alliance opublikowało już kilka wyników badań naukowych, a możliwości nauki opartej na analizie danych są ogromne. Tego typu projekty trudno realizować w pojedynkę. Wymagają współpracy i łączenia kompetencji i wiedzy ludzi z różnych krajów. Do tego potrzebujemy jedynie i aż danych oraz zaufania.

Czytaj także: 7 scenariuszy, jak sztuczna inteligencja zmieni medycynę