Sii Polska

SII UKRAINE

SII SWEDEN

  • Szkolenia
  • Kariera
Dołącz do nas Kontakt
Wstecz

Sii Polska

SII UKRAINE

SII SWEDEN

Wstecz
Sztuczna inteligencja w służbie badań klinicznych

Gdy sięgamy po tabletkę przeciwbólową, antybiotyk czy lek na nadciśnienie, rzadko myślimy, ile pracy stoi za tym, żeby dana substancja mogła trafić do apteki. W tym artykule nie chodzi o suplementy diety, które często wchodzą na rynek bez tak rygorystycznej weryfikacji. Mowa o lekach, które muszą wykazać zarówno bezpieczeństwo, jak i skuteczność, zanim zostaną zastosowane u pacjentów.

Ta pewność nie bierze się znikąd – opiera się na badaniach klinicznych, czyli jednym z najbardziej wymagających procesów w całej nauce i medycynie. Badania kliniczne są wieloetapowe, trwają latami i kosztują ogromne pieniądze – ale to właśnie dzięki nim możemy mówić o medycynie opartej na dowodach (ang. evidence-based medicine).

Badania kliniczne to nie „papierologia” do odhaczenia. To seria zaplanowanych eksperymentów na ludziach, które mają odpowiedzieć na podstawowe pytania: Czy lek jest bezpieczny? Czy działa? W jakiej dawce? U jakiej grupy pacjentów? Jakie są działania niepożądane i jak często występują?

W literaturze często podaje się, że cały proces – od pierwszych eksperymentów laboratoryjnych do leku dostępnego dla pacjentów – może trwać około 10-15 lat, a koszt doprowadzenia jednego leku do rynku bywa szacowany na kilka miliardów dolarów. Co więcej, znaczna część kandydatów odpada po drodze: w przybliżeniu tylko niewielki odsetek substancji testowanych w badaniach klinicznych ostatecznie trafia do aptek.

Badania kliniczne: od laboratorium do apteki

Badania kliniczne to badania prowadzone z udziałem ludzi, zaprojektowane tak, aby w kontrolowanych warunkach ocenić bezpieczeństwo i skuteczność interwencji medycznej. Najczęściej chodzi o nowe leki, ale badania kliniczne dotyczą też wyrobów medycznych, procedur, szczepionek czy terapii komórkowych.

Zanim jednak nowa substancja zostanie podana pierwszemu człowiekowi, przechodzi etap badań przedklinicznych – zwykle w laboratorium (np. na liniach komórkowych) oraz na modelach zwierzęcych. Dopiero gdy te wyniki są wystarczająco obiecujące i spełniają wymagania bezpieczeństwa, rozpoczyna się część kliniczna.

Dla zobrazowania przyjmijmy prostą ilustrację: gdybyśmy startowali z 1000 potencjalnych kandydatów na lek, tylko część z nich przejdzie do faz klinicznych, a na rynek trafią pojedyncze. Powody są różne: brak skuteczności u ludzi, toksyczność, problemy z rekrutacją, nieopłacalność, konkurencja, zmiany standardu leczenia w trakcie programu rozwojowego – lista jest długa.

Fazy badań klinicznych: długa droga do sukcesu

Badania kliniczne dzielą się na fazy. Każda z nich ma inny cel, skalę, budżet i typowe ryzyka. Poniżej opiszę je w sposób możliwie przystępny – tak, aby łatwiej było zrozumieć, dlaczego ryzyko niepowodzenia jest tak duże. Oczywiście, koszty różnią się znacząco w zależności od obszaru terapeutycznego, ale podaję tutaj pewne wartości przybliżone.

Faza 0: Mikrodawkowanie

To etap rzadziej spotykany, czasem pomijany. Niewielkiej grupie ochotników (np. 10-15 osób) podaje się bardzo małe, subterapeutyczne dawki leku, żeby sprawdzić, jak substancja zachowuje się w organizmie człowieka (farmakokinetyka) oraz czy pojawiają się sygnały alarmowe. Nie chodzi jeszcze o leczenie – raczej o wczesną „próbę generalną”.

  • Czas trwania: zwykle krótki.
  • Koszt: ok. 1-2 mln dolarów (orientacyjnie).

Faza I: Bezpieczeństwo i dawkowanie

W fazie I najważniejsze jest bezpieczeństwo. Lek testuje się na małej grupie zdrowych ochotników (często 20-80 osób), a w niektórych wskazaniach, np. w onkologii, na pacjentach. Sprawdza się tolerancję, zakres dawek, metabolizm, wydalanie oraz wczesne działania niepożądane.

  • Czas trwania: 1-2 lata.
  • Koszt: 4-7 mln dolarów.
  • Typowe ryzyka: Toksyczność, problemy z rekrutacją.

Faza II: Skuteczność i dalsza ocena bezpieczeństwa

Jeśli lek przejdzie fazę I, trafia do pacjentów z chorobą, którą ma leczyć. Skala rośnie (często 100-300 osób), a kluczowym pytaniem staje się: Czy lek rzeczywiście działa w praktyce klinicznej? Jednocześnie nadal zbiera się dane o bezpieczeństwie. To etap, na którym bardzo wiele projektów odpada – substancja może być obiecująca w modelach laboratoryjnych, ale w populacji pacjentów nie przynosi wystarczającej korzyści albo ma nieakceptowalne działania uboczne.

  • Czas trwania: 2-3 lata.
  • Koszt: 13-20 mln dolarów.
  • Typowe ryzyka: Brak skuteczności, błędy w projekcie badania.

Faza III: Badania na dużą skalę

Faza III to zwykle największy i najdroższy etap. Badania obejmują setki do tysięcy pacjentów (często 1000-3000, czasem więcej) i są prowadzone w wielu ośrodkach, nieraz w wielu krajach. Sprawdza się skuteczność i bezpieczeństwo w warunkach zbliżonych do realnej praktyki oraz porównuje leczenie z obowiązującym standardem (np. placebo albo najlepszą dostępną terapią).

Niepowodzenie w fazie III jest szczególnie dotkliwe, bo na tym etapie koszty są już bardzo wysokie, a program rozwojowy jest zaawansowany. Jedno nieudane badanie potrafi oznaczać stratę dziesiątek lub setek milionów dolarów.

  • Czas trwania: 3-4 lata.
  • Koszt: 50-100+ mln dolarów.
  • Typowe ryzyka: Moc statystyczna, logistyka, konkurencja.

Faza IV: Nadzór po wprowadzeniu na rynek

Zatwierdzenie leku przez agencje regulacyjne (np. FDA w USA czy EMA w Europie) nie kończy obserwacji. Faza IV, zwana też badaniami porejestracyjnymi, obejmuje monitorowanie leku w realnych warunkach – w większych populacjach i przez dłuższy czas. To ważne, bo rzadkie działania niepożądane mogą ujawnić się dopiero przy masowym stosowaniu.

Ekonomiczna skala wyzwania

Skala finansowa badań klinicznych jest ogromna. Wydatki na badania i rozwój w farmacji liczone są globalnie w setkach miliardów dolarów rocznie, a część kliniczna stanowi zwykle większość kosztów rozwoju. Z perspektywy systemu ochrony zdrowia i firm farmaceutycznych problemem są nie tylko koszty sukcesu, ale też koszty porażek: projekty, które odpadają w późnych fazach, generują największe straty.

Na ryzyko niepowodzenia składają się m.in.:

  • problemy z rekrutacją (badania nie kończą się w terminie, bo brakuje uczestników),
  • niewystarczająca skuteczność,
  • źle dobrane punkty końcowe (czyli mierniki efektu terapii),
  • zbyt wąskie lub zbyt szerokie kryteria włączenia,
  • czynniki zewnętrzne.

Dobrym przykładem jest pandemia COVID-19, która opóźniła lub przerwała wiele badań na całym świecie.

Case study: Czy AI może pomóc przewidywać niepowodzenia badań klinicznych?

Naturalne pytanie brzmi: Czy da się przewidzieć, które badania kliniczne są bardziej narażone na niepowodzenie – zanim zainwestuje się w nie dziesiątki czy setki milionów dolarów?

Taki system nie miałby zastępować ekspertów klinicznych, ale mógłby działać jako narzędzie wspierające decyzje – wskazywać badania o podwyższonym ryzyku i podpowiadać, gdzie warto przyjrzeć się projektowi protokołu.

Poniżej opisuję projekt badawczy (zrealizowany w ramach wewnętrznej inicjatywy Sii – AI Grants), który próbuje podejść do tego problemu w sposób możliwie rzetelny metodologicznie – tak, aby model faktycznie działał w scenariuszu planowania badania, a nie tylko w retrospektywnej analizie.

Źródło danych: ClinicalTrials.gov

Podstawą projektu jest ClinicalTrials.gov – publiczny rejestr badań klinicznych prowadzony przez amerykański NIH/NLM. Zawiera informacje o ponad pół milionie badań klinicznych z całego świata: opis protokołu, wskazanie, fazę, planowaną liczebność próby, kryteria włączenia i wyłączenia, interwencje, sponsorów, lokalizacje i wiele innych pól.

Kluczowe jest to, że duża część tych informacji jest dostępna już w momencie rejestracji badania, czyli zanim rozpocznie się rekrutacja pierwszego pacjenta. To czyni z rejestru świetne źródło danych do budowy modeli, które mają przewidywać ryzyko ex ante (na starcie), a nie ex post (po fakcie).

Kluczowe wyzwanie: Unikanie wycieku danych

W modelach uczenia maszynowego bardzo łatwo o tzw. wyciek danych (ang. data leakage). Najprościej mówiąc, to sytuacja, w której model dostaje „podpowiedź” z przyszłości, czyli informację, która nie byłaby dostępna w momencie, w którym model miałby zostać użyty w praktyce.

W kontekście badań klinicznych przykładem takich zmiennych mogą być dane opisujące rzeczywisty przebieg badania (np. finalna liczba zrekrutowanych pacjentów czy rzeczywisty czas trwania). Użycie ich do predykcji wyniku badania może poprawić wyniki metryk, ale czyni model mało użytecznym jako narzędzie wsparcia decyzji na początku projektu.

Dlatego w tym rozwiązaniu położono nacisk na to, aby model wykorzystywał wyłącznie informacje dostępne w momencie rejestracji badania, zanim zacznie się rekrutacja i zanim pojawią się jakiekolwiek wyniki. Innymi słowy, staramy się przewidywać ryzyko w takim samym kontekście informacyjnym, w jakim działa sponsor lub zespół projektujący badanie.

Architektura hierarchiczna: Uczenie na wielu poziomach

Badania kliniczne nie są jednorodne. Inaczej projektuje się badania w onkologii, inaczej w neurologii, a inaczej w dermatologii. Różnią je populacje pacjentów, punkty końcowe, typowe ryzyka i „profil porażek”. Co więcej, nawet w obrębie jednego obszaru terapeutycznego różne choroby mogą mieć inne czynniki ryzyka.

Z tego powodu w projekcie zastosowano podejście hierarchiczne – modele uczą się na trzech poziomach: ogólnym, obszaru terapeutycznego i choroby.

  • Poziom 1 (ogólny): Model trenowany na wszystkich badaniach uczy się wzorców wspólnych dla różnych typów badań.
  • Poziom 2 (kategoria terapeutyczna): modele specjalizują się w dużych obszarach (np. onkologia, neurologia) i uczą się ryzyk typowych dla danej dziedziny.
  • Poziom 3 (choroba specyficzna): Gdy danych jest wystarczająco dużo, tworzone są modele dla konkretnych chorób, które mogą dawać najbardziej precyzyjne predykcje.

Kluczowym elementem jest transfer learning między poziomami: model bardziej szczegółowy startuje z „wiedzą” modelu ogólnego i dopiero potem uczy się niuansów charakterystycznych dla danej dziedziny lub choroby. Dzięki temu nawet przy mniejszej liczbie przykładów można uzyskać sensowne rezultaty.

BERT i analiza tekstu: dlaczego to ma znaczenie?

Protokoły badań klinicznych to teksty pełne terminologii medycznej i regulacyjnej. Proste metody, takie jak zliczanie słów, często nie potrafią uchwycić sensu, ponieważ różne sformułowania mogą opisywać podobne kryteria, a jedno słowo może zmieniać znaczenie zdania.

Dlatego system korzysta z modeli BERT (Bidirectional Encoder Representations from Transformers), czyli nowoczesnych modeli językowych typu transformer. Zamiast patrzeć na słowa osobno, BERT buduje reprezentacje znaczenia (embeddingi), uwzględniając kontekst.

W praktyce wykorzystano warianty dostosowane do tekstów biomedycznych (np. ClinicalBERT, PubMedBERT) oraz lżejszą wersję (DistilBERT), która bywa przydatna, gdy liczy się szybkość i zasoby. Embeddingi z tekstu łączone są z klasycznymi cechami liczbowymi w modelu hybrydowym.

Siła kolektywu – uczenie zespołowe: Dlaczego nie jeden model?

Zamiast opierać się na jednym algorytmie, zastosowano podejście uczenia zespołowego (ang. ensemble learning), czyli łączenie predykcji z wielu modeli. To popularna praktyka w ML, bo różne algorytmy łapią różne wzorce i mają inne „słabe punkty”.

Wykorzystane modele to m.in.:

  • Random Forest (zespół drzew decyzyjnych).
  • XGBoost oraz LightGBM (algorytmy oparte na wzmacnianiu gradientowym).
  • Regresja Logistyczna (ang. Logistic Regression) jako prosty punkt odniesienia (ang. baseline).

Końcowa ocena ryzyka powstała przez połączenie wyników tych modeli, np. z wagami zależnymi od ich jakości na walidacji.

Wydajność systemu i porównanie z literaturą

Wyniki można opisać standardową metryką AUC (Area Under the ROC Curve). Intuicyjnie: AUC mierzy, jak dobrze model rozróżnia badania, które zakończą się niepowodzeniem, od tych, które zakończą się sukcesem. AUC=0.5 oznacza wynik losowy, a AUC=1.0 – perfekcyjną separację.

W tym projekcie uzyskano orientacyjnie:

  • Modele indywidualne: AUC ok. 0.72-0.78
  • Modele hybrydowe z BERT: AUC ok. 0.74-0.80
  • Modele ensemble: AUC ok. 0.76-0.82

W literaturze można znaleźć wyniki o podobnym rzędzie wielkości, choć porównania nie zawsze są proste (różne definicje etykiet, różne okresy danych, różne filtry). W artykule przywołano m.in.: prace: Kavalci & Hartshorn (2023), Chen i wsp. (2025), Yu i wsp. (2021) oraz przegląd Vorisek i wsp. (2025).

Jak sprawdzano, czy model nie „oszukuje”? Walidacja temporalna i leave-one-sponsor-out

Dobre wyniki na testach nie wystarczą, jeśli model uczy się na skróty. Dlatego w projekcie zastosowano kilka podejść walidacyjnych, które pomagają ocenić, czy model będzie działał w praktyce.

Walidacja temporalna (ang. temporal validation) oznacza, że model trenujemy na starszych danych, a testujemy na nowszych. To ważne, bo w realnym użyciu zawsze przewidujemy przyszłość na podstawie przeszłości. Taki test sprawdza, czy model nie jest „dopasowany” do specyfiki konkretnego okresu historycznego.

Leave-one-sponsor-out validation to walidacja, w której na etapie testu całkowicie wyklucza się z treningu badania jednego sponsora (np. konkretnej firmy) i sprawdza, jak model radzi sobie na badaniach tego sponsora. Dzięki temu można ocenić, czy model generalizuje na nowych sponsorów, a nie tylko „zapamiętuje” typowe wzorce kilku największych organizacji.

Potencjalne zastosowania w praktyce

Taki system mógłby wspierać pracę zespołów klinicznych w kilku scenariuszach:

  • Ocena ryzyka przed startem badania (wstępna selekcja projektów i priorytetyzacja portfela).
  • Optymalizacja protokołu (wskazanie elementów, które historycznie wiązały się z większym ryzykiem niepowodzenia).
  • Planowanie rekrutacji i wybór ośrodków (np. ocena ryzyka opóźnień w zależności od krajów/regionów i charakterystyki badania).
  • Wsparcie komunikacji interesariuszy (bardziej obiektywne, oparte na danych opisujących ryzyka).

Przykładowa analiza ekonomiczna: Do jakich oszczędności może prowadzić model?

Aby z grubsza oszacować potencjalną korzyść, można rozważyć hipotetyczny scenariusz. Duża firma prowadzi 50 badań rocznie, z czego ok. 20% kończy się niepowodzeniem. Jeśli średni koszt nieudanego badania fazy III wynosi np. 75 mln dolarów, to 10 niepowodzeń oznacza łącznie 750 mln dolarów kosztów.

Jeśli model pomagałby ograniczyć liczbę takich porażek choćby o kilka przypadków (np. dzięki wcześniejszemu wykryciu ryzyka i modyfikacji protokołu albo decyzji o nieuruchamianiu projektu), potencjalne oszczędności mogłyby sięgać setek milionów dolarów rocznie. Oczywiście są to kalkulacje orientacyjne – w praktyce wpływ zależy od tego, jak model jest używany i jakie decyzje wspiera.

Ograniczenia i wyzwania

Taki system nie jest magiczną kulą. Ograniczenia są realne:

  • Jakość danych determinuje jakość predykcji – rejestr ClinicalTrials.gov jest największym publicznym źródłem, ale dane bywają niekompletne, niespójne lub różnie wypełniane.
  • Modele uczą się z przeszłości – nowe zjawiska (np. pandemia) mogą wymagać aktualizacji modeli i ostrożnej interpretacji.
  • Decyzje o inwestowaniu dużych budżetów nie mogą opierać się wyłącznie na „czarnej skrzynce” – potrzebna jest interpretowalność i możliwość weryfikacji, dlaczego model ocenia ryzyko jako wysokie.
  • W rzadkich chorobach i nowych modalnościach terapeutycznych może brakować danych historycznych, co ogranicza skuteczność modeli specyficznych.

Kierunki dalszego rozwoju

Naturalne kierunki rozwoju obejmują:

  • Predykcję „w czasie rzeczywistym – aktualizowanie oceny ryzyka w miarę pojawiania się nowych informacji w trakcie prowadzenia badania.
  • Integrację z danymi biologicznymi i molekularnymi (np. mechanizm działania, profil targetów, informacje o cząsteczce), jeśli są dostępne.
  • Rekomendacje aktywne – nie tylko ocena ryzyka, ale też sugestie, jakie elementy protokołu warto rozważyć do zmiany.
  • Personalizację pod organizację – dostrajanie modeli do specyfiki danego sponsora (np. typowych obszarów terapeutycznych, praktyk operacyjnych), przy zachowaniu generalizacji.
Banner AI Offer Sample Desktop - Sztuczna inteligencja w służbie badań klinicznych

Artificial Intelligence

Dostarczamy rozwiązania AI dopasowane do Twojego biznesu, które zwiększają efektywność i podnoszą produktywność Twojego zespołu.

Oferta AI

Podsumowanie

Badania kliniczne są fundamentem rozwoju nowoczesnej medycyny, ale są też długie, drogie i obarczone dużym ryzykiem niepowodzenia. Sztuczna inteligencja nie zastąpi ekspertów klinicznych i nie wyeliminuje potrzeby prowadzenia badań, ale może działać jak dodatkowa „warstwa” analityczna – pomóc wcześniej zauważyć czynniki ryzyka, usprawnić projektowanie protokołu i lepiej alokować zasoby.

Opisany system pokazuje, że można budować modele przewidywania niepowodzeń badań klinicznych wyłącznie na danych publicznych, z naciskiem na unikanie wycieku danych i realistyczne scenariusze walidacji. To kierunek, który może być przydatny nie tylko dla największych firm farmaceutycznych, ale też dla mniejszych organizacji i zespołów akademickich – wszędzie tam, gdzie liczy się podejmowanie decyzji na podstawie danych, a budżety są ograniczone.

Przypisy i źródła

[1] DiMasi, J. A., Grabowski, H. G., & Hansen, R. W. (2016). Innovation in the pharmaceutical industry: New estimates of R&D costs. Journal of Health Economics, 47, 20-33.

[2] Wong, C. H., Siah, K. W., & Lo, A. W. (2019). Estimation of clinical trial success rates and related parameters. Biostatistics, 20(2), 273-286.

[3] Kavalci, E., & Hartshorn, A. (2023). Improving clinical trial design using interpretable machine learning based prediction of early trial termination. Scientific Reports, 13, 121. https://doi.org/10.1038/s41598-023-27416-7

[4] Chen, Y., et al. (2025). Predicting accrual success for better clinical trial resource allocation. Scientific Reports, 15. https://doi.org/10.1038/s41598-025-88400-x

[5] Vorisek, C. N., et al. (2025). A scoping review of artificial intelligence applications in clinical trial risk assessment. npj Digital Medicine, 8(26). https://doi.org/10.1038/s41746-025-01886-7

[6] Fogel, D. B. (2018). Factors associated with clinical trials that fail and opportunities for improving the likelihood of success: A review. Contemporary Clinical Trials Communications, 11, 156-164.

[7] Yu, T., et al. (2021). Predictive modeling of clinical trial terminations using feature engineering and embedding learning. Scientific Reports, 11, 3817. https://doi.org/10.1038/s41598-021-82840-x

[8] ClinicalTrials.gov. U.S. National Library of Medicine. https://clinicaltrials.gov

[9] Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805.

[10] Alsentzer, E., et al. (2019). Publicly available clinical BERT embeddings. arXiv:1904.03323.

5/5
Ocena
5/5
Avatar

O autorze

Piotr Ćwikliński

Ekspert w obszarze Data & AI oraz doktor nauk fizycznych, specjalizujący się w obliczeniach kwantowych i informatyce kwantowej. Posiada ponad 13-letnie doświadczenie praktyczne i menedżerskie w zakresie data science, sztucznej inteligencji, uczenia maszynowego oraz technologii chmurowych. Od lat skutecznie projektuje i wdraża strategie danych i rozwiązania uczenia maszynowego w organizacjach o złożonej strukturze, przekładając zaawansowaną analitykę na realną wartość biznesową. Specjalizuje się w projektach dla branży farmaceutycznej i medycznej – od analizy danych klinicznych, przez przetwarzanie dokumentacji medycznej i systemy wspomagania decyzji, po rozwiązania AI wspierające badania i rozwój. Realizował również projekty dla przemysłu farmaceutycznego wspierające sprzedaż i marketing, w tym zaawansowaną analitykę komercyjną, segmentację klientów, prognozowanie popytu oraz optymalizację działań promocyjnych. Jednocześnie posiada szerokie doświadczenie w sektorach takich jak bankowość, produkcja, przemysł motoryzacyjny oraz handel, gdzie realizował projekty z zakresu optymalizacji procesów, analityki predykcyjnej, systemów rekomendacyjnych oraz przetwarzania dużych wolumenów danych

Wszystkie artykuły autora

Zostaw komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Może Cię również zainteresować

ZAPISZ SIĘ I BĄDŹ NA BIEŻĄCO

Newsletter blogowy

Dołącz do nas

Sprawdź oferty pracy

Pokaż wyniki
Dołącz do nas Kontakt

This content is available only in one language version.
You will be redirected to home page.

Are you sure you want to leave this page?