AI i kliniska studier: lÀrdomar nÀr EMA sÀger nej

AI inom lĂ€kemedel och bioteknik‱‱By 3L3C

EMA:s nej i Alzheimer visar var kliniska data brister. SÄ kan AI stÀrka patienturval, endpoints och evidens inför regulatoriska beslut.

AlzheimerEMAkliniska studierAIbiomarkörerlÀkemedelsutveckling
Share:

Featured image for AI i kliniska studier: lÀrdomar nÀr EMA sÀger nej

AI i kliniska studier: lÀrdomar nÀr EMA sÀger nej

Den 2025-12-15 kom en pÄminnelse som mÄnga inom lÀkemedel och bioteknik kÀnner i magen: EMA:s expertkommitté CHMP rekommenderade inte villkorat marknadsgodkÀnnande för blarcamesin, en oral lÀkemedelskandidat för tidig Alzheimers sjukdom. För patienter och anhöriga kÀnns det som Ànnu ett uppskjutet hopp. För utvecklingsteamen Àr det ett brutalt kvitto pÄ samma sak som alltid: neurodegenerativa sjukdomar Àr svÄra, och evidenskraven Àr höga.

Jag tycker att sĂ„dana hĂ€r avslag ofta misstolkas som ”misslyckanden”. I praktiken Ă€r de lika ofta en signal om att vĂ„r metod för att vĂ€lja rĂ€tt patienter, rĂ€tt effektmĂ„tt och rĂ€tt datapaket inte rĂ€cker. Och hĂ€r finns en konkret möjlighet: AI i lĂ€kemedelsutveckling kan hjĂ€lpa oss att komma till EMA med mer robusta, mer sammanhĂ€ngande och mer patientrelevanta bevis – tidigare.

Den hĂ€r texten Ă€r en del av serien ”AI inom lĂ€kemedel och bioteknik”. Fokus Ă€r inte att spekulera i just en enskild kandidats öde, utan att anvĂ€nda nyheten som ett case: vad sĂ€ger ett CHMP-nej om dataluckor – och hur kan AI minska risken att hamna dĂ€r igen?

Vad ett CHMP-nej faktiskt betyder (och varför det hÀnder)

Ett CHMP-nej betyder i praktiken att den samlade nyttan–risken inte bedöms tillrĂ€ckligt positiv för den ansökta indikationen och populationen – Ă€ven om det kan finnas lovande signaler. För villkorade godkĂ€nnanden gĂ€ller dessutom en extra balans: det mĂ„ste finnas övertygande sannolikhet att nyttan Ă€r kliniskt meningsfull, samtidigt som företaget kan leverera kompletterande data efter godkĂ€nnandet.

I Alzheimer blir detta extra tydligt. Sjukdomen har lĂ„ng progression, hög biologisk heterogenitet och stor variation i hur snabbt patienter försĂ€mras. Det gör att tvĂ„ studier som ”ser likadana ut” pĂ„ papper kan ge helt olika resultat om patientmixen skiljer sig.

Tre vanliga orsaker till avslag i neurodegenerativa ansökningar

Det gÄr att generalisera nÄgra Äterkommande mönster (utan att pÄstÄ att alla gÀller hÀr):

  1. Otydlig klinisk effekt: FörÀndring i kognitiva skalor kan vara statistiskt signifikant men ÀndÄ kliniskt svÄrtolkad.
  2. Fel patientsegment: Effekten finns kanske bara i en subgrupp (t.ex. viss biomarkörprofil), men studien Àr inte designad för att bevisa det.
  3. Data som inte ”hĂ€nger ihop”: PrimĂ€ra och sekundĂ€ra endpoints, biomarkörer, bilddata och sĂ€kerhet pekar inte Ă„t samma hĂ„ll.

NĂ€r CHMP sĂ€ger nej Ă€r det ofta en kombination av dessa. Budskapet till branschen Ă€r tydligt: visa mig en konsekvent kedja frĂ„n mekanism → biomarkör → klinisk nytta → acceptabel sĂ€kerhet.

DÀr Alzheimerstudier ofta faller: heterogenitet och mÀtproblem

Alzheimer Àr inte en enhetlig sjukdom i klinisk mening. TvÄ personer med samma diagnos kan ha olika dominanta patologier (amyloid, tau, vaskulÀr komponent, inflammation), olika samsjuklighet och olika kognitiv reserv. Om en prövning rekryterar brett riskerar man att spÀda ut en verklig effekt.

LÀgg till att mÄnga effektmÄtt Àr brusiga:

  • Kognitiva test pĂ„verkas av dagsform, utbildningsnivĂ„, sprĂ„k och testvana.
  • Funktionella skalor kan pĂ„verkas av stöd i hemmet och socioekonomi.
  • Bild- och biomarkördata Ă€r dyra och samlas in ojĂ€mt mellan sites.

Det Ă€r just hĂ€r AI har sin mest jordnĂ€ra nytta. Inte som magi – utan som ett sĂ€tt att minska brus och öka precisionen i vem vi inkluderar, vad vi mĂ€ter och hur vi tolkar utfallet.

Hur AI kan stĂ€rka evidensen inför EMA – i praktiken

AI kan bidra i flera steg av kedjan som CHMP i praktiken granskar. Nyckeln Àr att anvÀnda AI som beslutsstöd och att förregistrera analysplaner sÄ att man undviker efterhandskonstruktioner.

Patientstratifiering som minskar risken att ”spĂ€da ut” effekten

Det mest vÀrdefulla AI kan göra i tidig Alzheimer Àr ofta att förbÀttra patientstratifiering.

Konkreta angreppssÀtt:

  • Multimodal fenotypning: kombinera baseline-data frĂ„n kognition, laboratorier, MR/PET, digitala tester och demografi för att identifiera mer homogena kluster.
  • Progressionsmodeller: ML-modeller som förutspĂ„r förvĂ€ntad försĂ€mring under 12–24 mĂ„nader. DĂ„ kan studien rikta in sig pĂ„ patienter dĂ€r förĂ€ndring faktiskt Ă€r mĂ€tbar.
  • Biomarkördriven enrichment: AI kan hjĂ€lpa till att vĂ€lja cut-offs och kombinationer av biomarkörer (t.ex. A/T/N-liknande profiler) som bĂ€ttre matchar kandidatens mekanism.

En mening jag ofta Ă„terkommer till i projekt: ”Om du inte kan beskriva din responder-population, har du inte hittat den Ă€n.” AI hjĂ€lper till att göra den beskrivningen konkret och testbar.

Smartare endpoints: frÄn brusiga skalor till signal som gÄr att lita pÄ

EMA vill se klinisk relevans. Samtidigt Àr det svÄrt att fÄ tydliga signaler i korta studier. AI kan hjÀlpa till att skapa eller förbÀttra endpoints utan att byta ut kliniken.

Exempel pÄ mer robust mÀtning:

  • Digitala biomarkörer (t.ex. tal, motorik, sömn, kognitiva mikrotester) som samlas oftare och kan ge bĂ€ttre signal–brus-förhĂ„llande.
  • Bildanalys med deep learning för mer standardiserade MR-volymmĂ„tt eller lesion/atrofi-mönster, mindre site-varians.
  • KompositmĂ„tt: ML kan optimera vikter mellan delskalor för att maximera kĂ€nslighet för förĂ€ndring, men mĂ„ste göras transparent och valideras strikt.

HĂ€r finns en fallgrop: AI-endpoints fĂ„r inte bli en ”svart lĂ„da”. För regulatorisk acceptans krĂ€vs spĂ„rbarhet, validering och förstĂ„else för vad modellen mĂ€ter.

Datakvalitet och avvikelsedetektion: trÄkigt men avgörande

MÄnga studier tappar kraft av praktiska skÀl: protokollavvikelser, felkodning, avvikande sites, fördröjda besök. AI kan bidra med riskbaserad monitorering och tidig varning.

Det handlar om att hitta mönster som mÀnniskor missar i realtid:

  • ovanligt lĂ„g varians i ett site (kan tyda pĂ„ slentrianpoĂ€ngsĂ€ttning)
  • systematiska skillnader i patientmix mellan regioner
  • dropout-mönster kopplat till biverkningar eller logistiska hinder

Det hĂ€r Ă€r inte glamouröst, men kan vara skillnaden mellan ”oklar effekt” och ”tillrĂ€ckligt tydlig effekt”.

Simuleringar som gör utvecklingsplanen vassare

AI och avancerad statistik kan stÀrka beslut lÄngt innan fas 3:

  • Virtuella kontrollarmar (med stor försiktighet) för att testa antaganden och designa studier mer effektivt.
  • Bayesianska adaptiva designer som tidigt kan styra om rekrytering mot subgrupper med högre sannolikhet att svara.
  • Power- och scenarioanalys baserat pĂ„ realistiska progressionskurvor, inte bara historiska medelvĂ€rden.

Regulatoriskt krÀver detta tydlighet: vad Àr förregistrerat, vad Àr explorativt, och hur undviker man bias?

”AI löser det” Ă€r fel – men AI kan göra en sak bĂ€ttre Ă€n vi

Den dÄliga nyheten: AI kan inte rÀdda en kandidat som saknar biologisk effekt. Den bra nyheten: AI Àr överlÀgset pÄ att hitta struktur i komplexa data och göra variation begriplig.

HÀr Àr en mer realistisk mÄlbild som jag tycker hÄller i verkliga projekt:

AI ska inte bevisa effekt Ät dig. AI ska minska sannolikheten att du designar en studie som inte kan upptÀcka en effekt som faktiskt finns.

Det skiftet Àr viktigt. DÄ blir AI en del av kvalitetssystemet och utvecklingsstrategin, inte en sista minuten-analys nÀr resultaten redan Àr svÄra att tolka.

Praktisk checklista inför nÀsta Alzheimerprogram (eller ansökan)

Om du jobbar i biotech, klinisk utveckling eller datateam och vill minska risken att hamna i ett CHMP-lÀge dÀr evidensen inte rÀcker, Àr det hÀr en konkret start:

  1. Definiera responder-hypotesen tidigt: vilka biologiska och kliniska markörer ska samvariera om lÀkemedlet fungerar?
  2. Bygg en gemensam datamodell: kognition, biomarkörer, bilddata, sÀkerhet och PROs ska vara harmoniserade redan frÄn dag 1.
  3. Validera AI pÄ externa data: intern korsvalidering rÀcker inte nÀr du gÄr mot regulatorisk anvÀndning.
  4. Gör modellen tolkbar dÀr det gÄr: anvÀnd t.ex. feature-attribution och stabilitetsanalyser och dokumentera.
  5. Förregistrera analysplaner: sÀrskilt om AI pÄverkar primÀra beslut som inklusionskriterier eller endpoint-konstruktion.
  6. Planera för regulatorisk dialog: AI-komponenter behöver lika tydlig ”CMC-liknande” dokumentation som annan kritisk metodik.

Det hÀr Àr arbete som mÄnga team skjuter upp. Jag tycker det Àr ett misstag, sÀrskilt i Alzheimer dÀr varje procentenhet mindre brus Àr dyrbar.

Vad betyder detta för Sverige och vÄr AI-satsning i life science?

Sverige har en praktisk fördel i AI för kliniska studier: vi Àr bra pÄ register, vÄrddata och samarbete mellan akademi, sjukvÄrd och industri. Men för att det ska bli regulatoriskt relevant mÄste vi lÀgga mer energi pÄ tre saker:

  • Datastandarder och interoperabilitet (sĂ„ att modeller kan trĂ€nas och valideras brett)
  • Prospektiv insamling av digitala biomarkörer och real world data, inte bara retrospektiva projekt
  • Kompetens i grĂ€nslandet mellan ML, klinik och regulatorik

Den hÀr typen av CHMP-beslut Àr en pÄminnelse om att innovation inte belönas för att den Àr smart. Den belönas nÀr den Àr bevisad, begriplig och reproducerbar.

NÀsta steg: gör AI till en del av evidenspyramiden

EMA:s nej till blarcamesin visar hur hÄrt evidenskraven slÄr nÀr data lÀmnar tolkningsutrymme. Min take Àr enkel: om vi vill öka trÀffsÀkerheten i Alzheimerutveckling mÄste vi sluta behandla kliniska data som en rapport i slutet av projektet och börja behandla den som en produkt som kan byggas, testas och kvalitetssÀkras.

AI i kliniska studier passar perfekt dĂ€r. RĂ€tt anvĂ€nt hjĂ€lper det oss att vĂ€lja bĂ€ttre populationer, mĂ€ta mer stabilt och presentera en mer sammanhĂ€ngande nytta–risk-berĂ€ttelse inför EMA.

Om du stod inför att designa om en Alzheimerstudie i dag: vilken del hade du först velat göra mindre brusig – patienturvalet, endpoints eller datakvaliteten?