IA in sanità: perché senza qualità dei dati non funziona

IA nella Sanità Italiana: Innovazione ClinicaBy 3L3C

L’IA in sanità italiana fallisce senza dati clinici affidabili. Ecco perché la qualità del dato conta più della quantità e cosa possono fare oggi le strutture.

IA in sanitàqualità dei dati sanitarisanità digitalediagnostica per immaginidata governancefascicolo sanitario elettronico
Share:

Featured image for IA in sanità: perché senza qualità dei dati non funziona

IA in sanità: perché senza qualità dei dati non funziona

Nel 2025 oltre l’80% dei progetti di intelligenza artificiale in sanità in Europa resta in fase pilota o viene sospeso prima della piena adozione. Il motivo non è (solo) la tecnologia, ma qualcosa di molto più banale e scomodo: la scarsa qualità dei dati sanitari.

Chi lavora in una struttura sanitaria italiana lo vede ogni giorno: esami duplicati, cartelle cliniche incomplete, codifiche diverse per lo stesso esame tra ASL e regione, sistemi che non si parlano. Eppure ci aspettiamo che la stessa materia prima con cui oggi fatichiamo a fare report affidabili diventi la base per diagnosi supportate da IA, medicina personalizzata, ospedale digitale e telemedicina.

Questo articolo, che si inserisce nella serie “IA nella Sanità Italiana: Innovazione Clinica”, prova a mettere il dito nella piaga: senza dati sanitari affidabili, completi e interoperabili, l’IA in sanità non è solo meno efficace, è potenzialmente rischiosa. Vediamo perché, cosa sta cambiando in Europa e in Italia, e quali decisioni concrete può prendere oggi un direttore sanitario o un CIO di azienda ospedaliera.


1. Dal mito della privacy al tema scomodo: sicurezza e qualità del dato

La sanità italiana ha passato gli ultimi dieci anni a parlare quasi solo di privacy. Sacrosanto. Ma molte volte la privacy è stata usata come scudo per non affrontare il nodo vero: come raccogliamo, proteggiamo e soprattutto qualifichiamo i dati clinici.

Oggi il quadro normativo europeo è chiaro e sempre più integrato:

  • Data Act: disciplina accesso e uso dei dati, anche generati da dispositivi e software medicali
  • AI Act: regole stringenti per i sistemi di IA ad alto rischio, tra cui quelli sanitari
  • progetto di European Health Data Space (EHDS): infrastruttura comune per scambiare e riutilizzare dati sanitari in UE
  • in Italia, una legge nazionale sull’IA che dovrà tradurre questi principi nei contesti pubblici e sanitari

Queste norme puntano tutte nella stessa direzione: uso sicuro, trasparente e responsabile del dato sanitario, per ricerca, pianificazione e innovazione clinica.

Il punto è che privacy e sicurezza del dato non sono la stessa cosa:

  • la privacy tutela i diritti individuali della persona
  • la sicurezza tutela integrità, affidabilità e disponibilità delle informazioni

Senza sicurezza non esiste privacy. Ma senza qualità del dato, neppure la sicurezza genera valore.

Se una risonanza è archiviata ma non associata correttamente al paziente, se un referto è incompleto o codificato in modo incoerente, quel dato è “sicuro” ma clinicamente quasi inutile. Per l’IA, è veleno.


2. Non ci manca la quantità di dati, ci manca qualità

Ogni giorno il Servizio Sanitario Nazionale produce milioni di dati:

  • accessi al pronto soccorso
  • esami di laboratorio e di diagnostica per immagini
  • note di dimissione e referti ambulatoriali
  • dati di telemonitoraggio e dispositivi indossabili

Il problema non è avere dati. È avere dati:

  • completi (campi clinici compilati, tempi e contesti chiari)
  • coerenti (stesse codifiche, stesse unità di misura, stessi standard)
  • interoperabili (capaci di “parlare” con altri sistemi, dentro e fuori la struttura, a livello nazionale ed europeo)

Pensare che la competitività di un sistema sanitario stia nell’accumulo di informazioni è un errore strategico.

La vera domanda è: quanta parte di questi dati è effettivamente riusabile per IA, ricerca clinica, governo dei percorsi e medicina personalizzata? Nella maggioranza delle aziende sanitarie italiane la percentuale realistica non supera il 20-30%.

Un esempio concreto: il Green Pass come prova tecnica di interoperabilità

Durante la pandemia, il certificato vaccinale europeo è stato uno dei pochi casi in cui i Paesi UE hanno dovuto davvero concordare:

  • quali dati scambiare
  • in che formato
  • con quali regole di validazione

È stata la prima grande prova di interoperabilità reale dei dati sanitari su scala europea. Funzionava perché lo schema dati era rigido, i controlli chiari, l’uso molto preciso.

Da quella esperienza sono passati anni. Non è accettabile che molte regioni italiane abbiano ancora fascicoli sanitari elettronici frammentati, non standardizzati, difficili da usare sia per i clinici sia per gli algoritmi.

La sfida oggi è almeno tripla:

  1. tecnica: standard, architetture, integrazioni
  2. organizzativa: governance dei dati, ruoli chiari, responsabilità
  3. culturale: passare dall’idea di “archiviare documenti” all’idea di curare set di dati clinici

3. Diagnostica per immagini e IA: se il dato è sporco, l’algoritmo sbaglia

La diagnostica per immagini è il terreno dove l’IA clinica sta facendo più passi avanti: radiologia, neuroradiologia, screening oncologici, cardiologia. Ma è anche l’area dove i limiti della qualità dei dati emergono più duramente.

Un algoritmo di IA per la radiologia ha bisogno di migliaia o milioni di immagini, ognuna associata a:

  • dati anagrafici essenziali
  • parametri tecnici dell’esame
  • referto strutturato o almeno ben descrittivo
  • conferma diagnostica a distanza di tempo (follow-up)

Se:

  • le immagini sono acquisite con protocolli molto diversi ma non dichiarati
  • i referti sono scritti solo in linguaggio libero, senza concetti codificati
  • mancano gli esiti a lungo termine

allora il modello apprende in modo distorto. Risultato: performance buone in laboratorio, deludenti (o sbilanciate) nella pratica clinica.

Come la qualità dei dati impatta l’affidabilità

Nella pratica, la qualità dei dati in radiologia incide su:

  • accuratezza: meno errori di classificazione o di segmentazione
  • robustezza: l’algoritmo regge cambiamenti di macchine, ospedale o popolazione
  • equità: non penalizza alcune fasce di pazienti (per età, genere, comorbilità)

Se gli algoritmi sono addestrati quasi solo su un certo tipo di pazienti (ad esempio, adulti senza comorbilità complesse) perché i dati degli altri sono incompleti o sporchi, avremo una IA clinicamente iniqua. Formalmente a norma, ma pericolosa.

Questa è la ragione per cui chi vuole fare sul serio IA in sanità in Italia deve mettere tra le priorità del 2026:

  • progetti strutturati di data quality clinica
  • definizione congiunta (clinici + ICT) di criteri minimi per i dataset
  • sistema di audit continuo dei dati che alimentano gli algoritmi

4. Dall’approccio difensivo all’approccio abilitante ai dati sanitari

Molte direzioni sanitarie hanno adottato, spesso per prudenza, una linea non dichiarata ma diffusissima: “meglio non usare i dati, così non rischiamo”.

Risultato pratico:

  • ricerca clinica rallentata o costretta a cercare partner esteri
  • sperimentazioni di IA che restano bloccate al comitato etico
  • fuga di progetti e investimenti verso Paesi che gestiscono il dato in modo più efficiente

La frase che si sente fin troppo spesso è: “non si può per motivi di privacy”. In molti casi, però, la privacy è diventata un alibi per non decidere.

La strada matura è un’altra:

  • protezione dei dati come prerequisito, non come alibi
  • progettazione privacy-by-design e security-by-design, non a posteriori
  • uso sistematico di pseudonimizzazione e controlli d’accesso granulari

Un nuovo patto di fiducia con cittadini e professionisti

Perché i cittadini italiani accettino che i loro dati sanitari vengano usati per IA, ricerca e pianificazione, serve un patto di fiducia chiaro:

  • spiegare in modo comprensibile chi usa i dati, per cosa e con quali garanzie
  • mostrare benefici concreti: meno esami inutili, percorsi più rapidi, diagnosi più precoci
  • dare strumenti reali di controllo: accesso al fascicolo, log degli accessi, possibilità di scelta

La fiducia non nasce da un pop-up di consenso. Nasce da anni di coerenza tra dichiarato e fatto, supportata da infrastrutture sicure e dati curati.


5. Umanologia dei dati: 5 principi per progettare IA clinica che funzioni davvero

Nel dibattito sull’IA in sanità c’è spesso una falsa alternativa: o sei “pro innovazione” o sei “pro etica”. L’approccio umanologico suggerito da Alex Dell’Era rovescia il tavolo: o riportiamo la logica umana al centro, o nessuna tecnologia reggerà.

Applicato ai dati sanitari, questo paradigma si traduce in cinque pillar molto concreti.

1. Etica prima della norma

Gestire il dato secondo la dignità della persona, non solo secondo la convenienza o il minimo legale:

  • condividere dati solo se c’è un beneficio plausibile per il paziente o la collettività
  • evitare ogni uso opaco o difficilmente spiegabile
  • prevedere sempre un canale di feedback per pazienti e operatori

2. Empatia: il dato come relazione, non solo come record

Ogni richiesta di dati ha un effetto sulla relazione medico-paziente:

  • spiegare perché si chiede una certa autorizzazione
  • dare il tempo di fare domande
  • evitare questionari infiniti e incomprensibili

Un paziente informato e rispettato collabora, aderisce meglio alle cure e accetta più volentieri l’uso dei propri dati per scopi di ricerca o IA.

3. Chiarezza: niente scatole nere incomprensibili

I sistemi di IA clinica devono essere spiegabili almeno a tre livelli:

  • a chi li sviluppa
  • a chi li usa (clinici, infermieri, farmacisti)
  • a chi ne è oggetto (pazienti e caregiver)

Se la complessità tecnica diventa “magia nera”, l’effetto è sempre lo stesso: resistenza, rifiuto, blocchi regolatori.

4. Sostenibilità: infrastrutture pensate per 10 anni, non per 10 mesi

Ogni scelta tecnologica sul dato deve chiedersi:

  • questo formato sarà leggibile e interoperabile tra 5–10 anni?
  • sto creando un nuovo silo o sto rafforzando un ecosistema integrato?

Nel contesto dell’European Health Data Space, continuare a costruire piccoli sistemi chiusi è semplicemente miope.

5. Co-valore: il dato sanitario come bene collettivo

Il dato sanitario non è “oro da monetizzare”, ma risorsa collettiva che genera valore solo se condivisa in modo responsabile:

  • dataset regionali e nazionali accurati per pianificare servizi e ridurre liste d’attesa
  • basi dati di qualità per ricerca indipendente e sviluppo di IA clinica utile, anche in Italia
  • ritorni concreti ai cittadini: meno sprechi, percorsi più personalizzati, cure più accessibili

6. Cosa può fare oggi una struttura sanitaria italiana

Parlare di qualità dei dati resta astratto se non lo traduciamo in scelte operative. Ecco alcune mosse pragmatiche che un’azienda sanitaria, un IRCCS o una grande casa di cura possono avviare nel 2026.

1. Nominare una vera Data Governance sanitaria

Non bastano il DPO e il responsabile dei sistemi informativi. Serve una cabina di regia dei dati clinici, con dentro:

  • direzione sanitaria
  • IT e cybersecurity
  • rappresentanti dei reparti clinici chiave
  • talvolta farmacia ospedaliera e servizio qualità

Compito: definire standard, priorità di bonifica, criteri minimi di qualità per i dataset di IA.

2. Partire da un use case clinico ad alto impatto

Invece di voler “sistemare tutti i dati”, scegliere un ambito pilota con impatto chiaro, ad esempio:

  • radiologia oncologica (screening mammografico, polmone, colon)
  • percorsi scompenso cardiaco
  • cronicità ad alto costo (BPCO, diabete)

Su quell’area:

  • mappare fonti dati
  • definire campi minimi obbligatori
  • avviare processi di pulizia e standardizzazione

3. Misurare la qualità del dato con indicatori semplici

Non serve un framework perfetto per iniziare. Bastano pochi KPI chiari, per esempio:

  • percentuale di esami con campi chiave completi
  • numero medio di duplicazioni per paziente
  • coerenza tra codifica diagnosi e referto

E soprattutto: collegare questi indicatori a obiettivi dei reparti e della direzione.

4. Coinvolgere i clinici fin dall’inizio

Se la qualità del dato è vista come “roba informatica”, i risultati saranno modesti. I clinici devono:

  • definire cosa è clinicamente essenziale in un dataset
  • convalidare regole di controllo e pulizia
  • vedere rapidamente benefici: meno errori, meno ridigitazione, supporti decisionali più utili

Verso una sanità digitale italiana che si fida dei propri dati

Per la serie “IA nella Sanità Italiana: Innovazione Clinica”, questo è il punto chiave: l’IA non è un progetto IT, è la conseguenza di anni di scelte sui dati.

Investire nella qualità dei dati sanitari non è un lusso tecnologico. È un atto di responsabilità verso pazienti, professionisti e sistema pubblico.

  • rende la ricerca più credibile
  • rende le politiche sanitarie più eque
  • rende le imprese che sviluppano soluzioni di IA più serie e meno dipendenti da dati esteri

La tecnologia può generare milioni di record. La vera innovazione sta nel trasformare quei record in conoscenza affidabile e quella conoscenza in decisioni cliniche migliori.

L’Europa sta costruendo norme e infrastrutture come l’European Health Data Space. L’Italia ha tutte le competenze cliniche e tecnologiche per essere protagonista, non spettatrice. La vera domanda, ora, è se le nostre strutture sanitarie avranno il coraggio di spostare budget e attenzione dall’ennesimo software al cantiere, meno visibile ma decisivo, della qualità dei dati.

Chi inizierà per tempo, nei prossimi 3–5 anni non avrà solo IA più accurata: avrà anche più fiducia da parte di cittadini e professionisti. E questa, nel lungo periodo, è la risorsa più preziosa della sanità digitale italiana.