L’IA in sanità italiana non fallisce per colpa degli algoritmi, ma per colpa dei dati. Ecco perché la qualità dei dati è la vera leva per una sanità digitale affidabile.
La maggior parte dei progetti di intelligenza artificiale in sanitĂ italiana non fallisce per colpa degli algoritmi, ma per colpa dei dati. O meglio: per colpa di dati incompleti, incoerenti, difficili da riutilizzare.
Questo tema pesa ancora di piĂą a fine 2025, mentre le strutture sanitarie stanno cercando di trasformare PNRR, Fascicolo Sanitario Elettronico 2.0 e AI Act in progetti concreti: telemedicina, diagnostica per immagini avanzata, triage intelligente, medicina personalizzata. Tutto promettente, ma senza dati di qualitĂ restano slide.
In questa tappa della serie “IA nella Sanità Italiana: Innovazione Clinica” guardiamo il problema da un altro angolo: non “come usare più dati”, ma come usare meglio i dati sanitari per rendere davvero utile l’intelligenza artificiale, rispettando i cittadini e costruendo fiducia.
Sanità digitale, IA e nuove regole: il nodo non è la privacy
Per far funzionare l’IA in sanità servono tre elementi che camminano insieme: norme chiare, sicurezza del dato e qualità dei dati. L’Europa ha già messo sul tavolo la parte normativa.
Oggi abbiamo:
- il Data Act, che disciplina accesso e uso dei dati;
- l’AI Act, che definisce obblighi e responsabilità per i sistemi di IA, con particolare attenzione a quelli “ad alto rischio” come quelli sanitari;
- lo European Health Data Space, che punta a creare uno spazio europeo dei dati sanitari, con regole comuni per riuso, ricerca e interoperabilitĂ ;
- una legge italiana sull’IA che prova a tradurre tutto questo nel contesto del nostro Servizio Sanitario Nazionale.
Il fraintendimento frequente? Nel dibattito pubblico si mescolano privacy e sicurezza del dato, come se fossero sinonimi. Non lo sono.
- Privacy = tutela dei diritti della persona, controllo su chi usa i dati e per quali finalitĂ .
- Sicurezza del dato = garanzia che quelle informazioni siano integre, disponibili, protette da accessi non autorizzati e da alterazioni.
La frase chiave, che chi lavora su IA clinica dovrebbe tenere incorniciata è: senza sicurezza la privacy non esiste, ma senza qualità la sicurezza non genera valore.
Un dataset perfettamente protetto ma pieno di errori, duplicati, campi mancanti, referti non strutturati è “sicuro” ma praticamente inutile. E questo, per l’IA clinica, è un problema enorme.
Il vero problema della sanitĂ digitale italiana: troppi dati, pochi buoni
La sanità digitale italiana produce quantità impressionanti di dati: referti radiologici, cartelle cliniche elettroniche, dispositivi indossabili, telemonitoraggio, app per la cronicità . Il punto è che molta di questa informazione non è pronta per essere usata in modo intelligente.
Tre domande scomode che qualunque direzione sanitaria dovrebbe farsi prima di avviare un progetto di IA:
- I nostri dati sono completi o mancano pezzi fondamentali (es. diagnosi, esiti, follow-up)?
- Sono standardizzati o ogni reparto usa codifiche, formati e convenzioni diverse?
- Sono confrontabili tra strutture, regioni, Paesi?
Durante la pandemia il “green pass” è stato, di fatto, il primo vero esperimento di interoperabilità sanitaria europea: milioni di certificati, emessi in Paesi diversi, letti con la stessa logica ovunque. Non era perfetto, ma ha dimostrato che quando lo standard è chiaro, il sistema regge.
Adesso però siamo oltre l’emergenza. Perché l’IA diagnostica, la telemedicina o la medicina predittiva funzionino, non basta “avere molti dati”: serve che quei dati siano ben progettati a monte.
Per le strutture sanitarie italiane questo significa spostare l’attenzione da:
- progetti one-shot “per accumulare dati” a
- una governance dei dati clinici continua, con ruoli, processi e indicatori chiari sulla qualitĂ .
Diagnostica per immagini e IA: se i dati sono scarsi, l’algoritmo sbaglia
La radiologia è il banco di prova perfetto per capire perché la qualità del dato è decisiva.
Gli algoritmi di diagnostica per immagini (per TC, RM, Rx, mammografie) imparano da migliaia di immagini annotate. Ma se:
- i protocolli di acquisizione variano troppo da macchina a macchina;
- le immagini non sono legate a referti strutturati;
- le diagnosi non sono verificate o sono espresse solo in testo libero;
il risultato è un modello addestrato su basi fragili, con performance ottime “in laboratorio” e deludenti nel mondo reale.
Che cosa serve davvero a un progetto di IA in radiologia
Da chi lavora su questi progetti nelle aziende sanitarie italiane mi sento di dire che ci sono alcuni requisiti minimi, spesso sottovalutati:
- Standard DICOM e HL7/FHIR applicati sul serio, non solo a parole, con metadata completi e puliti.
- Referti strutturati, con codifiche standard (es. RadLex, SNOMED CT) almeno per le principali patologie e findings.
- Dataset bilanciati, che rappresentino popolazioni e casistiche diverse (non solo il “paziente tipo” di un singolo IRCCS).
- Tracciabilità delle revisioni cliniche: sapere chi ha validato l’etichetta, quando, con quali criteri.
Un esempio concreto: in un progetto su lesioni di sclerosi multipla, un centro che ha investito sui referti strutturati e su protocolli di risonanza omogenei tra macchine ha ridotto del 30-40% il tempo necessario a preparare i dati per l’AI rispetto a chi ha dovuto “ripulire” anni di referti in linguaggio naturale.
La morale è chiara: investire a monte nella qualità del dato riduce drasticamente i costi nascosti di qualsiasi progetto di IA clinica, e accelera il time-to-value.
Dal “meglio non fare” al “facciamo, ma bene”: cambiare mentalitĂ
Per anni in Italia si è ragionato così: “i dati sanitari sono delicati, quindi meglio non toccarli, altrimenti arrivano sanzioni o polemiche”. Questo ha prodotto tre effetti:
- progetti di ricerca bloccati o rallentati;
- sperimentazioni di IA spostate verso Paesi con governance piĂą chiara;
- una percezione distorta: la privacy usata come scusa per non decidere.
Non è una scelta neutrale: significa rinunciare a strumenti che potrebbero ridurre liste d’attesa, migliorare la qualità delle diagnosi, personalizzare i follow-up.
Serve un cambio di passo:
- la protezione dei dati deve restare rigidissima, ma
- l’uso dei dati deve diventare abilitante, non paralizzante.
Questo implica alcune scelte molto pratiche per una direzione aziendale o regionale:
- istituire comitati etico-tecnici che valutino i progetti di IA in base a rischio/beneficio reale, non solo in base alla paura del titolo di giornale;
- adottare policy chiare di pseudonimizzazione e anonimizzazione che consentano di usare i dati per ricerca e sviluppo in modo controllato;
- comunicare ai cittadini come vengono usati i loro dati, con che garanzie, e quali benefici collettivi ne derivano.
Senza questo patto di fiducia, nessun European Health Data Space potrĂ funzionare davvero.
Un approccio “umanologico” alla qualità dei dati sanitari
Qui entra in gioco un concetto interessante, quello di Umanologia: riportare la logica umana al centro del rapporto tra tecnologia e società . Applicato ai dati sanitari, significa che prima di chiederci “cosa possiamo fare tecnicamente”, dovremmo chiederci “che tipo di relazione vogliamo creare con pazienti e professionisti”.
I cinque pillar proposti da questo paradigma possono diventare criteri operativi per chi guida progetti di IA clinica.
1. Etica
La qualità del dato non è solo una questione di standard tecnici, ma di dignità della persona.
- Chiedersi: questo uso del dato è rispettoso del paziente o semplicemente “consentito dalla norma”?
- Progettare processi in cui il paziente possa capire e scegliere, non solo firmare consensi infiniti e incomprensibili.
2. Empatia
Un paziente informato, che percepisce rispetto e chiarezza, collabora meglio. Questo è cruciale nella sanità digitale:
- spiegare in modo semplice come funziona il Fascicolo Sanitario Elettronico e perché conviene attivarlo;
- mostrare, con esempi concreti, come i dati contribuiscono a sviluppare nuovi percorsi diagnostici o terapie piĂą efficaci.
3. Chiarezza
Se i sistemi di IA vengono presentati come “scatole nere incomprensibili”, il risultato è prevedibile: resistenza dei medici, paura dei pazienti.
Serve chiarezza su:
- quali dati vengono usati;
- come sono stati addestrati i modelli;
- quali limiti hanno (es. non sostituiscono il medico, ma supportano la decisione).
4. SostenibilitĂ
La qualità del dato è un investimento di lungo periodo. Ha poco senso rincorrere l’ultima tecnologia se l’infrastruttura informativa sotto è fragile.
Scelte sostenibili significano:
- standard condivisi tra Regioni e Aziende, per evitare 20 soluzioni diverse e incompatibili;
- piattaforme che possano crescere nel tempo, senza dover essere riscritte ogni 3 anni.
5. Co-valore
Il dato sanitario è una risorsa collettiva. Genera co-valore quando è condiviso in modo responsabile: ricerca, valutazione di esito, organizzazione delle cure.
Per le strutture italiane questo può tradursi in:
- data-lake clinici regionali con governance chiara;
- progetti di IA co-progettati tra ASL, IRCCS, universitĂ e imprese, con regole di accesso, ritorni e trasparenza definite a monte.
QualitĂ dei dati come leva strategica per l’IA in sanitĂ
Arrivati qui, il punto è piuttosto netto: investire sulla qualità dei dati sanitari non è un vezzo tecnologico, è una scelta strategica di sistema.
Gli effetti concreti sono tre:
- Ricerca piĂą credibile: dataset puliti e ben documentati riducono il rischio di risultati distorti e modelli non generalizzabili.
- Politiche sanitarie piĂą eque: analisi affidabili permettono di allocare risorse in base ai bisogni reali, non solo alle pressioni del momento.
- Innovazione clinica più rapida: i progetti di IA passano dalla fase pilota alla pratica quotidiana perché i dati sono già “pronti all’uso”.
Per chi guida una struttura sanitaria italiana oggi, la domanda utile non è più “fare o non fare IA”, ma:
Come ripensare i nostri dati clinici perché l’IA porti davvero valore ai pazienti, ai professionisti e al sistema?
Le prossime mosse che, realisticamente, un’azienda sanitaria può mettere in agenda per il 2026 sono:
- nominare un Data Officer clinico (o rafforzarne il ruolo dove esiste) con mandato chiaro su qualitĂ e governance dei dati;
- avviare un assessment della qualitĂ dei dati nei principali domini (radiologia, laboratorio, pronto soccorso, ambulatori cronici);
- definire 3-4 indicatori semplici di qualità del dato (completezza, coerenza, tempestività , riusabilità ) da monitorare come si fa con le infezioni ospedaliere o i tempi d’attesa;
- collegare ogni nuovo progetto di IA o sanitĂ digitale a un piano esplicito di data quality.
Questa serie, “IA nella Sanità Italiana: Innovazione Clinica”, continuerà a toccare casi d’uso specifici – dalla diagnostica predittiva alla gestione dei percorsi clinici. Ma c’è un filo rosso che non possiamo perdere di vista: senza dati sani, l’intelligenza artificiale resta un esercizio teorico.
La sfida dei prossimi anni non sarĂ produrre piĂą dati, ma meritarsi la fiducia di chi quei dati li genera: i pazienti. E la fiducia si costruisce con tre parole molto concrete: qualitĂ , trasparenza, responsabilitĂ .