La sanità digitale non ha bisogno di più dati, ma di dati migliori: accurati, interoperabili e sicuri. Ecco perché la qualità del dato è la vera sfida dell’IA in sanità .
Sanità digitale e IA: perché conta la qualità dei dati
Nel 2025 il Servizio Sanitario Nazionale genera ogni giorno milioni di dati: referti, immagini, esami di laboratorio, prescrizioni elettroniche, teleconsulti. Eppure, quando si prova a usarli per l’intelligenza artificiale clinica, la ricerca o la programmazione sanitaria regionale, spesso ci si scontra con la stessa risposta: i dati non sono pronti.
Ecco il punto: la vera sfida della sanità digitale italiana non è raccogliere più dati, ma avere dati migliori. Senza qualità , interoperabilità e sicurezza, il Fascicolo Sanitario Elettronico 2.0, lo Spazio europeo dei dati sanitari e tutti i progetti di IA in sanità restano potenzialità sulla carta.
Questo tema ha un impatto diretto su direttori generali, CIO, clinici, data scientist e aziende healthtech: la qualità del dato è ciò che separa le slide dai risultati reali. E non è solo un tema tecnico: è una questione di fiducia, governance e responsabilità pubblica.
In questo articolo vediamo:
- perché il nuovo quadro normativo (Data Act, AI Act, EHDS) non basta da solo
- come distinguere davvero privacy, sicurezza e qualitĂ del dato
- esempi concreti (radiologia, pandemia, liste d’attesa)
- un modello pratico, l’approccio umanologico, per guidare progetti data-driven in sanitĂ
- alcune mosse operative che le organizzazioni sanitarie italiane possono adottare giĂ nel 2026
1. Dal «più dati» al «dati migliori»: il cambio di paradigma
La sanità digitale italiana è passata, in pochi anni, da scarsità a abbondanza di informazioni. Ma abbondanza non significa utilizzo.
La realtà quotidiana è questa:
- referti scritti in linguaggio libero e poco strutturato
- codifiche diverse per la stessa patologia tra regioni e ospedali
- esami duplicati perché i sistemi non “si parlano”
- dataset radiologici immensi ma non annotati in modo omogeneo
Un sistema sanitario maturo non si misura dalla quantitĂ di dati raccolti, ma dalla percentuale di dati realmente utilizzabili in sicurezza e con senso clinico.
Che cosa rende “buono” un dato sanitario
Per la sanità digitale e per l’intelligenza artificiale clinica, un dato è davvero utile quando è:
- Accurato: corretto dal punto di vista clinico, senza errori grossolani di inserimento
- Completo: non manca il 30% dei campi essenziali (diagnosi, tempistiche, outcome…)
- Coerente: la stessa informazione non cambia codice o formato a seconda del reparto
- Interoperabile: aderisce a standard (HL7 FHIR, SNOMED CT, LOINC ecc.) che permettono il dialogo tra sistemi
- Tempestivo: disponibile quando serve per la cura o la ricerca, non 18 mesi dopo
- Tracciabile: è sempre chiaro chi lo ha generato, quando, con quale dispositivo
Senza questi requisiti, parlare di “sanità data-driven” è marketing, non strategia.
2. Norme europee, legge italiana sull’IA e il grande equivoco sulla privacy
Con Data Act, AI Act, Spazio Europeo dei Dati Sanitari (EHDS) e la nuova legge italiana sull’intelligenza artificiale, il quadro regolatorio sta diventando chiaro e strutturato.
Il messaggio che arriva da Bruxelles e da Roma è forte:
è possibile usare i dati sanitari per cura, ricerca, pianificazione e innovazione, ma entro confini chiari di sicurezza, trasparenza e controllo.
Il problema è che, nel dibattito pubblico italiano, privacy e sicurezza del dato vengono ancora mescolate come se fossero la stessa cosa.
- Privacy = tutela dei diritti della persona (chi può vedere cosa, per quali fini, con quali consensi)
- Sicurezza del dato = integritĂ , disponibilitĂ , protezione tecnica contro accessi non autorizzati o perdite
E poi c’è un terzo livello, spesso dimenticato:
- QualitĂ del dato = capacitĂ di quel dato di essere affidabile, riusabile, interpretabile
La frase chiave è:
senza sicurezza la privacy non esiste, ma senza qualitĂ la sicurezza non genera valore.
Se un’azienda sanitaria investe solo su firewall, crittografia e DPIA, ma continua a produrre dati frammentati, non standardizzati e incompleti, avrà sì un “fortino” sicuro… pieno di materiale quasi inutilizzabile.
Per un progetto di intelligenza artificiale clinica o di sanità predittiva, il rischio maggiore non è solo il data breach, ma l’uso di dati scadenti che portano a:
- bias clinici
- decisioni sbagliate
- perdita di fiducia da parte di clinici e cittadini
3. Diagnostica e IA: quando la qualitĂ dei dati decide la vita di un progetto
La radiologia è il banco di prova perfetto per capire quanto la qualità del dato conti davvero.
Cosa succede a un algoritmo allenato su dati “sporchi”
Prendiamo un algoritmo di IA per:
- rilevare microlesioni in risonanza magnetica per sclerosi multipla
- classificare noduli polmonari in TC toracica
Se i dataset usati per l’addestramento sono:
- etichettati in modo disomogeneo (radiologi diversi, criteri non condivisi)
- squilibrati (prevalenza eccessiva di un sesso, di certe fasce d’età , di un’unica macchina RM)
- privi di metadati chiave (parametri di acquisizione, contesto clinico)
l’algoritmo può mostrare ottime performance nel centro che lo ha sviluppato, ma crollare in un altro ospedale italiano o in un’altra regione.
Risultato concreto:
- il clinico non si fida
- il comitato etico blocca l’adozione
- il progetto pilota resta confinato a “studio di fattibilità ”
Come impostare un dataset clinico “serio” per l’IA
Chi in Italia sta lavorando seriamente a IA in diagnostica sta adottando alcune pratiche chiave:
- definizione condivisa dei criteri di annotazione tra radiologi
- utilizzo di standard di codifica per diagnosi e procedure
- documentazione dettagliata dei metadati di acquisizione
- controlli periodici di data drift (come cambiano nel tempo i dati in ingresso)
- coinvolgimento precoce di clinici, fisici medici e data engineer
Qui si vede bene il legame tra qualità del dato e competitività del Paese: chi costruisce oggi dataset seri, strutturati e interoperabili, domani potrà validare soluzioni e attrarre partnership internazionali. Chi resta alla logica del “abbiamo tante immagini, dov’è il problema?” rimarrà indietro.
4. Dalla paura di sbagliare a un uso abilitante dei dati sanitari
Per anni in Italia la gestione dei dati sanitari è stata guidata da una logica difensiva:
«meglio non fare, così non rischiamo».
Il risultato si è visto:
- studi osservazionali bloccati o rallentati dai comitati
- difficoltĂ a partecipare a progetti europei per mancanza di dataset adeguati
- innovazioni sviluppate altrove e poi “importate”, perdendo capacità di guida
La privacy è diventata spesso un alibi per non assumersi responsabilità . Il paradosso è che, così facendo, si è tutelato poco anche il cittadino: meno ricerca, meno evidenze, meno strumenti predittivi per prevenire e programmare.
Un approccio maturo, invece, fa questo:
- Disegna un perimetro chiaro: regole, ruoli, responsabilitĂ , processi di anonimizzazione/pseudonimizzazione
- Costruisce infrastrutture sicure: identity management, log di accesso, segmentazione delle reti, audit
- Investe nella qualitĂ del dato: standard, controlli, stewardship, formazione
- Comunica con trasparenza ai cittadini come e perché i dati vengono usati
In questo modo la protezione dei dati diventa abilitante, non ostativa. Crea le condizioni per:
- utilizzare i dati real-world per valutare farmaci e dispositivi
- ridurre le liste d’attesa con modelli predittivi seri
- personalizzare follow-up e prevenzione nelle cronicitĂ
5. L’approccio umanologico ai dati sanitari: 5 pillar pratici
Il paradigma dell’Umanologia propone di riportare la logica umana al centro del rapporto tra tecnologia e società . Applicato ai dati sanitari, è sorprendentemente concreto.
Ecco i 5 pillar tradotti in scelte operative per chi gestisce progetti di sanitĂ digitale e IA:
5.1 Etico: la dignitĂ del paziente prima della convenienza
- definire chiaramente gli scopi del trattamento dati: cura, ricerca, governo, innovazione
- evitare il “function creep”: usare i dati per obiettivi diversi da quelli dichiarati
- garantire meccanismi semplici per revocare consensi o limitare usi secondari
Domanda guida: se il paziente fosse qui al tavolo, accetterebbe questo uso del suo dato?
5.2 Empatico: la fiducia come parte del dato
- informativa chiara, in italiano comprensibile, non solo giuridico
- strumenti di feedback del paziente sui servizi digitali (app, FSE, telemedicina)
- coinvolgimento delle associazioni di pazienti nei comitati di indirizzo dei progetti data-driven
Un paziente che comprende cosa succede ai suoi dati è molto più disposto a condividerli per il bene comune.
5.3 Chiarezza: rendere visibile come funzionano i sistemi
- dashboard semplici per mostrare chi accede a cosa nel Fascicolo Sanitario
- descrizioni trasparenti dei modelli di IA usati in clinica (scopo, limiti, livello di affidabilitĂ )
- formazione mirata a clinici e infermieri, non solo al personale IT
La complessità tecnica non deve diventare un “muro nero” che alimenta sospetti e rifiuto.
5.4 SostenibilitĂ : infrastrutture che durano
- scegliere standard aperti ed evitare lock-in proprietari troppo rigidi
- progettare architetture che possano evolvere (microservizi, API, integrazioni)
- prevedere budget pluriennali per data governance e manutenzione, non solo per i progetti pilota
SostenibilitĂ significa anche evitare la moda del momento: meno POC sparsi e piĂą roadmap integrate.
5.5 Co-valore: il dato come bene collettivo
- promuovere data space regionali e nazionali con regole condivise
- definire modelli chiari di partnership pubblico–privato su dataset pseudonimizzati
- misurare e comunicare il valore restituito alla collettivitĂ (es. riduzione complicanze, migliori percorsi diagnostici)
Il dato sanitario non è “oro” da tenere in cassaforte né “petrolio” da estrarre a piacere: è un bene comune delicato, che genera valore solo se condiviso in modo responsabile.
6. Cosa può fare concretamente oggi una struttura sanitaria italiana
Portare la qualità del dato al centro non è un esercizio teorico. Ci sono mosse pratiche, avviabili in 6–12 mesi, che cambiano davvero lo scenario.
6.1 Nominare data owner e data steward clinici
- ogni grande area (ricoveri, pronto soccorso, diagnostica per immagini, laboratorio, farmaceutica) ha un responsabile clinico del dato
- questi lavorano in coppia con IT e data engineer per definire regole e controlli
6.2 Definire un set di indicatori di qualitĂ del dato
Per esempio:
- percentuale di referti con codifica strutturata
- tasso di campi essenziali mancanti in cartella
- tempo medio di disponibilitĂ dei referti nel FSE
- numero di incongruenze tra sistemi diversi (ad es. ADT vs LIS)
Misurare è il primo passo per migliorare.
6.3 Standardizzare dove fa davvero la differenza
- adottare vocabolari condivisi per diagnosi, prestazioni, esiti
- spingere i fornitori a supportare standard interoperabili
- inserire requisiti di qualitĂ e interoperabilitĂ nei capitolati di gara, non solo prezzo e funzionalitĂ
6.4 Lavorare su pochi casi d’uso, ma ben scelti
Invece di mille iniziative scollegate, scegliere 2–3 casi d’uso che uniscano:
- forte impatto clinico/organizzativo (es. liste d’attesa, cronici, pronto soccorso)
- fattibilitĂ tecnica
- possibilitĂ di riuso dei dati per ricerca e governo clinico
Costruire qualitĂ del dato su questi casi e poi scalare.
7. QualitĂ del dato come atto politico e di responsabilitĂ
Investire nella qualità dei dati sanitari non è un lusso tecnico, è una scelta politica. Significa decidere che:
- la ricerca deve poggiare su basi solide
- le politiche sanitarie devono essere giustificabili con numeri affidabili
- le applicazioni di IA devono essere valutabili, spiegabili eque
La qualità del dato costruisce fiducia. E la fiducia, nella sanità digitale italiana ed europea, è il vero capitale competitivo dei prossimi anni.
Oggi abbiamo norme europee avanzate, una legge nazionale sull’IA, grandi progetti su Fascicolo Sanitario Elettronico e Spazio europeo dei dati sanitari. Il rischio non è fare troppo, ma arrivare tardi: altri sistemi sanitari stanno correndo, puntando da subito su governance e qualità .
Per chi guida aziende sanitarie, IRCCS, Regioni, aziende ICT e medtech, il messaggio è semplice:
il momento di trattare il dato sanitario come una vera infrastruttura critica – e non come sottoprodotto dell’attività clinica – è adesso.
Chi inizierà nel 2026 a costruire qualità , standard, ruoli chiari e fiducia, tra cinque anni non starà inseguendo l’innovazione in sanità digitale: la starà guidando.