La sanità digitale non ha bisogno di più dati, ma di dati migliori: accurati, interoperabili e sicuri. Ecco perché la qualità del dato è la vera sfida dell’IA in sanità.
Sanità digitale e IA: perché conta la qualità dei dati
Nel 2025 il Servizio Sanitario Nazionale genera ogni giorno milioni di dati: referti, immagini, esami di laboratorio, prescrizioni elettroniche, teleconsulti. Eppure, quando si prova a usarli per l’intelligenza artificiale clinica, la ricerca o la programmazione sanitaria regionale, spesso ci si scontra con la stessa risposta: i dati non sono pronti.
Ecco il punto: la vera sfida della sanità digitale italiana non è raccogliere più dati, ma avere dati migliori. Senza qualità, interoperabilità e sicurezza, il Fascicolo Sanitario Elettronico 2.0, lo Spazio europeo dei dati sanitari e tutti i progetti di IA in sanità restano potenzialità sulla carta.
Questo tema ha un impatto diretto su direttori generali, CIO, clinici, data scientist e aziende healthtech: la qualità del dato è ciò che separa le slide dai risultati reali. E non è solo un tema tecnico: è una questione di fiducia, governance e responsabilità pubblica.
In questo articolo vediamo:
- perché il nuovo quadro normativo (Data Act, AI Act, EHDS) non basta da solo
- come distinguere davvero privacy, sicurezza e qualità del dato
- esempi concreti (radiologia, pandemia, liste d’attesa)
- un modello pratico, l’approccio umanologico, per guidare progetti data-driven in sanità
- alcune mosse operative che le organizzazioni sanitarie italiane possono adottare già nel 2026
1. Dal «più dati» al «dati migliori»: il cambio di paradigma
La sanità digitale italiana è passata, in pochi anni, da scarsità a abbondanza di informazioni. Ma abbondanza non significa utilizzo.
La realtà quotidiana è questa:
- referti scritti in linguaggio libero e poco strutturato
- codifiche diverse per la stessa patologia tra regioni e ospedali
- esami duplicati perché i sistemi non “si parlano”
- dataset radiologici immensi ma non annotati in modo omogeneo
Un sistema sanitario maturo non si misura dalla quantità di dati raccolti, ma dalla percentuale di dati realmente utilizzabili in sicurezza e con senso clinico.
Che cosa rende “buono” un dato sanitario
Per la sanità digitale e per l’intelligenza artificiale clinica, un dato è davvero utile quando è:
- Accurato: corretto dal punto di vista clinico, senza errori grossolani di inserimento
- Completo: non manca il 30% dei campi essenziali (diagnosi, tempistiche, outcome…)
- Coerente: la stessa informazione non cambia codice o formato a seconda del reparto
- Interoperabile: aderisce a standard (HL7 FHIR, SNOMED CT, LOINC ecc.) che permettono il dialogo tra sistemi
- Tempestivo: disponibile quando serve per la cura o la ricerca, non 18 mesi dopo
- Tracciabile: è sempre chiaro chi lo ha generato, quando, con quale dispositivo
Senza questi requisiti, parlare di “sanità data-driven” è marketing, non strategia.
2. Norme europee, legge italiana sull’IA e il grande equivoco sulla privacy
Con Data Act, AI Act, Spazio Europeo dei Dati Sanitari (EHDS) e la nuova legge italiana sull’intelligenza artificiale, il quadro regolatorio sta diventando chiaro e strutturato.
Il messaggio che arriva da Bruxelles e da Roma è forte:
è possibile usare i dati sanitari per cura, ricerca, pianificazione e innovazione, ma entro confini chiari di sicurezza, trasparenza e controllo.
Il problema è che, nel dibattito pubblico italiano, privacy e sicurezza del dato vengono ancora mescolate come se fossero la stessa cosa.
- Privacy = tutela dei diritti della persona (chi può vedere cosa, per quali fini, con quali consensi)
- Sicurezza del dato = integrità, disponibilità, protezione tecnica contro accessi non autorizzati o perdite
E poi c’è un terzo livello, spesso dimenticato:
- Qualità del dato = capacità di quel dato di essere affidabile, riusabile, interpretabile
La frase chiave è:
senza sicurezza la privacy non esiste, ma senza qualità la sicurezza non genera valore.
Se un’azienda sanitaria investe solo su firewall, crittografia e DPIA, ma continua a produrre dati frammentati, non standardizzati e incompleti, avrà sì un “fortino” sicuro… pieno di materiale quasi inutilizzabile.
Per un progetto di intelligenza artificiale clinica o di sanità predittiva, il rischio maggiore non è solo il data breach, ma l’uso di dati scadenti che portano a:
- bias clinici
- decisioni sbagliate
- perdita di fiducia da parte di clinici e cittadini
3. Diagnostica e IA: quando la qualità dei dati decide la vita di un progetto
La radiologia è il banco di prova perfetto per capire quanto la qualità del dato conti davvero.
Cosa succede a un algoritmo allenato su dati “sporchi”
Prendiamo un algoritmo di IA per:
- rilevare microlesioni in risonanza magnetica per sclerosi multipla
- classificare noduli polmonari in TC toracica
Se i dataset usati per l’addestramento sono:
- etichettati in modo disomogeneo (radiologi diversi, criteri non condivisi)
- squilibrati (prevalenza eccessiva di un sesso, di certe fasce d’età, di un’unica macchina RM)
- privi di metadati chiave (parametri di acquisizione, contesto clinico)
l’algoritmo può mostrare ottime performance nel centro che lo ha sviluppato, ma crollare in un altro ospedale italiano o in un’altra regione.
Risultato concreto:
- il clinico non si fida
- il comitato etico blocca l’adozione
- il progetto pilota resta confinato a “studio di fattibilità”
Come impostare un dataset clinico “serio” per l’IA
Chi in Italia sta lavorando seriamente a IA in diagnostica sta adottando alcune pratiche chiave:
- definizione condivisa dei criteri di annotazione tra radiologi
- utilizzo di standard di codifica per diagnosi e procedure
- documentazione dettagliata dei metadati di acquisizione
- controlli periodici di data drift (come cambiano nel tempo i dati in ingresso)
- coinvolgimento precoce di clinici, fisici medici e data engineer
Qui si vede bene il legame tra qualità del dato e competitività del Paese: chi costruisce oggi dataset seri, strutturati e interoperabili, domani potrà validare soluzioni e attrarre partnership internazionali. Chi resta alla logica del “abbiamo tante immagini, dov’è il problema?” rimarrà indietro.
4. Dalla paura di sbagliare a un uso abilitante dei dati sanitari
Per anni in Italia la gestione dei dati sanitari è stata guidata da una logica difensiva:
«meglio non fare, così non rischiamo».
Il risultato si è visto:
- studi osservazionali bloccati o rallentati dai comitati
- difficoltà a partecipare a progetti europei per mancanza di dataset adeguati
- innovazioni sviluppate altrove e poi “importate”, perdendo capacità di guida
La privacy è diventata spesso un alibi per non assumersi responsabilità. Il paradosso è che, così facendo, si è tutelato poco anche il cittadino: meno ricerca, meno evidenze, meno strumenti predittivi per prevenire e programmare.
Un approccio maturo, invece, fa questo:
- Disegna un perimetro chiaro: regole, ruoli, responsabilità, processi di anonimizzazione/pseudonimizzazione
- Costruisce infrastrutture sicure: identity management, log di accesso, segmentazione delle reti, audit
- Investe nella qualità del dato: standard, controlli, stewardship, formazione
- Comunica con trasparenza ai cittadini come e perché i dati vengono usati
In questo modo la protezione dei dati diventa abilitante, non ostativa. Crea le condizioni per:
- utilizzare i dati real-world per valutare farmaci e dispositivi
- ridurre le liste d’attesa con modelli predittivi seri
- personalizzare follow-up e prevenzione nelle cronicità
5. L’approccio umanologico ai dati sanitari: 5 pillar pratici
Il paradigma dell’Umanologia propone di riportare la logica umana al centro del rapporto tra tecnologia e società. Applicato ai dati sanitari, è sorprendentemente concreto.
Ecco i 5 pillar tradotti in scelte operative per chi gestisce progetti di sanità digitale e IA:
5.1 Etico: la dignità del paziente prima della convenienza
- definire chiaramente gli scopi del trattamento dati: cura, ricerca, governo, innovazione
- evitare il “function creep”: usare i dati per obiettivi diversi da quelli dichiarati
- garantire meccanismi semplici per revocare consensi o limitare usi secondari
Domanda guida: se il paziente fosse qui al tavolo, accetterebbe questo uso del suo dato?
5.2 Empatico: la fiducia come parte del dato
- informativa chiara, in italiano comprensibile, non solo giuridico
- strumenti di feedback del paziente sui servizi digitali (app, FSE, telemedicina)
- coinvolgimento delle associazioni di pazienti nei comitati di indirizzo dei progetti data-driven
Un paziente che comprende cosa succede ai suoi dati è molto più disposto a condividerli per il bene comune.
5.3 Chiarezza: rendere visibile come funzionano i sistemi
- dashboard semplici per mostrare chi accede a cosa nel Fascicolo Sanitario
- descrizioni trasparenti dei modelli di IA usati in clinica (scopo, limiti, livello di affidabilità)
- formazione mirata a clinici e infermieri, non solo al personale IT
La complessità tecnica non deve diventare un “muro nero” che alimenta sospetti e rifiuto.
5.4 Sostenibilità: infrastrutture che durano
- scegliere standard aperti ed evitare lock-in proprietari troppo rigidi
- progettare architetture che possano evolvere (microservizi, API, integrazioni)
- prevedere budget pluriennali per data governance e manutenzione, non solo per i progetti pilota
Sostenibilità significa anche evitare la moda del momento: meno POC sparsi e più roadmap integrate.
5.5 Co-valore: il dato come bene collettivo
- promuovere data space regionali e nazionali con regole condivise
- definire modelli chiari di partnership pubblico–privato su dataset pseudonimizzati
- misurare e comunicare il valore restituito alla collettività (es. riduzione complicanze, migliori percorsi diagnostici)
Il dato sanitario non è “oro” da tenere in cassaforte né “petrolio” da estrarre a piacere: è un bene comune delicato, che genera valore solo se condiviso in modo responsabile.
6. Cosa può fare concretamente oggi una struttura sanitaria italiana
Portare la qualità del dato al centro non è un esercizio teorico. Ci sono mosse pratiche, avviabili in 6–12 mesi, che cambiano davvero lo scenario.
6.1 Nominare data owner e data steward clinici
- ogni grande area (ricoveri, pronto soccorso, diagnostica per immagini, laboratorio, farmaceutica) ha un responsabile clinico del dato
- questi lavorano in coppia con IT e data engineer per definire regole e controlli
6.2 Definire un set di indicatori di qualità del dato
Per esempio:
- percentuale di referti con codifica strutturata
- tasso di campi essenziali mancanti in cartella
- tempo medio di disponibilità dei referti nel FSE
- numero di incongruenze tra sistemi diversi (ad es. ADT vs LIS)
Misurare è il primo passo per migliorare.
6.3 Standardizzare dove fa davvero la differenza
- adottare vocabolari condivisi per diagnosi, prestazioni, esiti
- spingere i fornitori a supportare standard interoperabili
- inserire requisiti di qualità e interoperabilità nei capitolati di gara, non solo prezzo e funzionalità
6.4 Lavorare su pochi casi d’uso, ma ben scelti
Invece di mille iniziative scollegate, scegliere 2–3 casi d’uso che uniscano:
- forte impatto clinico/organizzativo (es. liste d’attesa, cronici, pronto soccorso)
- fattibilità tecnica
- possibilità di riuso dei dati per ricerca e governo clinico
Costruire qualità del dato su questi casi e poi scalare.
7. Qualità del dato come atto politico e di responsabilità
Investire nella qualità dei dati sanitari non è un lusso tecnico, è una scelta politica. Significa decidere che:
- la ricerca deve poggiare su basi solide
- le politiche sanitarie devono essere giustificabili con numeri affidabili
- le applicazioni di IA devono essere valutabili, spiegabili eque
La qualità del dato costruisce fiducia. E la fiducia, nella sanità digitale italiana ed europea, è il vero capitale competitivo dei prossimi anni.
Oggi abbiamo norme europee avanzate, una legge nazionale sull’IA, grandi progetti su Fascicolo Sanitario Elettronico e Spazio europeo dei dati sanitari. Il rischio non è fare troppo, ma arrivare tardi: altri sistemi sanitari stanno correndo, puntando da subito su governance e qualità.
Per chi guida aziende sanitarie, IRCCS, Regioni, aziende ICT e medtech, il messaggio è semplice:
il momento di trattare il dato sanitario come una vera infrastruttura critica – e non come sottoprodotto dell’attività clinica – è adesso.
Chi inizierà nel 2026 a costruire qualità, standard, ruoli chiari e fiducia, tra cinque anni non starà inseguendo l’innovazione in sanità digitale: la starà guidando.