Sanità digitale e IA: perché conta la qualità dei dati

IA nel Settore Energetico Italiano: Transizione Verde••By 3L3C

La sanità digitale non ha bisogno di più dati, ma di dati migliori: accurati, interoperabili e sicuri. Ecco perché la qualità del dato è la vera sfida dell’IA in sanità.

qualitĂ  dei datisanitĂ  digitaleintelligenza artificiale in sanitĂ data governanceprivacy e sicurezzaFascicolo Sanitario ElettronicoEuropean Health Data Space
Share:

Sanità digitale e IA: perché conta la qualità dei dati

Nel 2025 il Servizio Sanitario Nazionale genera ogni giorno milioni di dati: referti, immagini, esami di laboratorio, prescrizioni elettroniche, teleconsulti. Eppure, quando si prova a usarli per l’intelligenza artificiale clinica, la ricerca o la programmazione sanitaria regionale, spesso ci si scontra con la stessa risposta: i dati non sono pronti.

Ecco il punto: la vera sfida della sanità digitale italiana non è raccogliere più dati, ma avere dati migliori. Senza qualità, interoperabilità e sicurezza, il Fascicolo Sanitario Elettronico 2.0, lo Spazio europeo dei dati sanitari e tutti i progetti di IA in sanità restano potenzialità sulla carta.

Questo tema ha un impatto diretto su direttori generali, CIO, clinici, data scientist e aziende healthtech: la qualità del dato è ciò che separa le slide dai risultati reali. E non è solo un tema tecnico: è una questione di fiducia, governance e responsabilità pubblica.

In questo articolo vediamo:

  • perchĂ© il nuovo quadro normativo (Data Act, AI Act, EHDS) non basta da solo
  • come distinguere davvero privacy, sicurezza e qualitĂ  del dato
  • esempi concreti (radiologia, pandemia, liste d’attesa)
  • un modello pratico, l’approccio umanologico, per guidare progetti data-driven in sanitĂ 
  • alcune mosse operative che le organizzazioni sanitarie italiane possono adottare giĂ  nel 2026

1. Dal «più dati» al «dati migliori»: il cambio di paradigma

La sanità digitale italiana è passata, in pochi anni, da scarsità a abbondanza di informazioni. Ma abbondanza non significa utilizzo.

La realtà quotidiana è questa:

  • referti scritti in linguaggio libero e poco strutturato
  • codifiche diverse per la stessa patologia tra regioni e ospedali
  • esami duplicati perchĂ© i sistemi non “si parlano”
  • dataset radiologici immensi ma non annotati in modo omogeneo

Un sistema sanitario maturo non si misura dalla quantitĂ  di dati raccolti, ma dalla percentuale di dati realmente utilizzabili in sicurezza e con senso clinico.

Che cosa rende “buono” un dato sanitario

Per la sanità digitale e per l’intelligenza artificiale clinica, un dato è davvero utile quando è:

  • Accurato: corretto dal punto di vista clinico, senza errori grossolani di inserimento
  • Completo: non manca il 30% dei campi essenziali (diagnosi, tempistiche, outcome…)
  • Coerente: la stessa informazione non cambia codice o formato a seconda del reparto
  • Interoperabile: aderisce a standard (HL7 FHIR, SNOMED CT, LOINC ecc.) che permettono il dialogo tra sistemi
  • Tempestivo: disponibile quando serve per la cura o la ricerca, non 18 mesi dopo
  • Tracciabile: è sempre chiaro chi lo ha generato, quando, con quale dispositivo

Senza questi requisiti, parlare di “sanità data-driven” è marketing, non strategia.

2. Norme europee, legge italiana sull’IA e il grande equivoco sulla privacy

Con Data Act, AI Act, Spazio Europeo dei Dati Sanitari (EHDS) e la nuova legge italiana sull’intelligenza artificiale, il quadro regolatorio sta diventando chiaro e strutturato.

Il messaggio che arriva da Bruxelles e da Roma è forte:

è possibile usare i dati sanitari per cura, ricerca, pianificazione e innovazione, ma entro confini chiari di sicurezza, trasparenza e controllo.

Il problema è che, nel dibattito pubblico italiano, privacy e sicurezza del dato vengono ancora mescolate come se fossero la stessa cosa.

  • Privacy = tutela dei diritti della persona (chi può vedere cosa, per quali fini, con quali consensi)
  • Sicurezza del dato = integritĂ , disponibilitĂ , protezione tecnica contro accessi non autorizzati o perdite

E poi c’è un terzo livello, spesso dimenticato:

  • QualitĂ  del dato = capacitĂ  di quel dato di essere affidabile, riusabile, interpretabile

La frase chiave è:

senza sicurezza la privacy non esiste, ma senza qualitĂ  la sicurezza non genera valore.

Se un’azienda sanitaria investe solo su firewall, crittografia e DPIA, ma continua a produrre dati frammentati, non standardizzati e incompleti, avrà sì un “fortino” sicuro… pieno di materiale quasi inutilizzabile.

Per un progetto di intelligenza artificiale clinica o di sanità predittiva, il rischio maggiore non è solo il data breach, ma l’uso di dati scadenti che portano a:

  • bias clinici
  • decisioni sbagliate
  • perdita di fiducia da parte di clinici e cittadini

3. Diagnostica e IA: quando la qualitĂ  dei dati decide la vita di un progetto

La radiologia è il banco di prova perfetto per capire quanto la qualità del dato conti davvero.

Cosa succede a un algoritmo allenato su dati “sporchi”

Prendiamo un algoritmo di IA per:

  • rilevare microlesioni in risonanza magnetica per sclerosi multipla
  • classificare noduli polmonari in TC toracica

Se i dataset usati per l’addestramento sono:

  • etichettati in modo disomogeneo (radiologi diversi, criteri non condivisi)
  • squilibrati (prevalenza eccessiva di un sesso, di certe fasce d’etĂ , di un’unica macchina RM)
  • privi di metadati chiave (parametri di acquisizione, contesto clinico)

l’algoritmo può mostrare ottime performance nel centro che lo ha sviluppato, ma crollare in un altro ospedale italiano o in un’altra regione.

Risultato concreto:

  • il clinico non si fida
  • il comitato etico blocca l’adozione
  • il progetto pilota resta confinato a “studio di fattibilità”

Come impostare un dataset clinico “serio” per l’IA

Chi in Italia sta lavorando seriamente a IA in diagnostica sta adottando alcune pratiche chiave:

  • definizione condivisa dei criteri di annotazione tra radiologi
  • utilizzo di standard di codifica per diagnosi e procedure
  • documentazione dettagliata dei metadati di acquisizione
  • controlli periodici di data drift (come cambiano nel tempo i dati in ingresso)
  • coinvolgimento precoce di clinici, fisici medici e data engineer

Qui si vede bene il legame tra qualità del dato e competitività del Paese: chi costruisce oggi dataset seri, strutturati e interoperabili, domani potrà validare soluzioni e attrarre partnership internazionali. Chi resta alla logica del “abbiamo tante immagini, dov’è il problema?” rimarrà indietro.

4. Dalla paura di sbagliare a un uso abilitante dei dati sanitari

Per anni in Italia la gestione dei dati sanitari è stata guidata da una logica difensiva:

«meglio non fare, così non rischiamo».

Il risultato si è visto:

  • studi osservazionali bloccati o rallentati dai comitati
  • difficoltĂ  a partecipare a progetti europei per mancanza di dataset adeguati
  • innovazioni sviluppate altrove e poi “importate”, perdendo capacitĂ  di guida

La privacy è diventata spesso un alibi per non assumersi responsabilità. Il paradosso è che, così facendo, si è tutelato poco anche il cittadino: meno ricerca, meno evidenze, meno strumenti predittivi per prevenire e programmare.

Un approccio maturo, invece, fa questo:

  1. Disegna un perimetro chiaro: regole, ruoli, responsabilitĂ , processi di anonimizzazione/pseudonimizzazione
  2. Costruisce infrastrutture sicure: identity management, log di accesso, segmentazione delle reti, audit
  3. Investe nella qualitĂ  del dato: standard, controlli, stewardship, formazione
  4. Comunica con trasparenza ai cittadini come e perché i dati vengono usati

In questo modo la protezione dei dati diventa abilitante, non ostativa. Crea le condizioni per:

  • utilizzare i dati real-world per valutare farmaci e dispositivi
  • ridurre le liste d’attesa con modelli predittivi seri
  • personalizzare follow-up e prevenzione nelle cronicitĂ 

5. L’approccio umanologico ai dati sanitari: 5 pillar pratici

Il paradigma dell’Umanologia propone di riportare la logica umana al centro del rapporto tra tecnologia e società. Applicato ai dati sanitari, è sorprendentemente concreto.

Ecco i 5 pillar tradotti in scelte operative per chi gestisce progetti di sanitĂ  digitale e IA:

5.1 Etico: la dignitĂ  del paziente prima della convenienza

  • definire chiaramente gli scopi del trattamento dati: cura, ricerca, governo, innovazione
  • evitare il “function creep”: usare i dati per obiettivi diversi da quelli dichiarati
  • garantire meccanismi semplici per revocare consensi o limitare usi secondari

Domanda guida: se il paziente fosse qui al tavolo, accetterebbe questo uso del suo dato?

5.2 Empatico: la fiducia come parte del dato

  • informativa chiara, in italiano comprensibile, non solo giuridico
  • strumenti di feedback del paziente sui servizi digitali (app, FSE, telemedicina)
  • coinvolgimento delle associazioni di pazienti nei comitati di indirizzo dei progetti data-driven

Un paziente che comprende cosa succede ai suoi dati è molto più disposto a condividerli per il bene comune.

5.3 Chiarezza: rendere visibile come funzionano i sistemi

  • dashboard semplici per mostrare chi accede a cosa nel Fascicolo Sanitario
  • descrizioni trasparenti dei modelli di IA usati in clinica (scopo, limiti, livello di affidabilitĂ )
  • formazione mirata a clinici e infermieri, non solo al personale IT

La complessità tecnica non deve diventare un “muro nero” che alimenta sospetti e rifiuto.

5.4 SostenibilitĂ : infrastrutture che durano

  • scegliere standard aperti ed evitare lock-in proprietari troppo rigidi
  • progettare architetture che possano evolvere (microservizi, API, integrazioni)
  • prevedere budget pluriennali per data governance e manutenzione, non solo per i progetti pilota

SostenibilitĂ  significa anche evitare la moda del momento: meno POC sparsi e piĂą roadmap integrate.

5.5 Co-valore: il dato come bene collettivo

  • promuovere data space regionali e nazionali con regole condivise
  • definire modelli chiari di partnership pubblico–privato su dataset pseudonimizzati
  • misurare e comunicare il valore restituito alla collettivitĂ  (es. riduzione complicanze, migliori percorsi diagnostici)

Il dato sanitario non è “oro” da tenere in cassaforte né “petrolio” da estrarre a piacere: è un bene comune delicato, che genera valore solo se condiviso in modo responsabile.

6. Cosa può fare concretamente oggi una struttura sanitaria italiana

Portare la qualità del dato al centro non è un esercizio teorico. Ci sono mosse pratiche, avviabili in 6–12 mesi, che cambiano davvero lo scenario.

6.1 Nominare data owner e data steward clinici

  • ogni grande area (ricoveri, pronto soccorso, diagnostica per immagini, laboratorio, farmaceutica) ha un responsabile clinico del dato
  • questi lavorano in coppia con IT e data engineer per definire regole e controlli

6.2 Definire un set di indicatori di qualitĂ  del dato

Per esempio:

  • percentuale di referti con codifica strutturata
  • tasso di campi essenziali mancanti in cartella
  • tempo medio di disponibilitĂ  dei referti nel FSE
  • numero di incongruenze tra sistemi diversi (ad es. ADT vs LIS)

Misurare è il primo passo per migliorare.

6.3 Standardizzare dove fa davvero la differenza

  • adottare vocabolari condivisi per diagnosi, prestazioni, esiti
  • spingere i fornitori a supportare standard interoperabili
  • inserire requisiti di qualitĂ  e interoperabilitĂ  nei capitolati di gara, non solo prezzo e funzionalitĂ 

6.4 Lavorare su pochi casi d’uso, ma ben scelti

Invece di mille iniziative scollegate, scegliere 2–3 casi d’uso che uniscano:

  • forte impatto clinico/organizzativo (es. liste d’attesa, cronici, pronto soccorso)
  • fattibilitĂ  tecnica
  • possibilitĂ  di riuso dei dati per ricerca e governo clinico

Costruire qualitĂ  del dato su questi casi e poi scalare.

7. QualitĂ  del dato come atto politico e di responsabilitĂ 

Investire nella qualità dei dati sanitari non è un lusso tecnico, è una scelta politica. Significa decidere che:

  • la ricerca deve poggiare su basi solide
  • le politiche sanitarie devono essere giustificabili con numeri affidabili
  • le applicazioni di IA devono essere valutabili, spiegabili eque

La qualità del dato costruisce fiducia. E la fiducia, nella sanità digitale italiana ed europea, è il vero capitale competitivo dei prossimi anni.

Oggi abbiamo norme europee avanzate, una legge nazionale sull’IA, grandi progetti su Fascicolo Sanitario Elettronico e Spazio europeo dei dati sanitari. Il rischio non è fare troppo, ma arrivare tardi: altri sistemi sanitari stanno correndo, puntando da subito su governance e qualità.

Per chi guida aziende sanitarie, IRCCS, Regioni, aziende ICT e medtech, il messaggio è semplice:

il momento di trattare il dato sanitario come una vera infrastruttura critica – e non come sottoprodotto dell’attività clinica – è adesso.

Chi inizierà nel 2026 a costruire qualità, standard, ruoli chiari e fiducia, tra cinque anni non starà inseguendo l’innovazione in sanità digitale: la starà guidando.