IA nel Settore Energetico Italiano: Transizione Verde•13 dicembre 2025•By 3L3C

La sanità digitale non ha bisogno di più dati, ma di dati migliori: accurati, interoperabili e sicuri. Ecco perché la qualità del dato è la vera sfida dell’IA in sanità.

qualità dei datisanità digitaleintelligenza artificiale in sanitàdata governanceprivacy e sicurezzaFascicolo Sanitario ElettronicoEuropean Health Data Space

Sanità digitale e IA: perché conta la qualità dei dati

Nel 2025 il Servizio Sanitario Nazionale genera ogni giorno milioni di dati: referti, immagini, esami di laboratorio, prescrizioni elettroniche, teleconsulti. Eppure, quando si prova a usarli per l’intelligenza artificiale clinica, la ricerca o la programmazione sanitaria regionale, spesso ci si scontra con la stessa risposta: i dati non sono pronti.

Ecco il punto: la vera sfida della sanità digitale italiana non è raccogliere più dati, ma avere dati migliori. Senza qualità, interoperabilità e sicurezza, il Fascicolo Sanitario Elettronico 2.0, lo Spazio europeo dei dati sanitari e tutti i progetti di IA in sanità restano potenzialità sulla carta.

Questo tema ha un impatto diretto su direttori generali, CIO, clinici, data scientist e aziende healthtech: la qualità del dato è ciò che separa le slide dai risultati reali. E non è solo un tema tecnico: è una questione di fiducia, governance e responsabilità pubblica.

In questo articolo vediamo:

perché il nuovo quadro normativo (Data Act, AI Act, EHDS) non basta da solo
come distinguere davvero privacy, sicurezza e qualità del dato
esempi concreti (radiologia, pandemia, liste d’attesa)
un modello pratico, l’approccio umanologico, per guidare progetti data-driven in sanità
alcune mosse operative che le organizzazioni sanitarie italiane possono adottare già nel 2026

1. Dal «più dati» al «dati migliori»: il cambio di paradigma

La sanità digitale italiana è passata, in pochi anni, da scarsità a abbondanza di informazioni. Ma abbondanza non significa utilizzo.

La realtà quotidiana è questa:

referti scritti in linguaggio libero e poco strutturato
codifiche diverse per la stessa patologia tra regioni e ospedali
esami duplicati perché i sistemi non “si parlano”
dataset radiologici immensi ma non annotati in modo omogeneo

Un sistema sanitario maturo non si misura dalla quantità di dati raccolti, ma dalla percentuale di dati realmente utilizzabili in sicurezza e con senso clinico.

Che cosa rende “buono” un dato sanitario

Per la sanità digitale e per l’intelligenza artificiale clinica, un dato è davvero utile quando è:

Accurato: corretto dal punto di vista clinico, senza errori grossolani di inserimento
Completo: non manca il 30% dei campi essenziali (diagnosi, tempistiche, outcome…)
Coerente: la stessa informazione non cambia codice o formato a seconda del reparto
Interoperabile: aderisce a standard (HL7 FHIR, SNOMED CT, LOINC ecc.) che permettono il dialogo tra sistemi
Tempestivo: disponibile quando serve per la cura o la ricerca, non 18 mesi dopo
Tracciabile: è sempre chiaro chi lo ha generato, quando, con quale dispositivo

Senza questi requisiti, parlare di “sanità data-driven” è marketing, non strategia.

2. Norme europee, legge italiana sull’IA e il grande equivoco sulla privacy

Con Data Act, AI Act, Spazio Europeo dei Dati Sanitari (EHDS) e la nuova legge italiana sull’intelligenza artificiale, il quadro regolatorio sta diventando chiaro e strutturato.

Il messaggio che arriva da Bruxelles e da Roma è forte:

è possibile usare i dati sanitari per cura, ricerca, pianificazione e innovazione, ma entro confini chiari di sicurezza, trasparenza e controllo.

Il problema è che, nel dibattito pubblico italiano, privacy e sicurezza del dato vengono ancora mescolate come se fossero la stessa cosa.

Privacy = tutela dei diritti della persona (chi può vedere cosa, per quali fini, con quali consensi)
Sicurezza del dato = integrità, disponibilità, protezione tecnica contro accessi non autorizzati o perdite

E poi c’è un terzo livello, spesso dimenticato:

Qualità del dato = capacità di quel dato di essere affidabile, riusabile, interpretabile

La frase chiave è:

senza sicurezza la privacy non esiste, ma senza qualità la sicurezza non genera valore.

Se un’azienda sanitaria investe solo su firewall, crittografia e DPIA, ma continua a produrre dati frammentati, non standardizzati e incompleti, avrà sì un “fortino” sicuro… pieno di materiale quasi inutilizzabile.

Per un progetto di intelligenza artificiale clinica o di sanità predittiva, il rischio maggiore non è solo il data breach, ma l’uso di dati scadenti che portano a:

bias clinici
decisioni sbagliate
perdita di fiducia da parte di clinici e cittadini

3. Diagnostica e IA: quando la qualità dei dati decide la vita di un progetto

La radiologia è il banco di prova perfetto per capire quanto la qualità del dato conti davvero.

Cosa succede a un algoritmo allenato su dati “sporchi”

Prendiamo un algoritmo di IA per:

rilevare microlesioni in risonanza magnetica per sclerosi multipla
classificare noduli polmonari in TC toracica

Se i dataset usati per l’addestramento sono:

etichettati in modo disomogeneo (radiologi diversi, criteri non condivisi)
squilibrati (prevalenza eccessiva di un sesso, di certe fasce d’età, di un’unica macchina RM)
privi di metadati chiave (parametri di acquisizione, contesto clinico)

l’algoritmo può mostrare ottime performance nel centro che lo ha sviluppato, ma crollare in un altro ospedale italiano o in un’altra regione.

Risultato concreto:

il clinico non si fida
il comitato etico blocca l’adozione
il progetto pilota resta confinato a “studio di fattibilità”

Come impostare un dataset clinico “serio” per l’IA

Chi in Italia sta lavorando seriamente a IA in diagnostica sta adottando alcune pratiche chiave:

definizione condivisa dei criteri di annotazione tra radiologi
utilizzo di standard di codifica per diagnosi e procedure
documentazione dettagliata dei metadati di acquisizione
controlli periodici di data drift (come cambiano nel tempo i dati in ingresso)
coinvolgimento precoce di clinici, fisici medici e data engineer

Qui si vede bene il legame tra qualità del dato e competitività del Paese: chi costruisce oggi dataset seri, strutturati e interoperabili, domani potrà validare soluzioni e attrarre partnership internazionali. Chi resta alla logica del “abbiamo tante immagini, dov’è il problema?” rimarrà indietro.

4. Dalla paura di sbagliare a un uso abilitante dei dati sanitari

Per anni in Italia la gestione dei dati sanitari è stata guidata da una logica difensiva:

«meglio non fare, così non rischiamo».

Il risultato si è visto:

studi osservazionali bloccati o rallentati dai comitati
difficoltà a partecipare a progetti europei per mancanza di dataset adeguati
innovazioni sviluppate altrove e poi “importate”, perdendo capacità di guida

La privacy è diventata spesso un alibi per non assumersi responsabilità. Il paradosso è che, così facendo, si è tutelato poco anche il cittadino: meno ricerca, meno evidenze, meno strumenti predittivi per prevenire e programmare.

Un approccio maturo, invece, fa questo:

Disegna un perimetro chiaro: regole, ruoli, responsabilità, processi di anonimizzazione/pseudonimizzazione
Costruisce infrastrutture sicure: identity management, log di accesso, segmentazione delle reti, audit
Investe nella qualità del dato: standard, controlli, stewardship, formazione
Comunica con trasparenza ai cittadini come e perché i dati vengono usati

In questo modo la protezione dei dati diventa abilitante, non ostativa. Crea le condizioni per:

utilizzare i dati real-world per valutare farmaci e dispositivi
ridurre le liste d’attesa con modelli predittivi seri
personalizzare follow-up e prevenzione nelle cronicità

5. L’approccio umanologico ai dati sanitari: 5 pillar pratici

Il paradigma dell’Umanologia propone di riportare la logica umana al centro del rapporto tra tecnologia e società. Applicato ai dati sanitari, è sorprendentemente concreto.

Ecco i 5 pillar tradotti in scelte operative per chi gestisce progetti di sanità digitale e IA:

5.1 Etico: la dignità del paziente prima della convenienza

definire chiaramente gli scopi del trattamento dati: cura, ricerca, governo, innovazione
evitare il “function creep”: usare i dati per obiettivi diversi da quelli dichiarati
garantire meccanismi semplici per revocare consensi o limitare usi secondari

Domanda guida: se il paziente fosse qui al tavolo, accetterebbe questo uso del suo dato?

5.2 Empatico: la fiducia come parte del dato

informativa chiara, in italiano comprensibile, non solo giuridico
strumenti di feedback del paziente sui servizi digitali (app, FSE, telemedicina)
coinvolgimento delle associazioni di pazienti nei comitati di indirizzo dei progetti data-driven

Un paziente che comprende cosa succede ai suoi dati è molto più disposto a condividerli per il bene comune.

5.3 Chiarezza: rendere visibile come funzionano i sistemi

dashboard semplici per mostrare chi accede a cosa nel Fascicolo Sanitario
descrizioni trasparenti dei modelli di IA usati in clinica (scopo, limiti, livello di affidabilità)
formazione mirata a clinici e infermieri, non solo al personale IT

La complessità tecnica non deve diventare un “muro nero” che alimenta sospetti e rifiuto.

5.4 Sostenibilità: infrastrutture che durano

scegliere standard aperti ed evitare lock-in proprietari troppo rigidi
progettare architetture che possano evolvere (microservizi, API, integrazioni)
prevedere budget pluriennali per data governance e manutenzione, non solo per i progetti pilota

Sostenibilità significa anche evitare la moda del momento: meno POC sparsi e più roadmap integrate.

5.5 Co-valore: il dato come bene collettivo

promuovere data space regionali e nazionali con regole condivise
definire modelli chiari di partnership pubblico–privato su dataset pseudonimizzati
misurare e comunicare il valore restituito alla collettività (es. riduzione complicanze, migliori percorsi diagnostici)

Il dato sanitario non è “oro” da tenere in cassaforte né “petrolio” da estrarre a piacere: è un bene comune delicato, che genera valore solo se condiviso in modo responsabile.

6. Cosa può fare concretamente oggi una struttura sanitaria italiana

Portare la qualità del dato al centro non è un esercizio teorico. Ci sono mosse pratiche, avviabili in 6–12 mesi, che cambiano davvero lo scenario.

6.1 Nominare data owner e data steward clinici

ogni grande area (ricoveri, pronto soccorso, diagnostica per immagini, laboratorio, farmaceutica) ha un responsabile clinico del dato
questi lavorano in coppia con IT e data engineer per definire regole e controlli

6.2 Definire un set di indicatori di qualità del dato

Per esempio:

percentuale di referti con codifica strutturata
tasso di campi essenziali mancanti in cartella
tempo medio di disponibilità dei referti nel FSE
numero di incongruenze tra sistemi diversi (ad es. ADT vs LIS)

Misurare è il primo passo per migliorare.

6.3 Standardizzare dove fa davvero la differenza

adottare vocabolari condivisi per diagnosi, prestazioni, esiti
spingere i fornitori a supportare standard interoperabili
inserire requisiti di qualità e interoperabilità nei capitolati di gara, non solo prezzo e funzionalità

6.4 Lavorare su pochi casi d’uso, ma ben scelti

Invece di mille iniziative scollegate, scegliere 2–3 casi d’uso che uniscano:

forte impatto clinico/organizzativo (es. liste d’attesa, cronici, pronto soccorso)
fattibilità tecnica
possibilità di riuso dei dati per ricerca e governo clinico

Costruire qualità del dato su questi casi e poi scalare.

7. Qualità del dato come atto politico e di responsabilità

Investire nella qualità dei dati sanitari non è un lusso tecnico, è una scelta politica. Significa decidere che:

la ricerca deve poggiare su basi solide
le politiche sanitarie devono essere giustificabili con numeri affidabili
le applicazioni di IA devono essere valutabili, spiegabili eque

La qualità del dato costruisce fiducia. E la fiducia, nella sanità digitale italiana ed europea, è il vero capitale competitivo dei prossimi anni.

Oggi abbiamo norme europee avanzate, una legge nazionale sull’IA, grandi progetti su Fascicolo Sanitario Elettronico e Spazio europeo dei dati sanitari. Il rischio non è fare troppo, ma arrivare tardi: altri sistemi sanitari stanno correndo, puntando da subito su governance e qualità.

Per chi guida aziende sanitarie, IRCCS, Regioni, aziende ICT e medtech, il messaggio è semplice:

il momento di trattare il dato sanitario come una vera infrastruttura critica – e non come sottoprodotto dell’attività clinica – è adesso.

Chi inizierà nel 2026 a costruire qualità, standard, ruoli chiari e fiducia, tra cinque anni non starà inseguendo l’innovazione in sanità digitale: la starà guidando.