Humánvezérelt, adatközpontú LLM kopilóták: így lesz a klinikai AI biztonságosabb az adatminőség javításával. Gyakorlati lépések bevezetéshez.

Humánvezérelt AI kopilóták: biztonságosabb klinikai MI
A legtöbb egészségügyi AI-projekt nem a modellnél bukik el, hanem a adatoknál. A valóságban a kórházi rendszerekből érkező adatok hiányosak, ellentmondásosak, tele vannak helyi rövidítésekkel, és gyakran olyan „csendes” hibákkal, amiket egy látványos demóban senki sem vesz észre. Ettől lesz az AI diagnózistámogatásból bizonytalan, nehezen auditálható eszköz, amit a klinikusok jogosan kezelnek fenntartásokkal.
2025 végén egy friss kutatási irány (a humánvezérelt, adatközpontú LLM kopilóták koncepciója) pontosan erre a fájó pontra céloz: nem azt ígéri, hogy „jobb modellt” ad, hanem azt, hogy jobb, klinikailag értelmezhető és ML-kész adatot állít elő – orvosi kontroll alatt.
Ebben a „Mesterséges intelligencia az egészségügyben” sorozatba illeszkedő cikkben azt nézzük meg, mit jelent a gyakorlatban az a szemlélet, hogy az LLM-alapú asszisztens nem csak kódot vagy modellt ajánl, hanem adatminőségi döntésekben segít, és közben végig együtt dolgozik az ellátókkal.
Miért az adat a szűk keresztmetszet a klinikai AI-ban?
A rövid válasz: mert a klinikai döntéstámogatásban a hibák nagy része nem „algoritmikus hiba”, hanem adatértelmezési hiba. A modell csak azt tanulhatja meg, amit az adat – és a címke – sugall.
A klinikai adatok tipikus problémái:
- Hiányzó értékek: egy laborparaméter nem azért hiányzik, mert „véletlen”, hanem mert nem volt klinikai indikáció rá. Ez informatív hiány, nem egyszerű üres cella.
- Zajos vagy következetlen címkézés: diagnóziskódok, radiológiai leletek, triázs-besorolások gyakran intézmény- és személyfüggők.
- Eltérő definíciók: mi számít „súlyos állapotnak” az egyik osztályon vs. a másikon?
- Időbeliség és kontextus: egy tünet megjelenése, egy gyógyszer felírása, egy képalkotó eredmény időzítése mind számít – és a rosszul kezelt idővonal hamis összefüggéseket generál.
A klinikai AI biztonsága nem ott kezdődik, hogy milyen nagy a modell, hanem ott, hogy mennyire értelmezhető és védhető a tanítóadat.
Ez a pont az, ahol a klasszikus „LLM kopilóták” sokszor félrecsúsznak: modellcentrikusan segítenek („milyen algoritmust válasszunk?”), miközben a valós munka 60–80%-a adatminőség és adatlogika. A kutatás, amire építünk, ezt a fókuszt fordítja meg.
Mit jelent az, hogy „humánvezérelt, adatközpontú LLM kopilóta”?
A lényeg: az LLM nem egy varázsdoboz, hanem egy munkaszervező és magyarázó réteg a data science eszköztár fölött, ahol a döntésekhez folyamatosan bevonjuk a domain szakértőt (orvost, szakdolgozót, klinikai informatikust).
A hivatkozott kutatás egy olyan keretrendszert mutat be, amelyben a kopilóta:
- Feltérképezi az adatproblémákat (hiány, zaj, anomáliák, definíciós eltérések).
- Tervet készít arról, hogyan lesz az adathalmaz ML-kész.
- Eszközökkel végrehajtja a tisztítást/átalakítást (nem csak beszél róla).
- Humán jóváhagyást kér a kritikus pontokon (pl. címkék javítása, szabályok rögzítése, kizárási kritériumok).
Két szerep: „koordinátor” és „munkás” ügynök
A kutatás egyik praktikus ötlete a több-ügynökös felépítés:
- A koordinátor ügynök dinamikusan tervez és priorizál. Magyarul: nem esik neki találomra a tisztításnak, hanem lépésről lépésre halad, és közben alkalmazkodik ahhoz, amit az adatokban talál.
- A munkás ügynök precízen végrehajtja a konkrét feladatokat (pl. hiányzó értékek kezelése, outlier-ellenőrzés, változótranszformációk), eszközök segítségével.
Ez azért hasznos egészségügyben, mert a klinikai adatokban sok a „ha-akkor” kivétel. Egy ügynök tervez, a másik fegyelmezetten kivitelez – és a klinikus ott van, amikor valódi szakmai döntés születik.
A „data-centric” taxonómia: miket kell tudnia egy klinikai kopilótának?
Ha egy AI asszisztens tényleg használható a diagnózistámogatásban, akkor nem csak modellparamétereket kell „tudnia”, hanem adatminőségi kategóriákban kell gondolkodnia. A kutatás erre egy taxonómiát (problématérképet) javasol; ezt érdemes egészségügyi példákkal lefordítani.
1) Hiány (missingness) – és a hiány oka
A kopilóta feladata nem annyi, hogy „imputál”, hanem hogy rákérdez:
- Klinikai okból hiányzik? (pl. nem kérték)
- Rendszerhiba miatt hiányzik? (pl. interfész hiba)
- Adatgyűjtési protokoll váltás miatt hiányzik? (pl. új laborgép)
Gyakorlati szabály: ami klinikailag informatív hiány, azt gyakran külön jellemzőként érdemes kezelni (pl. „mérték-e egyáltalán?”), és nem automatikusan kitölteni.
2) Címkezaj és definíciós csúszások
A kopilóta akkor segít jól, ha képes:
- mintákat találni a címkézési anomáliákban (pl. ugyanazon radiológiai kifejezés kétféle kódolása),
- és a javítást auditálható módon támogatni (ki, mikor, miért változtatott).
Klinikai MI-ben a címke a valóság „hivatalos verziója”. Ha ez billeg, a modell is billeg.
3) Anomáliák: amikor az érték „lehetséges”, de mégis gyanús
Egy 0-ás pulzus nyilván hiba. De a 220-as pulzus lehet valós (SVT), vagy lehet adatbeviteli tévedés. A kopilótának ezért nem „törölnie” kell, hanem:
- kontextust kérnie (osztály, korcsoport, időpont),
- és eseményszinten gondolkodnia (mi történt előtte/utána).
4) Adatátalakítás és kohorszépítés
A klinikai AI legfontosabb döntése sokszor ez: kit tekintünk „tanulási populációnak”?
A kopilóta itt úgy tud értéket adni, ha:
- dokumentált kohorszszabályokat készít (kizárások, időablakok),
- segít ellenőrizni az elcsúszást (pl. szezonális hullámok, protokollváltás),
- és a változókat klinikailag értelmezhető formára hozza (pl. gyógyszercsoportok, komorbiditási indexek).
Konkrét klinikai forgatókönyv: telemedicina és triázs-asszisztens
Vegyünk egy tipikus 2025-ös helyzetet: egy telemedicinás szolgáltató triázs-asszisztenst akar, ami a bejövő panaszok, vitális paraméterek és korábbi EESZT-szerű kivonatok alapján segít sürgősségi szinteket javasolni.
A projekt elején gyorsan kiderül:
- a panaszleírások szabad szövegek, tele helyi rövidítéssel,
- a lázmérés eszköze és helye változó (hónalj vs. fül),
- a végső „kimeneti címke” (triázs-szint) két intézmény között eltérő.
Egy humánvezérelt, adatközpontú kopilóta itt nem azt mondja elsőként, hogy „próbáljuk ki az X modellt”, hanem ezt:
- Kohorsz-fegyelem: rögzítjük, mely betegek és mely időszakok tartoznak a tanítóadatba.
- Definíciók egységesítése: a triázs-szintek megfeleltetése, dokumentált döntési fával.
- Szöveg-normalizálás: rövidítések szótára, intézmény-specifikus kifejezések kezelése.
- Hiány kezelése ok szerint: külön jelző, ha nem történt mérés.
- Humán ellenőrző pontok: a kopilóta konkrét mintákat hoz a klinikusnak („ezek a rekordok ellentmondásosak”), és a szakértő dönt.
Az eredmény: kisebb eséllyel építünk olyan modellt, ami a mérési szokásokat tanulja meg a klinikai állapot helyett.
Hogyan vezessük be ezt a szemléletet egy kórházban 30 nap alatt?
A válasz: nem „nagy AI-programmal”, hanem egy adatminőségi pilot-tal, amit egy klinikai use case köré szervezünk.
1) Válassz egy szűk, nagy értékű felhasználást
Jól működő kezdések:
- radiológiai leletek struktúráltabbá tétele (képalkotás + szöveg)
- újrafelvételi kockázat (30 nap)
- sepsis korai figyelmeztetés (időablakos adatok)
2) Állíts fel „humán jóváhagyási kapukat”
Ne minden apróságot hagyjon jóvá orvos, de a kritikusakat igen:
- címkejavítási szabályok
- kizárási kritériumok
- klinikai definíciók (pl. „romlás”)
3) Mérj adatminőségi KPI-okat, ne csak modell-AUC-t
A klinikai bizalomhoz adat-KPI kell. Példák:
- hiány aránya változónként (és ok szerint)
- duplikációk száma
- anomáliák aránya és kezelése
- címke-ellentmondások aránya
- kohorszstabilitás (időszakok között mennyire változik a populáció)
4) Dokumentálj úgy, mintha audit lenne holnap
Ez nem bürokrácia, hanem túlélés. A kopilótának (és a csapatnak) minden döntést visszakereshetővé kell tenni: mi változott, miért, ki hagyta jóvá.
Gyakori kérdések: amit a döntéshozók és klinikusok tényleg kérdeznek
„Egy LLM nem fog hallucinálni az adattisztítás közben?”
Hallucinálni akkor tud nagyot, ha a rendszer szabadon „kitalálhat” adatot vagy szabályt. Az adatközpontú megközelítésben a cél az, hogy az LLM tervezzen és magyarázzon, miközben a tényleges módosítások eszközökkel és szabályokkal történnek, humán ellenőrzéssel.
„Ki a felelős, ha az asszisztens rossz döntést javasol?”
A felelősség a klinikai workflow-ban nem kerülhető meg. Ezért kell a kopilótát döntéstámogatónak kezelni, és a kritikus lépéseknél beépíteni a jóváhagyást. A felelősségi körök tisztázása nélkül nincs biztonságos bevezetés.
„Miért jobb ez, mint egy sima data engineer csapat?”
Nem jobb „helyettük”. Gyorsabb és következetesebb lehet mellettük, mert:
- segít strukturálni a problémát,
- egységesíti a dokumentálást,
- és csökkenti a kézi, ismétlődő adatellenőrzési munkát.
A jó felállás: data engineer + klinikai szakértő + kopilóta, ahol a kopilóta a közös nyelv és a munkafolyamat motorja.
Merre tart ez 2026-ban a klinikai döntéstámogatásban?
A humánvezérelt, adatközpontú LLM kopilóta iránya szerintem azért fontos, mert végre kimondja: a klinikai AI-ban a „jobb modell” önmagában kevés. A jobb adatfolyamat a valódi érték. A betegbiztonság, az auditálhatóság és a klinikai bizalom ugyanannak a háromszögnek a csúcsai.
Ha most indítasz vagy újratervezel egészségügyi AI-projektet, én ezt tenném elsőként: kiválasztanék egy use case-t, és a csapattal közösen felépítenék egy adatminőség-központú kopilóta munkarendet – világos jóváhagyási pontokkal.
A sorozat következő részeiben megnézzük, hogyan lehet ugyanezt a szemléletet az orvosi képalkotásban és a kórházi működésoptimalizálásban úgy alkalmazni, hogy a klinikus ne csak „felhasználó” legyen, hanem társtervező. Te melyik területen látod most a legnagyobb adatminőségi akadályt: képalkotás, sürgősségi, vagy krónikus gondozás?