A CLIP-alapú orvosi MI gyakran félreérti a tagadást. Megmutatjuk, miért veszélyes ez, és hogyan teszteld, finomhangold, monitorozd.

MI az orvosi képalkotásban: a „nem” csapdája
Egy mellkasröntgen-leletben egyetlen szĂł kĂ©pes teljesen megfordĂtani a jelentĂ©st: „nem”. „Nincs pneumothorax.” „Nem láthatĂł pleuralis folyadĂ©k.” A radiolĂłgiai nyelv tele van tagadással, mert a klinikai döntĂ©s szempontjábĂłl legalább annyira fontos, mi nincs ott, mint az, hogy mi van ott.
És itt jön a kellemetlen rész: a nagy kép–szöveg modellek (például a CLIP-alapú rendszerek), amelyeket sokan örömmel vetnének be képkiválasztásra, leletgenerálásra vagy diagnózistámogatásra, meglepően könnyen félreértik a tagadást. A 2025.12.18-án arXivra feltöltött friss tanulmány („The Effect of Negation on CLIP in Medical Imaging”) pont ezt a gyenge pontot boncolgatja: mi történik, amikor a modellnek olyan prompttal kell dolgoznia, amiben a kulcsszó előtt ott áll a „no/not”.
A „MestersĂ©ges intelligencia az egĂ©szsĂ©gĂĽgyben” sorozatban Ă©n azt látom a legfontosabbnak, hogy ne csak azt kĂ©rdezzĂĽk: „mire kĂ©pes az MI?”, hanem azt is: „hol hibázik kiszámĂthatĂłan, Ă©s hogyan tesszĂĽk klinikailag megbĂzhatĂłbbá?” A tagadás Ă©rtĂ©se tipikusan ilyen „apró” rĂ©szlet, ami a valĂłságban Ăłriási.
Miért kritikus a tagadás a radiológiában?
A tagadás a radiolĂłgiai kommunikáciĂł gerince. A leletek döntĹ‘ rĂ©sze kizárásokat tartalmaz, mert a beutalĂł kĂ©rdĂ©se gyakran Ăgy hangzik: „van-e tĂĽdĹ‘gyulladás?”, „láthatĂł-e pneumothorax?”, „van-e pangás?”. A válasz pedig sokszor: „nem”.
A „nem” klinikai kockázata: pont az ellenkezőjét jelenti
Ha egy MI-rendszer a „nincs pneumothorax” kifejezést összemossa a „pneumothorax” jelenlétével, akkor két rossz út van:
- Hamis pozitĂv: felesleges riasztás, felesleges CT, felesleges konzĂlium, plusz stressz.
- Hamis negatĂv (a másik irányban): elmaradĂł riasztás, kĂ©sĹ‘n Ă©szlelt állapot, betegbiztonsági kockázat.
A problĂ©ma azĂ©rt alattomos, mert felĂĽletes metrikákkal könnyű elrejteni. Egy modell összteljesĂtmĂ©nye jĂłnak tűnhet, miközben pont a tagadásos esetekben csĂşszik meg – márpedig ezek a mindennapok.
Miért nem „nyelvtani apróság”?
A radiológiai tagadás nem csak a „nem” szó. Gyakoriak az olyan szerkezetek, mint:
- „… nem valĂłszĂnű”
- „… nem zárható ki”
- „… nélkül”
- „… negatĂv”
- „… nincs egyértelmű jele”
Ezek között vannak erős kizárások és óvatos, bizonytalanságot jelző formulák. Egy klinikai környezetben a modellnek árnyalatokat kellene értenie, nem csak kulcsszavakat.
Miért botlik meg a CLIP a tagadáson?
A CLIP logikája egyszerű: megtanulja, hogy egy kĂ©p Ă©s egy szöveg „összetartozik-e” (kontrasztĂv tanulás), jellemzĹ‘en Ăşgy, hogy sok kĂ©p–felirat párt lát. Ez remek olyan helyzetekben, ahol a szöveg pozitĂv állĂtás: „pneumonia”, „pleural effusion”.
A gond az, hogy a tagadás sokszor nem jelent vizuálisan új mintát. A „nincs pleuralis folyadék” tipikusan azt jelenti: „a kép normális ebből a szempontból”. A modell viszont könnyen rááll arra a heurisztikára, hogy ha a szövegben szerepel a „pleural effusion” kifejezés, akkor a hozzá tartozó képek legyenek azok, ahol van folyadék. A „no” token hatása eltörpül a nagy, domináns klinikai kulcsszó mellett.
Snippet-mondat, amit Ă©rdemes megjegyezni: A kontrasztĂv kĂ©p–szöveg tanulás gyakran „kulcsszĂł-egyezĂ©sre” egyszerűsĂti a nyelvet, Ă©s a tagadás ezt azonnal leleplezi.
A tanulmány fókusza: CheXagent és tagadásos promptok
A friss munka a Stanford AIMI által publikált CheXagent modellt vizsgálja egy nagyon konkrét feladaton: mellkasröntgen képek visszakeresése (image retrieval) olyan szöveges promptokra, amelyek tagadást tartalmaznak, illetve nem tartalmaznak.
A szerzők nem álltak meg annál, hogy „rossz a pontosság”. Megnézték, mi történik a modellen belül:
- token-attribĂşciĂł (mely szavak számĂtanak a döntĂ©sben),
- t-SNE projekció (hogyan rendeződnek a reprezentációk),
- attention head ablation (mely figyelmi fejek kritikusak).
Ez a három együtt azért hasznos, mert nem csak a tünetet látjuk, hanem közelebb kerülünk az okhoz: a szöveg-enkóder hogyan „érzi” a tagadást.
Mit mutatnak az eredmények, és miért fontos a trade-off?
A szerzĹ‘k azt találták, hogy finomhangolással javĂthatĂł a tagadás kezelĂ©se, viszont enyhe visszaesĂ©s jöhet a pozitĂv promptok pontosságában. Ez a rĂ©sz szerintem kulcs: a klinikai MI-ben ritkán van „ingyen ebĂ©d”.
A „kicsit rosszabb lett a pozitĂvokon” valĂłjában tervezĂ©si döntĂ©s
Ha egy rendszer eddig szuper volt abban, hogy a „pneumothorax” prompttal pneumothoraxos kĂ©peket talál, de cserĂ©be a „nincs pneumothorax” esetben rossz kĂ©peket hoz, akkor a modell kiszámĂthatatlan. Egy diagnĂłzistámogatĂł vagy QA-eszköz esetĂ©n Ă©n inkább választok olyan modellt, amely:
- kissĂ© kevĂ©sbĂ© agresszĂv a pozitĂv találatokban,
- viszont stabilan kĂĽlönválasztja a tagadott Ă©s állĂtott kĂłrkĂ©peket.
Ez tipikusan betegbiztonsági kérdés. A tagadás hibája nem „edge case”, hanem mindennapi.
MiĂ©rt segĂt a belsĹ‘ viselkedĂ©s vizsgálata?
A token-attribúció és az attention vizsgálatok gyakorlati előnye, hogy:
- megmutatják, a „no/not” token ténylegesen kap-e súlyt,
- kiderül, hogy a finomhangolás a reprezentációs térben szétválasztja-e a „pneumothorax” és „no pneumothorax” szövegeket,
- azonosĂthatĂł, hogy bizonyos figyelmi fejek „felelĹ‘sek-e” a tagadás kezelĂ©séért.
Ez azért értékes, mert a klinikai validáció során nem elég annyi, hogy „átment a teszten”. A cél a magyarázhatóság és kontrollálhatóság: ha tudom, hol romlik el, tudom, mit monitorozzak élesben.
Gyakorlati tanulságok: hogyan tervezzĂĽnk megbĂzhatĂłbb kĂ©p–szöveg MI-t?
A tagadás kezelése nem utólagos kozmetika, hanem adat- és teszttervezési feladat. Ha a szervezetetek (kórház, teleradiológia, medtech cég) CLIP-szerű modellt használ vagy tervez használni, ezek a lépések működnek a gyakorlatban.
1) Tegyétek kötelezővé a tagadásos tesztkészletet
A validációs csomagban külön blokkot érdemes fenntartani:
- pozitĂv állĂtások (pl. „pleuralis folyadĂ©k”),
- explicit tagadások (pl. „nincs pleuralis folyadék”),
- bizonytalanság (pl. „nem zárható ki pleuralis folyadék”),
- kettĹ‘s állĂtások (pl. „pangás nincs, atelectasia megfigyelhető”).
A minimum, amit elvárok: külön riportolt metrikák tagadásra. Ne legyen elrejtve az átlagban.
2) Ne csak angol sablonokban gondolkodjatok
Magyar klinikai környezetben a nyelv más. A „nem igazolható” vagy a „nem ábrázolódik” gyakori. Ha magyar nyelvű leletekkel dolgoztok, kell:
- magyar promptkészlet,
- magyar leletnyelv tipikus fordulatai,
- szinonimák Ă©s rövidĂtĂ©sek kezelĂ©se.
Aki ezt kihagyja, az valĂłjában nem a magyar egĂ©szsĂ©gĂĽgyre fejleszt, hanem egy demo-t Ă©pĂt.
3) Finomhangolásnál célzott „kontrasztpárok” kellenek
A tagadás tanĂtásának egyik leghatĂ©konyabb mĂłdja az, ha a modell nagyon közeli szövegpárokat lát, amelyek csak egy tagadĂł elemben kĂĽlönböznek, Ă©s a kĂ©pek ennek megfelelĹ‘en változnak.
Példa pár:
- „pneumothorax látható” ↔ „pneumothorax nem látható”
Itt a modell kĂ©nytelen megtanulni, hogy a kĂĽlönbsĂ©g nem dĂsz, hanem jelentĂ©s.
4) Külön kezeljétek a retrievalt és a diagnózist
A tanulmány retrievalről szól, de sok csapat innen ugrik diagnózisra. Én óvatos lennék: a „jó visszakeresés” nem egyenlő a „jó diagnózis”.
A retrieval akkor hasznos, ha:
- hasonló eseteket keresünk oktatáshoz,
- QA célra példákat gyűjtünk,
- radiológus munkáját támogatjuk referenciaképekkel.
Diagnózisnál viszont más a felelősség, más a szabályozás, és több a csapda (adateltolódás, protokollkülönbség, eszközpark).
5) Éles bevezetéskor monitorozni kell a „nyelvi kockázatot”
Ha egy MI-rendszer leleteket vagy promptokat ért, akkor élesben is mérjetek:
- tagadásos minták aránya,
- hibák tĂpusai (hamis pozitĂv/negatĂv tagadás miatt),
- osztályonkénti eltérés (Sürgősségi vs. belgyógyászat),
- Ăşj formulák megjelenĂ©se (pl. helyi leletezĂ©si stĂlus).
A modellek nem csak „driftelnek” képekben. Driftelnek nyelvben is.
Gyors Q&A: amit a csapatok tényleg megkérdeznek
„Nem oldja meg ezt egy nagyobb LLM a lelet oldalon?”
RĂ©szben segĂthet, de nem csodaszer. Ha a kĂ©p–szöveg illesztĂ©s alapja tagadásra vak, akkor egy utĂłlagos szövegmodell maximum kozmetikáz. A megbĂzhatĂłság ott kezdĹ‘dik, hogy a reprezentáciĂłs tĂ©rben is kĂĽlönválik a tagadott Ă©s állĂtott kĂłrkĂ©p.
„Elég, ha a promptban nagybetűvel kiemelem a NEM-et?”
Nem. A tokenizálás Ă©s az embedding nem Ăgy működik; a modell nem „figyel oda” jobban csak azĂ©rt, mert mi tipográfiával kiabálunk. CĂ©lzott tanĂtás Ă©s cĂ©lzott teszt kell.
„Mi a legjobb elsĹ‘ lĂ©pĂ©s, ha már van CLIP-alapĂş prototĂpusom?”
Én a következĹ‘t csinálnám: kĂ©szĂtenĂ©k 50–100 tagadásos promptpárt a leggyakoribb mellkasi kĂłrkĂ©pekre (pangás, effĂşziĂł, pneumothorax, consolidatio, cardiomegalia), Ă©s megnĂ©znĂ©m, mennyit romlik a teljesĂtmĂ©ny a pozitĂvokhoz kĂ©pest. Ha nagy az eltĂ©rĂ©s, a rendszer mĂ©g nincs kĂ©sz klinikai környezetre.
Mit vigyünk magunkkal ebből a kutatásból?
A Vu–Sheshappanavar-fĂ©le tanulmány ĂĽzenete számomra egyszerű: az orvosi kĂ©palkotásban az MI megbĂzhatĂłsága nem csak a kĂ©pen mĂşlik, hanem a nyelven is. A tagadás pedig a leggyorsabb stressztesztje annak, hogy a modell valĂłban Ă©rti-e a klinikai jelentĂ©st, vagy csak kulcsszavakat párosĂt.
Ha a cél diagnózistámogatás, oktatási visszakeresés vagy lelet–kép összerendezés, akkor 2026 felé haladva egyre inkább az nyer, aki:
- klinikailag releváns nyelvi jelensĂ©gekre (tagadás, bizonytalanság, kontextus) tanĂt,
- külön méri és dokumentálja ezeket,
- és nem szégyelli kimondani: a modell ott jó, ahol teszteltük, és ott bizonytalan, ahol még nem.
Ha a saját szervezetetekben kĂ©palkotĂł MI-bevezetĂ©sen gondolkodtok, Ă©n szĂvesen segĂtek egy tagadás-fĂłkuszĂş validáciĂłs terv vagy promptkĂ©szlet összeállĂtásában. A vĂ©gĂ©n Ăşgyis az számĂt, hogy a rendszer ugyanĂşgy Ă©rti-e a „nem”-et, mint a radiolĂłgus.