A CLIP-alapĂş orvosi AI-k gyakran fĂ©lreĂ©rtik a „nincs” tĂpusĂş tagadást. Megmutatjuk, miĂ©rt, Ă©s hogyan lehet ezt mĂ©rni, javĂtani, bevezetni.

Negáció a radiológiában: miért hibázik a CLIP?
Egy mellkasröntgen-leletben néha egyetlen szó a különbség a „vészhelyzet” és a „minden rendben” között. Az a szó gyakran a „nincs”.
A „nincs pneumothorax” Ă©s a „pneumothorax” klinikailag ellentĂ©tes állĂtások. MĂ©gis, a nagy kĂ©p–szöveg modellek (pĂ©ldául a CLIP-alapĂş rendszerek), amelyeket egyre többen prĂłbálnak bevezetni orvosi kĂ©palkotásban, hajlamosak Ăşgy viselkedni, mintha a tagadás csak „dĂsz” lenne a mondatban. Ez nem elmĂ©leti finomság: ha az AI fĂ©lreĂ©rti a negáciĂłt, a diagnĂłzistámogatás megbĂzhatĂłsága sĂ©rĂĽl.
A 2025.12.18-án benyĂşjtott friss kutatás azt vizsgálja, hogyan kezeli a negáciĂłt egy CLIP-szerű, klinikai környezetben használt modell (CheXagent), Ă©s mit lehet tenni azĂ©rt, hogy a „nincs” tĂ©nyleg nincset jelentsen. A „MestersĂ©ges intelligencia az egĂ©szsĂ©gĂĽgyben” sorozatban Ă©n ezt most egy kicsit kiterjesztem: nemcsak azt nĂ©zzĂĽk, mit találtak a szerzĹ‘k, hanem azt is, mit Ă©rdemes ebbĹ‘l átvinni a kĂłrházi bevezetĂ©sbe, a beszerzĂ©sbe, Ă©s a minĹ‘sĂ©gbiztosĂtásba.
Miért kritikus a negáció az orvosi képalkotásban?
A rövid válasz: a radiológiai nyelv tele van tagadással, és a tévedés ára magas.
A mellkasröntgen, CT vagy MR leletezĂ©sĂ©ben a tagadás az egyik leggyakoribb nyelvi minta: „nincs folyadĂ©k”, „nem láthatĂł beszűrĹ‘dĂ©s”, „pneumothorax nem igazolható”. A klinikai döntĂ©shozásban ez a negatĂv állĂtás gyakran megnyugtatĂł informáciĂł (mit zárunk ki), Ă©s sokszor fontosabb, mint az, amit találunk.
A tipikus csapda: „a modell a kulcsszót szereti”
A kontrasztĂv kĂ©p–szöveg pretraining lĂ©nyege, hogy a modell megtanulja: milyen szövegek „illnek” milyen kĂ©pekhez. A gond az, hogy a tanulás közben a rendszer gyakran tartalom-szavakra (pl. „pneumothorax”, „consolidation”) támaszkodik, Ă©s kevĂ©sbĂ© stabilan kĂłdolja a logikai operátorokat (pl. „nincs”, „nem”).
Ha a modellben a „pneumothorax” token erĹ‘s „kapcsoló”, akkor a „nincs pneumothorax” könnyen Ăşgy viselkedik, mintha „pneumothorax” lenne, csak egy kis „zajjal” körĂtve.
Miért most különösen aktuális (2025 december)?
A kĂłrházakban Ă©s teleradiolĂłgiai szolgáltatĂłknál 2024–2025-ben látványosan felpörgött a multimodális AI pilotok száma: kĂ©p-visszakeresĂ©s, automatikus lelet-összefoglalás, triázs Ă©s minĹ‘sĂ©gellenĹ‘rzĂ©s. A „tĂ©li csĂşcs” (lĂ©gĂşti szezon) idejĂ©n ráadásul a mellkasvizsgálatok mennyisĂ©ge is nĹ‘het, Ăgy a hibatűrĂ©s kĂ©rdĂ©se mĂ©g Ă©lesebb.
Mit vizsgált a friss kutatás, és mi a tanulság a gyakorlatban?
A lĂ©nyeg: a szerzĹ‘k azt nĂ©ztĂ©k meg, hogyan teljesĂt egy klinikai CLIP-alapĂş modell (AIMI CheXagent) mellkasröntgen kĂ©pek visszakeresĂ©sĂ©ben olyan promptokkal, amelyekben ugyanaz a klinikai fogalom szerepel, egyszer tagadĂł, egyszer állĂtĂł formában.
A vizsgálat célja két szinten volt fontos:
- TeljesĂtmĂ©ny: pontosan mennyire esik vissza a visszakeresĂ©s (retrieval) minĹ‘sĂ©ge, ha megjelenik a negáciĂł?
- Viselkedés: mi történik a modell „belül”? Mit csinálnak a tokenek, a reprezentációk, az attention fejek?
A kutatĂłk több finomhangolási (fine-tuning) megközelĂtĂ©st is kiprĂłbáltak korábbi munkák alapján. A fĹ‘ eredmĂ©nyĂĽk ĂĽzenete, amit Ă©rdemes megjegyezni: a negáciĂł kezelĂ©se javĂthatĂł, de gyakran trade-off jelleggel, vagyis az állĂtĂł promptok pontossága kicsit romolhat.
A kórházi tanulság: ha egy rendszert „negációbiztossá” teszünk, azt külön kell mérni és dokumentálni, mert a nyereség nem mindig „ingyen” jön.
Miért bukik el a CLIP a „nincs”-en? (És miért nem elég a több adat)
A rövid válasz: a kontrasztĂv tanulás nem kĂ©nyszerĂti ki a logikai pontosságot.
1) A kontrasztĂv cĂ©lfĂĽggvĂ©ny nem „érti”, csak párosĂt
A CLIP-hez hasonló modellek azt tanulják: melyik képhez melyik szöveg tartozik. Ha a tréningadatokban a tagadás ritkább, zajos, vagy nem egyértelműen megkülönböztetett, a modell rááll a könnyebb megoldásra: a főnévre/diagnózis-szóra figyel.
Klinikai nyelvben viszont a tagadás nem mellékes stilisztika, hanem logikai művelet.
2) A negáció kontextusfüggő és „lelet-nyelv” specifikus
A „nem igazolható” mást jelent, mint a „nem zárható ki”. A „nincs egyértelmű jele” sokszor bizonytalanságot takar. Egy általános nyelvi mintákon tanult modell könnyen összemossa ezeket.
A gyakorlatban ez azt jelenti, hogy nem elĂ©g annyit mondani: „tanĂtsuk több orvosi szövegen”. A szöveg tĂpusa, a bizonytalansági formulák, Ă©s a cĂmkĂ©zĂ©s minĹ‘sĂ©ge dönt.
3) A visszakeresésnél a hibák alattomosak
Osztályozásnál (van/nincs elváltozás) gyakran észrevesszük a tévedést. Visszakeresésnél viszont a modell csak „rossz” képeket tesz felülre, ami csendben rontja:
- a radiológus keresését a PACS-szerű munkafolyamatban,
- a tanĂtĂłanyag-gyűjtĂ©st (pĂ©ldakĂ©pek keresĂ©se),
- a klinikai auditot,
- Ă©s az olyan másodlagos rendszereket, amelyek erre Ă©pĂtenek (pl. leletgenerálás).
Hogyan lehet „negáciĂłtűrő” multimodális AI-t Ă©pĂteni a kĂłrházban?
A lĂ©nyeg: a negáciĂł kezelĂ©se nem csak modellkĂ©rdĂ©s, hanem bevezetĂ©si Ă©s minĹ‘sĂ©gbiztosĂtási kĂ©rdĂ©s is.
1) Negáció-specifikus tesztkészlet nélkül nincs biztonság
A legtöbb pilot ott csĂşszik el, hogy „átlagos” metrikákat nĂ©z (összpontosság, AUC), Ă©s nem Ă©pĂt be cĂ©lzott negáciĂłteszteket. Pedig ez gyorsan megoldhatĂł.
Egy működő, pragmatikus tesztterv:
- Gyűjts 50–200 tipikus leletmondatot.
- KĂ©szĂts belĹ‘lĂĽk párokat: állĂtĂł vs. tagadĂł (pl. „bal oldali pleurális folyadĂ©k” vs. „nincs bal oldali pleurális folyadĂ©k”).
- Mérd meg külön:
- top-k retrieval pontosság tagadással,
- top-k retrieval pontosság tagadás nélkül,
- a két eredmény közti gap-et (ez lesz a „negációs szakadék”).
Ha nincs külön „negációs szakadék” mérőszám, a csapat nagy eséllyel túlértékeli a rendszert.
2) Fine-tuningnál vállalni kell a trade-offot, de irányĂtani lehet
A kutatás egyik fontos ĂĽzenete, hogy a negáciĂłra finomhangolt CLIP viselkedĂ©se változik: javul a tagadĂł promptok kezelĂ©se, miközben az állĂtĂł promptoknál nĂ©mi visszaesĂ©s jöhet.
Én azt javaslom, hogy a bevezetési döntést ne „egy szám” alapján hozzuk meg, hanem:
- külön küszöböt adjunk a negációs feladatokra,
- Ă©s kĂĽlön kĂĽszöböt az állĂtĂł feladatokra.
Ha pĂ©ldául a rendszer triázsban használatos (ahol a „nincs” fĂ©lreĂ©rtĂ©se nagyon veszĂ©lyes), akkor a negáciĂłs teljesĂtmĂ©ny legyen a fĹ‘ gate.
3) Promptolás: nem csodaszer, de csökkentheti a hibát
A klinikai promptok szerkesztésével sokat lehet nyerni, főleg korai pilotban.
Gyakorlati minták:
- Használj standardizált formulákat: „Nem látható …” helyett „Nincs radiológiai jele …”.
- KerĂĽld a dupla tagadást: „nem zárhatĂł ki” tĂpusĂş kifejezĂ©seket kezeld kĂĽlön kategĂłriakĂ©nt (bizonytalan).
- Tedd egyértelművé a célt: retrievalnél például „Keress olyan képet, ahol nincs …” jellegű kontextussal.
A cĂ©l nem az, hogy „szebben Ărjunk”, hanem hogy a modellnek kevesebb legyen a fĂ©lreĂ©rthetĹ‘ mintázat.
4) Magyarázhatóság: token-attribúció és attention audit, de okosan
A tanulmány belsĹ‘ vizsgálatokat is emlĂt (token attribĂşciĂł, t-SNE, attention-head ablation). KĂłrházi oldalrĂłl ezek akkor hasznosak, ha konkrĂ©t kĂ©rdĂ©sre válaszolnak:
- A modell tényleg „látja” a „nincs” tokent, vagy elhanyagolja?
- A finomhangolás után változott-e ez?
Ha a magyarázhatĂłság csak szĂ©p ábra a prezentáciĂłban, nem fogja csökkenteni a kockázatot. Ha viszont hibatĂpusokra van ráfűzve (pl. negáciĂłs tĂ©vesztĂ©s), akkor jĂł eszköz a bevezetĂ©si dokumentáciĂłhoz.
Gyakori kérdések, amiket a beszerzésnél fel kell tenni
A lényeg: a negációkezelés legyen szerződéses és mérési tétel, ne „jó lenne, ha” kategória.
- Milyen leletnyelven tanult a modell? (angol, klinikai rövidĂtĂ©sek, radiolĂłgiai sablonok)
- Van-e negáció-specifikus validáció? Ha igen, milyen mondatpárokkal?
- Hogyan kezeli a bizonytalanságot? („nem zárhatĂł ki”, „valĂłszĂnű”, „felmerĂĽl”)
- Mi törtĂ©nik drift esetĂ©n? Ha a helyi leletezĹ‘ stĂlus eltĂ©r, romlik-e a negáciĂł kezelĂ©se?
- Milyen fallback van? (pl. negáció és bizonytalanság esetén a rendszer visszafogottabb, nem ad erős javaslatot)
Ezek nem akadĂ©koskodĂł kĂ©rdĂ©sek. Ezek azok a kĂ©rdĂ©sek, amelyek megvĂ©dik a klinikai csapatot attĂłl, hogy „papĂron jó” AI-t vezessen be.
Mit jelent ez a „Mesterséges intelligencia az egészségügyben” sorozat szempontjából?
A rövid válasz: az AI a kĂ©palkotásban nem csak lát, hanem olvas is — Ă©s az olvasásnál a logika számĂt.
A multimodális rendszerek ĂgĂ©rete Ăłriási: gyorsabb keresĂ©s, jobb triázs, automatizált dokumentáciĂł, telemedicinás munkamegosztás. De Ă©n egyre inkább azt látom, hogy a siker kulcsa nem a legnagyobb modell, hanem a legjobban definiált kockázati feladatlista. A negáciĂł pontosan ilyen.
Ha a csapatod kĂłrházi pilotot tervez (retrieval, leletgenerálás, döntĂ©stámogatás), Ă©rdemes már az elejĂ©n beĂ©pĂteni egy „negáciĂłs kontrollpontot”: kĂĽlön teszt, kĂĽlön metrika, kĂĽlön go/no-go feltĂ©tel. EttĹ‘l lesz a rendszer megbĂzhatĂłbb, Ă©s ettĹ‘l lesz a bevezetĂ©s vĂ©dhetĹ‘ szakmailag.
A következő lépés nálatok mi lenne: melyik klinikai munkafolyamatban okozna a legnagyobb kárt, ha az AI félreértené azt, hogy „nincs”?