Az önjavĂtĂł MI tokenenkĂ©nt jelöli a gyenge rĂ©szeket, majd cĂ©lzottan javĂt. PRISM-szemlĂ©lettel csökkenhetnek a diagnosztikai hibák.

Ă–njavĂtĂł MI: kevesebb diagnosztikai hiba, több bizalom
Egy modern diagnosztikai MI-nek kĂ©t dolgot kell egyszerre tudnia: gyorsnak lennie Ă©s hibáznia is „szĂ©pen”. A valĂłságban ugyanis nem az a kĂ©rdĂ©s, hogy lesz-e tĂ©vedĂ©s, hanem az, hogy Ă©szreveszi-e a rendszer, amikor bizonytalan vagy rossz irányba ment, Ă©s kĂ©pes-e visszajavĂtani mĂ©g azelĹ‘tt, hogy az eredmĂ©ny döntĂ©st befolyásolna.
A 2025 vĂ©gĂ©n bemutatott PRISM megközelĂtĂ©s (Plug-in Remasking for Inference-time Self-correction of Masked Diffusions) egy olyan ötletet hoz a generatĂv modellek világábĂłl, ami az egĂ©szsĂ©gĂĽgyben kĂĽlönösen jĂłl cseng: önjavĂtási mechanizmust ad a modell kezĂ©be, ráadásul formális (bizonyĂthatĂł) garanciák irányába mozdul. Nem kell hozzá megerĹ‘sĂtĂ©ses tanulás, nem kell kĂĽlön „verifikátor” modell, Ă©s nem kell ĂşjraĂ©pĂteni az alaparchitektĂşrát.
Ami pedig a kiskereskedelmi Ă©s e-kereskedelmi sorozatunkhoz kapcsolja: a megbĂzhatĂłság Ă©s az önellenĹ‘rzĂ©s ugyanaz a tĂ©ma, akár termĂ©kajánlĂł, akár kereslet-elĹ‘rejelzĂ©s, akár orvosi kĂ©palkotás eredmĂ©nyĂ©t nĂ©zzĂĽk. A kĂĽlönbsĂ©g csak az, hogy az egĂ©szsĂ©gĂĽgyben egy rossz token vagy rossz „rĂ©szlet” ára nĂ©ha nagyon magas.
Mit jelent az önjavĂtás a gyakorlatban, Ă©s miĂ©rt pont most lett kritikus?
Az önjavĂtás lĂ©nyege: a modell ne csak generáljon, hanem azonosĂtsa a gyenge minĹ‘sĂ©gű rĂ©szeket, majd cĂ©lzottan javĂtsa Ĺ‘ket. GeneratĂv modelleknĂ©l ez tipikusan „token szinten” törtĂ©nik (szövegnĂ©l szavak/rĂ©szszavak, kĂłdnál szimbĂłlumok, diszkrĂ©t feladatoknál cellák/Ă©rtĂ©kek).
Az egészségügyben ennek a gondolatnak nagyon konkrét megfelelői vannak:
- RadiolĂłgiai leletezĂ©snĂ©l egy hosszĂş szövegben 1–2 fĂ©lrement állĂtás elĂ©g, hogy rossz irányba tolja a döntĂ©st.
- Orvosi kĂłdolásnál (ICD, beavatkozási kĂłdok) egy hibás kĂłd tĂ©ves finanszĂrozást, hibás statisztikát Ă©s adminisztráciĂłs spirált okozhat.
- Triage vagy tünetértékelés esetén egy rosszul kiválasztott „kritikus jel” téves prioritást adhat.
2025-re a legtöbb szervezetnél a kérdés már nem az, hogy „bevezessünk-e MI-t?”, hanem az, hogy:
Hogyan tesszĂĽk az MI-t ellenállĂłvá a saját hibáival szemben, anĂ©lkĂĽl, hogy a rendszert tĂşlbonyolĂtanánk?
A PRISM pont erre ad egy mĂ©rnökileg is vonzĂł választ: plug-in jellegű, vagyis ráülhet meglĂ©vĹ‘, betanĂtott modellre.
Mi az a Masked Diffusion (MDM), Ă©s miĂ©rt jĂł alap az önjavĂtáshoz?
Válasz elĹ‘ször: a Masked Diffusion Model (MDM) olyan generatĂv megközelĂtĂ©s diszkrĂ©t terekben, ahol a modell iteratĂvan „kitölti” a maszkolt (ismeretlen) elemeket. Ez termĂ©szetes mĂłdon támogatja azt a gondolatot, hogy ami rossz, azt kĂ©sĹ‘bb Ăşjramaszkoljuk Ă©s Ăşjrageneráljuk.
A legtöbben a diffúziós modelleket képekhez kötik, de az MDM-ek diszkrét feladatokban is használhatók:
- Sudoku (cellák értékei)
- Szöveg (tokenek)
- KĂłd (tokenek)
Az MDM működĂ©se gondolatilag hasonlĂt ahhoz, ahogy egy junior kollĂ©ga fogalmaz: elĹ‘ször leĂr valamit, aztán visszaolvas, Ă©s kijavĂt pár sort. A kĂĽlönbsĂ©g az, hogy itt ezt szisztematikusan, iteráciĂłkban tesszĂĽk.
Hol vĂ©rzik el sok „önjavĂtás” a valĂłs rendszerekben?
A gond ott kezdődik, hogy a modellnek tudnia kell, melyik token gyenge. A korábbi próbálkozások gyakran:
- külön ellenőrző modellt igényeltek,
- megerĹ‘sĂtĂ©ses tanulásra (RL) támaszkodtak,
- vagy olyan heurisztikákat használtak, amik nem elĂ©g pontosak (pl. „alacsony valĂłszĂnűsĂ©g = rossz”).
EgĂ©szsĂ©gĂĽgyben ezek a kompromisszumok fájnak: több komponens = több auditálnivalĂł; RL = nehezebb reprodukálhatĂłság; heurisztikák = kiszámĂthatatlan „vakfoltok”.
PRISM: önjavĂtás verifikátor nĂ©lkĂĽl (Ă©s miĂ©rt ez számĂt az egĂ©szsĂ©gĂĽgyben)
Válasz elĹ‘ször: a PRISM egy könnyű, modell-agnosztikus eljárás, amely a meglĂ©vĹ‘ MDM-et kiegĂ©szĂti egy olyan tanulási cĂ©llal, ami tokenenkĂ©nti minĹ‘sĂ©gi pontszámot tanĂt meg, Ă©s ezt a pontszámot ugyanabban az elĹ‘recsatolásban (forward pass) számolja ki, mint a generálást.
A PRISM két kulcseleme, ami egészségügyi szemmel különösen értékes:
- Per-token minőségbecslés (quality score): nem csak azt mondja, hogy „bizonytalan vagyok”, hanem azt is, hogy hol.
- Célzott újramaszkolás (remasking): nem kell mindent újragenerálni, csak a gyanús részeket.
Mit jelent a „bizonyĂtható” ebben a kontextusban?
A PRISM cikke azt hangsĂşlyozza, hogy a javasolt önjavĂtási vesztesĂ©gfĂĽggvĂ©ny bizonyĂthatĂłan megtanĂtja a tokenenkĂ©nti minĹ‘sĂ©gpontszámokat (a saját elmĂ©leti feltĂ©teleik mellett). Ez nem marketing: a „provable” jelzĹ‘ itt azt jelenti, hogy nem pusztán empirikus trĂĽkk, hanem van mögötte formalizált állĂtás.
EgĂ©szsĂ©gĂĽgyben a „bizonyĂtható” nem azt jelenti, hogy „soha nem hibázik”. Azt jelenti, hogy:
- jobban megérthető, miért működik,
- könnyebb szabályozĂłi, minĹ‘sĂ©gbiztosĂtási narratĂvát Ă©pĂteni,
- kisebb az esĂ©ly, hogy a teljesĂtmĂ©ny „vĂ©letlenĂĽl” jĂł egy benchmarkon, de szĂ©tesik Ă©lesben.
Miért nagy deal, hogy nincs RL és nincs verifikátor?
Az egĂ©szsĂ©gĂĽgyi bevezetĂ©seknĂ©l Ă©n Ăşjra Ă©s Ăşjra azt látom, hogy a legtöbb projekt nem modellhiány miatt bukik el, hanem rendszerkomplexitás miatt. Ha egy önjavĂtĂł pipeline Ăgy nĂ©z ki: generátor + verifikátor + RL finomhangolás + extra adatciklusok, akkor:
- drága lesz az üzemeltetés,
- nehéz az incidensek utólagos kivizsgálása,
- és fájdalmas a validáció (különösen több intézményre skálázva).
A PRISM „plug-in” jellege itt erős: kisebb bevezetési súrlódás, kevesebb mozgó alkatrész.
EgĂ©szsĂ©gĂĽgyi alkalmazások: hol hoz gyorsan mĂ©rhetĹ‘ eredmĂ©nyt az önjavĂtĂł MI?
Válasz elĹ‘ször: önjavĂtás ott ad a legtöbbet, ahol a kimenet hosszĂş vagy összetett, Ă©s nĂ©hány aprĂł hiba aránytalan kárt okoz. Ez tipikusan radiolĂłgiai szöveg, kĂłdolás, összefoglalĂłk Ă©s klinikai döntĂ©stámogatĂł javaslatok.
1) RadiolĂłgiai leletek: „rossz mondat” helyett cĂ©lzott javĂtás
Egy leletben a rendszer gyakran sok mindent eltalál, majd elcsúszik egy kulcson:
- összekeveri a laterális oldalt,
- tĂşl erĹ‘s állĂtást tesz („biztosan”),
- vagy kihagy egy kontraindikációt.
A PRISM-szerű minőségpontszám token szinten képes megjelölni a gyanús részeket. Ebből két gyakorlati pattern jön:
- Remasking a kritikus állĂtásokra: pl. oldaliság, mĂ©rtĂ©kegysĂ©g, „no evidence of” tĂpusĂş tagadások.
- Második körös generálás csak ezekre: gyorsabb Ă©s kevĂ©sbĂ© „szĂ©tĂrja” a már jĂł rĂ©szeket.
2) Orvosi kódolás és adminisztráció: kevesebb visszadobott eset
Kódolásnál a hibák gyakran nem teljesen „rosszak”, csak pontatlanok. Ha a modell képes megjelölni, hogy mely tokenek vagy kódrészletek bizonytalanok, akkor:
- a humán ellenőr oda néz először,
- a rendszer célzottan újragenerálja a problémás kódot vagy indoklást,
- csökken a „felesleges kézi munka” aránya.
Ez ugyanaz a logika, amit e-kereskedelemben a kivételkezelésnél látunk: nem mindent vizsgálunk, csak a kockázatos tételeket.
3) Orvosi képfeldolgozás: diszkrét „tokenek” a szegmentációban
A PRISM kutatás diszkrĂ©t terekre fĂłkuszál. A kĂ©palkotásban is egyre több pipeline fordĂtja le a problĂ©mát diszkrĂ©t döntĂ©sekre (rĂ©giĂłk, maszk-elemek, cĂmkĂ©k, patch-szintű osztályok). Itt az önjavĂtás Ăşgy jelenhet meg, hogy:
- a rendszer megjelöli a határterületeket (pl. tumor perem),
- célzottan újraszámol bizonyos régiókat,
- Ă©s nem „önti ki a gyereket a fĂĽrdĹ‘vĂzzel”, azaz nem rontja el a már jĂł rĂ©szeket.
Mit tanulhat ebből a kiskereskedelem és az e-kereskedelem (és miért érdemes együtt gondolkodni)?
Válasz elĹ‘ször: az önjavĂtási logika ugyanaz: mĂ©rd meg, hol gyenge a kimenet, Ă©s csak ott nyĂşlj bele. A kĂĽlönbsĂ©g a kockázatban van, nem a mĂłdszerben.
A sorozatunkban sokat beszĂ©lĂĽnk szemĂ©lyre szabott ajánlásrĂłl, kereslet-elĹ‘rejelzĂ©srĹ‘l Ă©s kĂ©szletkezelĂ©srĹ‘l. Ezekben az önjavĂtás Ăgy nĂ©z ki:
- AjánlĂłrendszer: a modell jelöli a bizonytalan ajánlásokat, Ă©s alternatĂv listát generál.
- Kereslet-előrejelzés: a rendszer kiemeli azokat az időszakokat/termékeket, ahol a predikció „gyenge”, és ott kér több jelzést (pl. promóciós naptár).
- Ügyfélszolgálati válasz: a modell a kockázatos mondatokat (jogi/garanciális részek) újrafogalmazza.
EgĂ©szsĂ©gĂĽgyben ez a fajta „kockázat-alapĂş önjavĂtás” nem kĂ©nyelmi funkciĂł, hanem biztonsági öv.
Gyakorlati bevezetĂ©si terv: hogyan nĂ©zne ki egy PRISM-szerű önjavĂtás egĂ©szsĂ©gĂĽgyi környezetben?
Válasz először: 4 lépésben érdemes haladni: kritikus tokenek definiálása, minőségpontszám kalibrálása, célzott remasking szabályok, majd éles monitorozás.
1) „Kritikus tokenek” térképe
Ne általánosan mérjünk minőséget. Határozzuk meg, mi kritikus a doménben:
- tagadás („nem látható”, „kizárható”),
- oldaliság,
- mértékegységek,
- gyógyszernevek és dózisok,
- diagnĂłziskĂłdok.
2) Minőségpontszámok kalibrálása valós hibákkal
A minőségpontszám akkor hasznos, ha „emberi” küszöbértéket tudunk rá tenni. Ehhez kell:
- retrospektĂv minták (valĂłdi hibák),
- annotáció: hol volt a hiba,
- és egy olyan küszöb, ahol a false positive még kezelhető.
3) Remasking politika: mennyit javĂtson, Ă©s mikor álljon meg?
Három egyszerű szabály, ami jól működik:
- Max. X% token remasking körönként (pl. 5–10%), hogy ne destabilizálja a szöveget.
- Kritikus tokenek elĹ‘nyt Ă©lveznek (ha ugyanannyi javĂtás fĂ©r bele).
- Stop, ha a minőségpontszám nem javul két iteráció után (ne pörögjön feleslegesen).
4) Monitorozás: az önjavĂtás is lehet hibás
Az önjavĂtás nem varázspálca. MĂ©rni kell:
- hányszor maszkolsz újra,
- hol koncentrálódnak a „gyenge” részek,
- a humán felülvizsgálat során mennyi volt valódi hiba,
- Ă©s hogy az önjavĂtás nem ront-e el korábban jĂł rĂ©szeket.
Gyors Q&A: amire a csapatod valĂłszĂnűleg rákĂ©rdez
„Ha ez ennyire jó, miért nem csinálja minden modell?”
Mert a legtöbb generatĂv pipeline mĂ©g mindig a „egy körben kiadjuk a választ” logikára Ă©pĂĽl. Az önjavĂtás iteráciĂłt Ă©s mĂ©rhetĹ‘ minĹ‘sĂ©get feltĂ©telez. A PRISM abba az irányba tolja a mezĹ‘nyt, hogy ez könnyebben beĂ©pĂthetĹ‘ legyen.
„Ez kiváltja az orvost vagy a radiológust?”
Nem. Viszont csökkenti a figyelmet elkerĂĽlĹ‘ hibák esĂ©lyĂ©t, Ă©s segĂt abban, hogy az ember ott ellenĹ‘rizzen, ahol tĂ©nyleg kockázat van.
„Mitől lesz ebből lead?”
AttĂłl, hogy ezt le tudod fordĂtani egy auditálhatĂł, mĂ©rhetĹ‘ pilotra: kevesebb javĂtási kör, kevesebb kritikus hiba, gyorsabb validáciĂł. A döntĂ©shozĂłk ezt Ă©rtik.
Zárás: az önjavĂtĂł MI nem extra funkciĂł, hanem alapelv
A PRISM ĂĽzenete számomra egyszerű: nem kell mindent Ăşjratervezni ahhoz, hogy a modell kĂ©pes legyen Ă©szrevenni Ă©s kijavĂtani a saját gyengĂ©bb rĂ©szeit. Az egĂ©szsĂ©gĂĽgyben ez a szemlĂ©let közvetlenĂĽl kapcsolĂłdik a diagnosztikai pontossághoz, a betegbiztonsághoz Ă©s a bevezethetĹ‘sĂ©ghez.
Ha a kiskereskedelmi Ă©s e-kereskedelmi sorozatunkbĂłl egy dolgot Ă©rdemes átmenteni az egĂ©szsĂ©gĂĽgybe, az ez: a jĂł MI nem csak okos, hanem fegyelmezett is. Megmondja, hol bizonytalan, Ă©s ott javĂt.
Te a saját szervezetedben hol lenne a legnagyobb Ă©rtĂ©ke annak, ha az MI nem csak választ adna, hanem önállĂłan vissza is javĂtaná a kockázatos rĂ©szeket: leletezĂ©sben, kĂłdolásban vagy betegĂşt-szervezĂ©sben?