TĂ©nyellenƑrzött orvosi AI-vĂĄlaszok: Ă­gy Ă©pĂŒl a bizalom

MestersĂ©ges intelligencia az egĂ©szsĂ©gĂŒgyben‱‱By 3L3C

Orvosi LLM-eknĂ©l a faktualitĂĄs a kulcs. TudĂĄsgrĂĄf-alapĂș ellenƑrzĂ©ssel a vĂĄlaszok ĂĄllĂ­tĂĄsai gĂ©pileg mĂ©rhetƑk Ă©s magyarĂĄzhatĂłk.

egĂ©szsĂ©gĂŒgyi AILLMtĂ©nyellenƑrzĂ©studĂĄsgrĂĄftelemedicinabiztonsĂĄgmagyarĂĄzhatĂł AI
Share:

Featured image for TĂ©nyellenƑrzött orvosi AI-vĂĄlaszok: Ă­gy Ă©pĂŒl a bizalom

TĂ©nyellenƑrzött orvosi AI-vĂĄlaszok: Ă­gy Ă©pĂŒl a bizalom

Egy rossz orvosi tanĂĄcs nem „csak” kellemetlen: rossz gyĂłgyszerszedĂ©shez, kĂ©slekedƑ diagnĂłzishoz vagy felesleges vizsgĂĄlatokhoz vezethet. EzĂ©rt amikor nagy nyelvi modelleket (LLM-eket) engedĂŒnk közel a betegkommunikĂĄciĂłhoz, triĂĄzshoz vagy klinikai döntĂ©stĂĄmogatĂĄshoz, a legfontosabb kĂ©rdĂ©s nem az, hogy mennyire vĂĄlasztĂ©kosan fogalmaznak, hanem az, hogy igazat mondanak-e.

A friss, AAAI’26 konferenciĂĄra elfogadott kutatĂĄs (FAITH keretrendszer) pont erre ad egy hasznĂĄlhatĂł, mĂ©rnöki vĂĄlaszt: automatizĂĄlt tĂ©nyellenƑrzĂ©st vĂ©gez orvosi LLM-vĂĄlaszokon Ășgy, hogy közben nem igĂ©nyel elƑre megĂ­rt „helyes megoldĂĄst” (referenciavĂĄlaszt). Ehelyett az ĂĄllĂ­tĂĄsokat orvosi tudĂĄsgrĂĄfokhoz köti, Ă©s bizonyĂ­tĂ©ki Ăștvonalak alapjĂĄn pontoz. A lĂ©nyeg: az AI-t nem „szĂ©pen beszĂ©lni” tanĂ­tjuk, hanem elszĂĄmoltathatĂłan ĂĄllĂ­tani.

Ez a cikk a „MestersĂ©ges intelligencia az egĂ©szsĂ©gĂŒgyben” sorozat rĂ©sze. A sorozatban sokat beszĂ©lĂŒnk diagnosztikĂĄrĂłl, telemedicinĂĄrĂłl Ă©s mƱködĂ©soptimalizĂĄlĂĄsrĂłl – most viszont arrĂłl a rĂ©tegrƑl lesz szĂł, amit a legtöbb szervezet alulbecsĂŒl: a megbĂ­zhatĂłsĂĄg mĂ©rĂ©sĂ©rƑl Ă©s bizonyĂ­thatĂłsĂĄgĂĄrĂłl.

MiĂ©rt bukik el a legtöbb „orvosi chatbot” a valĂłsĂĄgban?

A problĂ©ma egyszerƱ: a nyelvi modell meggyƑzƑ szöveget gyĂĄrt. A klinikai környezet viszont ellenƑrizhetƑ ĂĄllĂ­tĂĄsokat kĂ©r.

A klasszikus Ă©rtĂ©kelĂ©si mĂłdszerek (pĂ©ldĂĄul „hasonlĂ­t-e a vĂĄlasz a mintamegoldĂĄsra?”) az egĂ©szsĂ©gĂŒgyben gyakran falnak mennek:

  • Sok kĂ©rdĂ©sre több elfogadhatĂł vĂĄlasz lĂ©tezik (kĂŒlönbözƑ irĂĄnyelvek, beteg-specifikus tĂ©nyezƑk).
  • A referenciavĂĄlasz gyorsan elavulhat (Ășj ajĂĄnlĂĄsok, gyĂłgyszerfigyelmeztetĂ©sek).
  • A „szöveg-minƑsĂ©g” (folyĂ©konysĂĄg) könnyen elfedi a tĂ©nyhibĂĄkat.

A telemedicina Ă©s a digitĂĄlis triĂĄzs 2025 vĂ©gĂ©re mĂĄr nem kĂ­sĂ©rlet sok helyen, hanem napi rutin. Itt egyetlen fĂ©lrecsĂșszott ĂĄllĂ­tĂĄs is komoly kockĂĄzat:

Az egĂ©szsĂ©gĂŒgyi LLM-eknĂ©l a legveszĂ©lyesebb hiba nem a stĂ­lus, hanem a magabiztos tĂ©vedĂ©s.

Mit ad hozzĂĄ a FAITH: tĂ©nyellenƑrzĂ©s referenciavĂĄlasz nĂ©lkĂŒl

A FAITH keretrendszer központi ĂĄllĂ­tĂĄsa: az orvosi LLM-vĂĄlaszok faktualitĂĄsa automatizĂĄltan mĂ©rhetƑ, ha a vĂĄlaszt atomikus ĂĄllĂ­tĂĄsokra bontjuk, majd ezeket tudĂĄsgrĂĄfban kereshetƑ tĂ©nyekhez kötjĂŒk.

1) Atomikus ĂĄllĂ­tĂĄsok: a „mondat” tĂșl nagy egysĂ©g

A klinikai tĂ©vedĂ©sek gyakran aprĂł csĂșszĂĄsok:

  • „A gyĂłgyszer X csökkenti a vĂ©rnyomĂĄst” (lehet igaz)
  • „ és terhessĂ©gben biztonsĂĄgos” (lehet hamis)

Egy összetett mondatban ezek összefolynak. Az atomikus bontĂĄs lĂ©nyege, hogy minden ellenƑrizhetƑ darab kĂŒlön pontot kapjon.

Gyakorlati példa (egyszerƱsítve):

  • ÁllĂ­tĂĄs A: „A metformin elsƑ vonalbeli szer 2-es tĂ­pusĂș diabĂ©teszben.”
  • ÁllĂ­tĂĄs B: „SĂșlyos vesekĂĄrosodĂĄs esetĂ©n kerĂŒlendƑ.”

Ezek kĂŒlön-kĂŒlön ellenƑrizhetƑk.

2) TudĂĄsgrĂĄf: nem „keresĂ©s”, hanem kapcsolati bizonyĂ­tĂ©k

A tudĂĄsgrĂĄf (KG) olyan strukturĂĄlt hĂĄlĂł, ahol entitĂĄsok (betegsĂ©gek, gyĂłgyszerek, mellĂ©khatĂĄsok) Ă©s kapcsolatok (indikĂĄciĂł, kontraindikĂĄciĂł, interakciĂł) alkotnak egy ellenƑrizhetƑ rendszert.

A FAITH nem csak azt nĂ©zi, hogy szerepel-e egy kifejezĂ©s, hanem azt, hogy lĂ©tezik-e bizonyĂ­tĂ©ki Ăștvonal az ĂĄllĂ­tĂĄs entitĂĄsai között.

  • Ha a grĂĄfban van Ăștvonal, az ĂĄllĂ­tĂĄs erƑsebb.
  • Ha nincs Ăștvonal, az ĂĄllĂ­tĂĄs gyanĂșs vagy nem lefedett.

3) Pontozås és magyaråzhatósåg: nem fekete doboz

A kutatĂĄs egyik erƑs pontja, hogy a pontszĂĄm mögĂ© lehet nĂ©zni. A felhasznĂĄlĂł (orvos, minƑsĂ©gbiztosĂ­tĂĄs, termĂ©kfelelƑs) nem csak azt kapja meg, hogy „jĂł/rossz”, hanem azt is, hogy:

  • mely atomikus ĂĄllĂ­tĂĄsok problĂ©mĂĄsak,
  • milyen bizonyĂ­tĂ©k (Ăștvonal) tĂĄmasztja alĂĄ vagy nem tĂĄmasztja alĂĄ,
  • hol vannak lefedetlensĂ©gi lyukak.

Ez a kĂŒlönbsĂ©g aközött, hogy „a modell 82%-os”, Ă©s aközött, hogy konkrĂ©tan megmutatom, melyik ĂĄllĂ­tĂĄsnĂĄl csĂșszik el.

Mit mutattak a kísérletek: közelebb az orvosi megítéléshez

A tanulmĂĄny lĂ©nyege nem az, hogy „a tudĂĄsgrĂĄf mindent megold”, hanem az, hogy jobban egyĂŒtt mozog a klinikusok Ă­tĂ©letĂ©vel, mint sok hagyomĂĄnyos automatikus mĂ©rƑszĂĄm.

A szerzƑk több orvosi feladaton vizsgĂĄltĂĄk a megközelĂ­tĂ©st, Ă©s emberi (szubjektĂ­v) Ă©rtĂ©kelĂ©ssel vetettĂ©k össze. Az ĂŒzenet szĂĄmomra hĂĄrom rĂ©szbƑl ĂĄll:

Jobb korrelåció a klinikusi értékeléssel

A KG-alapĂș Ă©rtĂ©kelĂ©s „érzĂ©kenyebb” a tĂ©nyhibĂĄkra, miközben kevĂ©sbĂ© bĂŒnteti a stĂ­lusbeli eltĂ©rĂ©seket. Ez fontos, mert a valĂłs Ă©letben a modell vĂĄlasza ritkĂĄn lesz szĂł szerint olyan, mint egy referenciaminta.

KĂŒlönbsĂ©get tud tenni LLM-ek között

Ha kĂ©t modell hasonlĂłan folyĂ©konyan fogalmaz, a felhasznĂĄlĂł könnyen azt gondolja: „ugyanazt tudjĂĄk”. A FAITH-tĂ­pusĂș mĂ©rĂ©s segĂ­t kĂ©pessĂ©gszintet elkĂŒlönĂ­teni faktualitĂĄs mentĂ©n.

Robusztus a szövegvåltozatokra

Ugyanazt az ĂĄllĂ­tĂĄst lehet többfĂ©lekĂ©pp megfogalmazni. A KG-kötĂ©s miatt az Ă©rtĂ©kelĂ©s kevĂ©sbĂ© „szövegfĂŒggƑ”. Ez telemedicinĂĄban kifejezetten hasznos, mert a betegkĂ©rdĂ©sek Ă©s a vĂĄlaszstĂ­lusok erƑsen variĂĄlnak.

Mire jĂł ez itthon: telemedicina, triĂĄzs, diagnĂłzistĂĄmogatĂĄs

A FAITH gondolatvilĂĄga nem egy akadĂ©miai luxus. Szerintem ez az a hiĂĄnyzĂł rĂ©teg, amitƑl a „pilĂłtĂĄbĂłl” termĂ©k lesz.

Telemedicina: biztonsĂĄgosabb betegkommunikĂĄciĂł

A telemedicinĂĄs csatornĂĄkban gyakoriak a „mikor forduljak orvoshoz?” tĂ­pusĂș kĂ©rdĂ©sek. Itt a veszĂ©ly tipikusan:

  • alultriĂĄzs („nem sĂŒrgƑs”), amikor az,
  • gyĂłgyszeres ĂĄllĂ­tĂĄsok (kontraindikĂĄciĂłk, interakciĂłk),
  • tĂ©ves ĂĄltalĂĄnosĂ­tĂĄs (egy rizikĂłcsoport kimarad).

KG-alapĂș tĂ©nyellenƑrzĂ©ssel a rendszer kĂ©pes lehet riasztani, ha a vĂĄlasz olyan ĂĄllĂ­tĂĄst tartalmaz, amit a tudĂĄsgrĂĄf nem tĂĄmaszt alĂĄ.

Diagnóziståmogatås: ållítås-szintƱ kontroll

LLM-eket sokan hasznĂĄlnak differenciĂĄldiagnĂłzis ötletelĂ©sre. Ez önmagĂĄban nem baj, de a kontroll nĂ©lkĂŒli „ötletlista” könnyen tĂșl nagy sĂșlyt kap.

A jobb Ășt: a modell ad javaslatot, majd a rendszer ĂĄllĂ­tĂĄsokra bontja, Ă©s ellenƑrzi pĂ©ldĂĄul:

  • „TĂŒnet X összefĂŒgg ĂĄllapottal Y”
  • „VizsgĂĄlat Z elsƑ lĂ©pĂ©skĂ©nt indokolt”

A cĂ©l nem az, hogy az AI „felĂŒlĂ­rja” az orvost, hanem hogy ne csĂșsszanak be hamis ok-okozatok.

MƱködĂ©soptimalizĂĄlĂĄs: minƑsĂ©gbiztosĂ­tĂĄs skĂĄlĂĄn

Ha egy kĂłrhĂĄzi informatikai csapat LLM-et vezet be (pl. zĂĄrĂłjelentĂ©s-összefoglalĂĄs, betegĂșt-tĂĄjĂ©koztatĂĄs), akkor a minƑsĂ©gbiztosĂ­tĂĄs nem maradhat kĂ©zi mintavĂ©telezĂ©s.

KG-alapĂș automatikus ellenƑrzĂ©ssel lĂ©trehozhatĂł:

  • napi „faktualitĂĄs dashboard”,
  • kockĂĄzatos ĂĄllĂ­tĂĄstĂ­pusok listĂĄja (pl. dĂłzis, kontraindikĂĄciĂł),
  • modellverziĂłk összehasonlĂ­tĂĄsa Ă©lesben.

A valĂłs korlĂĄtok: hol tĂ©ved a tudĂĄsgrĂĄf-alapĂș megközelĂ­tĂ©s?

A jó hír: ez a megoldás erƑs. A rossz hír: nem varázspálca.

1) LefedetlensĂ©g: ami nincs a grĂĄfban, az „nem bizonyĂ­tható”

Ritka betegsĂ©gek, friss irĂĄnyelvfrissĂ­tĂ©sek, helyi protokollok. Ha a KG nem tartalmazza, az ĂĄllĂ­tĂĄs alulĂ©rtĂ©kelƑdhet.

Mit érdemes csinålni?

  • A legfontosabb klinikai terĂŒleteken (belgyĂłgyĂĄszat, sĂŒrgƑssĂ©gi, gyĂłgyszerbiztonsĂĄg) cĂ©lzott grĂĄfbƑvĂ­tĂ©s.
  • VerziĂłkezelĂ©s: mikor frissĂŒlt a grĂĄf, milyen forrĂĄsbĂłl.

2) Kontextus: „igaz”, de nem ennek a betegnek

Az orvoslĂĄs tele van „attĂłl fĂŒgg” helyzetekkel. Egy ĂĄllĂ­tĂĄs lehet ĂĄltalĂĄnosan igaz, de egy konkrĂ©t betegre hamis (pl. Ă©letkor, vesefunkciĂł, terhessĂ©g).

Itt a tudåsgråf mellé kell:

  • strukturĂĄlt betegkontekts (labor, anamnĂ©zis),
  • szabĂĄlyok vagy klinikai korlĂĄtozĂĄsok (pl. GFR kĂŒszöbök).

3) Nyelvi kötés és entitåsfelismerés

Magyar nyelven a ragozĂĄs, szinonimĂĄk, rövidĂ­tĂ©sek (pl. „HT”, „DM2”) extra kihĂ­vĂĄs. Ha az entitĂĄslinkelĂ©s pontatlan, a pontozĂĄs is az lesz.

A gyakorlati tanulsĂĄg: magyar telemedicinĂĄs termĂ©knĂ©l Ă©rdemes kĂŒlön foglalkozni a magyar orvosi terminolĂłgia normalizĂĄlĂĄsĂĄval.

Hogyan Ă©pĂ­ts be tĂ©nyellenƑrzĂ©st egy egĂ©szsĂ©gĂŒgyi AI-folyamatba (gyakorlatiasan)

Ha Ă©n ma (2025 vĂ©gĂ©n) egĂ©szsĂ©gĂŒgyi LLM-rendszert vezetnĂ©k be, ezt a „minimĂĄlisan Ă©sszerĆ±â€ kontrollt tennĂ©m körĂ©.

1) HatĂĄrozd meg, mit jelent nĂĄlatok a „tĂ©nyhiba”

Nem minden hiba egyformĂĄn veszĂ©lyes. CĂ©lszerƱ sĂșlyozni:

  • kritikus: dĂłzis, kontraindikĂĄciĂł, sĂŒrgƑssĂ©gi tĂŒnetek
  • közepes: kiegĂ©szĂ­tƑ informĂĄciĂłk, Ă©letmĂłdtanĂĄcsok
  • alacsony: definĂ­ciĂłk, ĂĄltalĂĄnos hĂĄttĂ©r

2) VĂĄlasz → ĂĄllĂ­tĂĄsok → KG-ellenƑrzĂ©s → döntĂ©s

Egy jĂłl mƱködƑ pipeline tipikusan:

  1. LLM generĂĄl
  2. ĂĄllĂ­tĂĄsbontĂĄs
  3. entitåslinkelés
  4. KG-bizonyíték keresés
  5. összpontszĂĄm + „piros zĂĄszlĂłk”
  6. akciĂł: megjelenĂ­tĂ©s / figyelmeztetĂ©s / emberi felĂŒlvizsgĂĄlat

3) Tedd lĂĄthatĂłvĂĄ a magyarĂĄzatot a felhasznĂĄlĂłnak

A magyarázhatóság nem extra, hanem biztonsági funkció. Ha a rendszer azt mondja: „ez az állítás nem támasztható alá”, akkor a klinikusnak látnia kell, melyik állításról van szó.

4) IndĂ­ts szƱk terĂŒleten, ahol nagy a nyeresĂ©g

HĂĄrom „jĂł belĂ©pĂ©si pont”:

  • gyĂłgyszer-interakciĂłk Ă©s kontraindikĂĄciĂłk ellenƑrzĂ©se
  • telemedicinĂĄs triĂĄzs figyelmeztetĂ©sek
  • betegoktatĂł anyagok faktualitĂĄs-szƱrĂ©se

Gyakori kĂ©rdĂ©sek, amik felmerĂŒlnek döntĂ©shozĂłknĂĄl

„Ez kiváltja a klinikust?”

Nem. A legjobb felhasznĂĄlĂĄs az, amikor a rendszer kiszƱri a problĂ©mĂĄs ĂĄllĂ­tĂĄsokat, Ă©s csökkenti a felĂŒlvizsgĂĄlati terhet. A felelƑssĂ©g Ă©s döntĂ©s klinikai marad.

„Mi van, ha a grĂĄf tĂ©ved vagy elavult?”

A tudĂĄsgrĂĄf is egy adattermĂ©k. UgyanĂșgy kell kezelni, mint egy gyĂłgyszertörzset: verziĂł, frissĂ­tĂ©s, audit. A nyeresĂ©g, hogy legalĂĄbb explicit tudĂĄsrĂłl beszĂ©lĂŒnk, nem rejtett modellparamĂ©terekrƑl.

„MegĂ©ri ezzel foglalkozni?”

A tapasztalatom az, hogy a legtöbb AI-projekt nem azĂ©rt bukik el, mert a modell „nem elĂ©g okos”, hanem mert nincs bizalomtechnolĂłgia körĂ© Ă©pĂ­tve: mĂ©rĂ©s, kontroll, visszacsatolĂĄs. A KG-alapĂș tĂ©nyellenƑrzĂ©s pont ezt a rĂ©st tölti.

Merre tart ez 2026-ban: az AI mĂĄr nem csak vĂĄlaszol, hanem felel

A FAITH Ă©s a tudĂĄsgrĂĄf-alapĂș faktualitĂĄsmĂ©rĂ©s egy irĂĄnyt erƑsĂ­t meg: az egĂ©szsĂ©gĂŒgyi AI-nĂĄl a következƑ szint a verifikĂĄciĂł. A telemedicina, diagnĂłzistĂĄmogatĂĄs Ă©s kĂłrhĂĄzi mƱködĂ©soptimalizĂĄlĂĄs csak akkor skĂĄlĂĄzĂłdik biztonsĂĄgosan, ha a rendszer kĂ©pes sajĂĄt ĂĄllĂ­tĂĄsait legalĂĄbb rĂ©szben gĂ©pileg ellenƑrizni Ă©s megmagyarĂĄzni.

Ha most vezetsz be LLM-et egĂ©szsĂ©gĂŒgyi folyamatba, Ă©n nem a „melyik modell a jobb?” kĂ©rdĂ©ssel kezdenĂ©m, hanem ezzel: hogyan fogod naponta mĂ©rni Ă©s bizonyĂ­tani, hogy a vĂĄlaszok tĂ©nyszerƱek?

Ha az AI beleszól az ellåtåsba, akkor nem elég okosnak lennie. Bizonyíthatóan megbízhatónak kell lennie.