A genomikai AI-modellek soft prompt támadásokkal torzĂthatĂłk. NĂ©zd meg, mit jelent ez a diagnosztikában, Ă©s hogyan auditáld SAGE-szerűen.

AI-biztonság a genomikában: Ăgy támadhatĂłk a diagnĂłzismodellek
A klinikai genetikai diagnosztika egyik csendes motorja ma már nem csak a szekvenáló gép, hanem a háttérben futó genomikai alapmodell is. Az olyan modellek, mint az ESM (Evolutionary Scale Modeling) család, egyre több helyen jelennek meg variáns-hatás előrejelzésben, kutatási pipeline-okban, sőt diagnosztikai döntéstámogatásban is. És van egy kellemetlen igazság: a „pontosság” nem ugyanaz, mint a „biztonság”.
2025.12.22-Ă©n friss arXiv-közlemĂ©ny hĂvta fel a figyelmet arra, hogy mĂ©g a csĂşcskategĂłriás genomikai modellek (pĂ©ldául ESM2) is Ă©rzĂ©kenyek cĂ©lzott, Ăşgynevezett soft prompt támadásokra. A tanulmány egy SAGE nevű, ĂĽgynök-alapĂş (agentic) audit keretrendszert mutat be, amely automatizáltan keresi Ă©s mĂ©ri ezeket a sebezhetĹ‘sĂ©geket. EgĂ©szsĂ©gĂĽgyi AI-rendszereknĂ©l ez nem elmĂ©leti kĂ©rdĂ©s: ha egy diagnosztikai modell manipulálhatĂł, a kockázat betegbiztonsági kĂ©rdĂ©ssĂ© válik.
Ebben a „Mesterséges intelligencia az egészségügyben” sorozatba illeszkedő cikkben közérthetően elmagyarázom:
- mit jelent a soft prompt támadás egy genomikai modellnél,
- miĂ©rt számĂt ez klinikai variánsinterpretáciĂłban,
- hogyan működik a SAGE-féle kockázataudit,
- és mit tehet egy egészségügyi szervezet már holnap, hogy csökkentse a kitettséget.
Miért célpontok a variáns-előrejelző modellek az egészségügyben?
Válasz röviden: azĂ©rt, mert a variáns-hatás elĹ‘rejelzĂ©s a diagnosztikai lánc kritikus pontja, Ă©s egy kis torzĂtás is nagy klinikai következmĂ©nyekhez vezethet.
A variánsinterpretáciĂł gyakran Ăşgy nĂ©z ki a gyakorlatban, hogy a labor Ă©s a klinikus több jelbĹ‘l rakja össze a kĂ©pet: populáciĂłs gyakoriság, családi segregáciĂł, funkcionális adatok, irodalmi bizonyĂtĂ©kok – Ă©s egyre gyakrabban gĂ©pi tanulásos predikciĂłk. Ezek az AI-alapĂş prediktorok tipikusan nem „kimondják a diagnĂłzist”, hanem valĂłszĂnűsĂ©get vagy pontszámot adnak arra, hogy egy aminosavcsere (vagy más variáns) mennyire valĂłszĂnű, hogy káros.
A gond ott kezdődik, hogy a modern genomikai alapmodellek (GFMs) bonyolult, nagy dimenziós reprezentációkat tanulnak a fehérjeszekvenciákból. Ez elképesztően hasznos – de a biztonsági oldalról azt is jelenti, hogy:
- a döntés nem könnyen „visszafejthető” emberi szabályokra,
- a modell viselkedĂ©se változhat aprĂł, látszĂłlag ártalmatlan bemeneti mĂłdosĂtásokra,
- és létezhetnek olyan beavatkozások, amelyek nem a modellt hackelik meg, hanem a modell környezetét vagy beágyazási terét manipulálják.
Ha egy kĂłrház vagy diagnosztikai szolgáltatĂł AI-t használ, a kĂ©rdĂ©s 2026-ban már nem az, hogy „használjunk-e AI-t?”, hanem hogy milyen minĹ‘sĂ©gbiztosĂtással Ă©s támadási modell mellett használjuk.
EgĂ©szsĂ©gĂĽgyi következmĂ©ny: az „észrevĂ©tlen” teljesĂtmĂ©nyromlás
A tanulmány kulcsĂĽzenete: cĂ©lzott soft prompt perturbáciĂłk mellett mĂ©rhetĹ‘en romlik a teljesĂtmĂ©ny (pĂ©ldául AUROC/AUPR mutatĂłkon). Klinikai kontextusban ez azt jelenti, hogy több lehet:
- hamis negatĂv (káros variáns „ártalmatlannak” tűnik),
- hamis pozitĂv (jĂłindulatĂş variáns „kĂłrosnak” látszik),
- vagy egyszerűen több VUS (bizonytalan jelentĹ‘sĂ©gű variáns), ami lassĂtja a döntĂ©st.
Ezek közül bármelyik drága. Nem csak pénzben – időben, betegúti csúszásban, felesleges vizsgálatokban.
Soft prompt támadások: nem a szekvenciát Ărják át, hanem a „kontekstukat”
Válasz röviden: a soft prompt támadás egy olyan manipuláciĂł, ami nem feltĂ©tlenĂĽl a bemeneti szekvenciát mĂłdosĂtja, hanem a modell belsĹ‘ „irányĂtásához” ad hozzá aprĂł, tanult perturbáciĂłt az embedding tĂ©rben.
A klasszikus adverzariális példákat sokan a képfeldolgozásból ismerik: pár pixel módosul, és a modell már mást lát. A genomikai modelleknél hasonló a dinamika, csak itt a „pixelek” helyett szekvencia-tokenek és embeddingek vannak.
A soft prompt lĂ©nyege, hogy a támadĂł (vagy egy rosszul vĂ©dett integráciĂł) kiegĂ©szĂtĹ‘, tanult vektorokat fűz a modell bemenetĂ©hez vagy a reprezentáciĂłhoz. Ezek a vektorok Ăşgy viselkednek, mint egy rejtett instrukciĂł: bizonyos irányba tolják a modell válaszát.
Ami miatt ez egészségügyben különösen veszélyes:
- Nincs feltétlenül „szemmel látható” nyoma. A bemeneti szekvencia akár érintetlen is maradhat.
- CĂ©lzott lehet. Nem csak „rosszabb lesz” a modell, hanem egy adott fehĂ©rjecsaládra vagy variánstĂpusra torzĂthat.
- Ellátási láncban is megjelenhet. Például egy külső pipeline-komponens, plugin, vagy rosszul verziózott inference-környezet révén.
Snippet-mondat: A soft prompt támadás nem a modellt cseréli ki, hanem a modellt „félrevezeti”.
Mit csinál a SAGE, és miért jó az ügynök-alapú kockázataudit?
Válasz röviden: a SAGE egy automatizált audit-loop, ami soft prompt perturbációkat injektál, több checkpointon követi a viselkedést, AUROC/AUPR alapján mér, és strukturált kockázati riportot generál.
A kutatás egyik legpraktikusabb része az, hogy nem elég annyit mondani: „van sebezhetőség”. A SAGE azt próbálja megoldani, amit a kórházi valóság is megkövetel: folyamatos minőség- és biztonságmonitorozást, lehetőleg emberi erőforrás-faló kézi tesztelés nélkül.
A SAGE audit ciklusa (egészségügyi szemmel)
A tanulmány alapján a SAGE nagyjából ezt a logikát követi:
- Támadási inger (soft prompt) injektálása a modell körĂ© Ăşgy, hogy magát az alapmodellt nem mĂłdosĂtja.
- ViselkedĂ©s monitorozása több tanĂtási checkpointon (ez fontos: a „robosztusság” tanulás közben is változhat).
- Kockázati metrikák számĂtása, pl. AUROC Ă©s AUPR – ez a diagnosztikai predikciĂłknál bevett, jĂłl kommunikálhatĂł mĂ©rĂ©s.
- Strukturált riport kĂ©szĂtĂ©se, amelyet a szerzĹ‘k szerint egy LLM narratĂv magyarázattal is kiegĂ©szĂt.
A nagy elĹ‘ny: ez a megközelĂtĂ©s nem egyszeri pentest, hanem egy rendszeres auditálhatĂł folyamat. EgĂ©szsĂ©gĂĽgyi AI-nál pont erre van szĂĽksĂ©g: ha változik a modellverziĂł, az adat, a környezet vagy az integráciĂł, a kockázat is változhat.
Mit mond a tanulmány eredménye az ESM2-ről?
A szerzĹ‘k fĹ‘ állĂtása: mĂ©g a state-of-the-art ESM2 is Ă©rzĂ©keny cĂ©lzott soft prompt támadásokra, ami mĂ©rhetĹ‘ teljesĂtmĂ©nyromlást okoz.
Ez azĂ©rt fontos ĂĽzenet, mert sok szervezet fejben Ăşgy osztályozza a kockázatot, hogy „ha nagy modell Ă©s nagy nĂ©v, akkor biztos erĹ‘s”. A valĂłság inkább az: a teljesĂtmĂ©ny Ă©s a robosztusság kĂ©t kĂĽlön KPI.
Hogyan néz ki egy reális támadási forgatókönyv klinikai környezetben?
Válasz röviden: a legvalĂłszĂnűbb kockázat nem a hollywoodi „feltörik a kĂłrházat” sztori, hanem a beszállĂtĂłi Ă©s integráciĂłs láncban megjelenĹ‘, Ă©szrevĂ©tlen torzĂtás.
A legtöbb egészségügyi AI-incidensnél (akár adat-, akár modelloldalon) a gyenge pontok tipikusan:
- rosszul kezelt API-kulcsok és jogosultságok,
- nem verziĂłzott modellek/pipeline-ok,
- ellenőrizetlen „utility” kódok,
- túl nagy bizalom a harmadik féltől jövő komponensekben.
Példa: variáns-értékelő pipeline „apró” változással
KĂ©pzelj el egy laborpipeline-t, ahol a szekvenciákbĂłl embedding kĂ©szĂĽl, majd arra jön egy variáns-hatás prediktor. Ha az embedding előállĂtásánál vagy a modell körĂĽli wrapperben megjelenik egy soft prompt jellegű perturbáciĂł (akár „optimalizáció” cĂmkĂ©vel), az:
- bizonyos génekre következetesen eltolhatja a pontszámokat,
- és a csapat hetekig csak annyit lát, hogy „furcsa lett a találati arány”.
Ez a legrosszabb fajta hiba: nem áll le a rendszer, csak csendben romlik.
Mit érdemes most bevezetni? Gyakorlati kontrollok 30 napra bontva
Válasz röviden: először mérj (baseline), aztán zárd a támadási felületeket (integráció), végül tedd folyamattá (folyamatos audit).
A tanulmány üzenete számomra az, hogy a genomikai AI-t ugyanúgy kell kezelni, mint bármely kritikus egészségügyi szoftvert: verifikáció, monitorozás, változáskezelés. Itt egy reális, rövid távú terv.
0–7 nap: „Mi fut élesben?” leltár és baseline
- Modell- és pipeline-verziók leltára (hash, build, konfiguráció).
- Baseline teljesĂtmĂ©ny rögzĂtĂ©se (AUROC/AUPR + kalibráciĂłs görbe, ha van rá mĂłd).
- Minimum: bontás génpanelre / betegségcsoportra (ne csak egy átlagot nézz).
7–14 nap: integrációs támadási felület csökkentése
- Soft prompt jellegű komponensek tiltása/korlátozása, ha van ilyen a stackben.
- Jogosultságok szigorĂtása (ki Ărhat konfiguráciĂłt, ki deployolhat modellt).
- Artefakt-szignálás Ă©s ellenĹ‘rzĂ©s: csak aláĂrt, jĂłváhagyott modellek kerĂĽlhetnek Ă©lesbe.
14–30 nap: folyamatos audit és riasztás
- Adverzariális/robosztussági tesztcsomag bevezetése (SAGE-szerű logikával):
- kontrollált perturbációk,
- rendszeres futtatás (pl. heti),
- eltĂ©rĂ©sriasztás (drift + teljesĂtmĂ©nyromlás).
- Riport formátum standardizálása, hogy a QA és az orvosszakmai vezetés is értse.
Snippet-mondat: A biztonság nem feature, hanem üzemeltetési ritmus.
„People also ask” – gyors válaszok a leggyakoribb kérdésekre
„Ez azt jelenti, hogy a genomikai AI nem megbĂzhatĂł?”
Nem. Azt jelenti, hogy biztonsági audit nĂ©lkĂĽl nem tekinthetĹ‘ klinikai szintűen kontrolláltnak. A megbĂzhatĂłságot bizonyĂtani Ă©s fenntartani kell.
„A soft prompt támadás csak kutatólaboros probléma?”
Nem. A mĂłdszer lĂ©nyege, hogy a modell körĂĽl is lehet manipulálni. Ez az egĂ©szsĂ©gĂĽgyi IT-ban gyakran valĂłszĂnűbb, mint a modell belsĹ‘ paramĂ©tereinek direkt mĂłdosĂtása.
„Mit kĂ©rjek a beszállĂtĂłmtĂłl vagy fejlesztĹ‘csapattĂłl?”
Három dolgot:
- Robosztussági tesztek (nem csak pontossági riport).
- Verziózás és reprodukálhatóság (minden futás visszakövethető).
- Folyamatos monitoring (riasztás, ha romlik a teljesĂtmĂ©ny vagy eltolĂłdik a bemenet).
Mit jelent ez a „Mesterséges intelligencia az egészségügyben” sorozat szempontjából?
A diagnosztikai AI-rĂłl szĂłlĂł beszĂ©lgetĂ©sek Magyarországon is kezdenek Ă©rettebbĂ© válni: már nem az a fĹ‘ kĂ©rdĂ©s, hogy „jobb-e az AI”, hanem hogy milyen kontrollokkal engedjĂĽk be a betegellátásba. A SAGE Ă©s a soft prompt sebezhetĹ‘sĂ©gek tĂ©mája pont azĂ©rt fontos, mert a genomikai predikciĂł sokszor „háttĂ©rkomponensnek” tűnik – holott a döntĂ©s-elĹ‘kĂ©szĂtĂ©sben kulcsszereplĹ‘.
Ha egĂ©szsĂ©gĂĽgyi vezetĹ‘kĂ©nt, informatikai vezetĹ‘kĂ©nt vagy innováciĂłs felelĹ‘skĂ©nt egy dolgot viszel magaddal: a modellvalidáciĂł nem Ă©r vĂ©get az AUC-görbĂ©vel. A biztonsági Ă©s robosztussági audit ugyanĂşgy rĂ©sze a betegbiztonságnak, mint a labor minĹ‘sĂ©girányĂtása.
Ha szeretnĂ©d, a következĹ‘ lĂ©pĂ©sben szĂvesen adok egy 1 oldalas ellenĹ‘rzĹ‘listát arra, hogyan nĂ©zzen ki egy „AI-biztonság a diagnosztikában” audit (genomika + kĂ©palkotás + triázs rendszerek) – Ă©s mik a tipikus gyors nyeresĂ©gek 2–4 hĂ©t alatt.
A kérdés, amit 2026 elején minden AI-t használó egészségügyi szervezetnek fel kell tennie: ha holnap megváltozna a modell viselkedése egy rejtett perturbáció miatt, észrevennénk-e időben?