Plan-tudatos kontextusmérnökség AI agentekhez: jobb pontosság kevesebb tokenből. Egészségügyi és e-kereskedelmi példákkal, lépésekkel.

Plan-tudatos AI: kisebb kontextus, pontosabb döntés
2025 vĂ©gĂ©re egy furcsa jelensĂ©g lett mindennapos az AI-projektekben: nem az algoritmusok „buták”, hanem a kontextus tĂşl kövĂ©r. A több lĂ©pĂ©ses ĂĽgynökök (agentek) – amelyek terveznek, eszközöket hĂvnak, jegyzetelnek, majd Ăşjraterveznek – pillanatok alatt több ezer, akár több tĂzezer tokennyi „munkamemĂłriát” gyártanak. A vĂ©geredmĂ©ny gyakran csalĂłdást keltĹ‘: drágább futás, lassabb válasz, Ă©s nĂ©ha mĂ©g rosszabb döntĂ©s is.
A PAACE (Plan-Aware Automated Context Engineering) cĂmű friss kutatás pont ezt a fájdalmat cĂ©lozza: hogyan lehet az ĂĽgynökök folyamatosan növekvĹ‘ kontextusát Ăşgy sűrĂteni, hogy közben ne vesszen el a lĂ©nyeg. Ami engem igazán megfogott benne, az nem a „szebb összefoglaló”, hanem a szemlĂ©let: a kontextust nem egyben kell tömörĂteni, hanem a terv (plan) következĹ‘ lĂ©pĂ©sei szerint kell rendben tartani.
És itt jön a csavar: miközben ez a munka a számĂtĂłgĂ©pes ĂĽgynökök világábĂłl jön, nagyon jĂłl fordĂthatĂł egĂ©szsĂ©gĂĽgyi Ă©s kiskereskedelmi/e-kereskedelmi folyamatokra is – pont oda, ahol sok adat, sok lĂ©pĂ©s Ă©s sok felelĹ‘ssĂ©g találkozik.
Miért fáj a „túl nagy kontextus” az ügynököknek?
A lényeg röviden: minél hosszabb a kontextus, annál drágább és zajosabb a gondolkodás.
Három tipikus probléma, amit a gyakorlatban látni
- FigyelemhĂgulás (attention dilution): az LLM figyelme szĂ©tszĂłrĂłdik. Fontos rĂ©szletek „elcsĂşsznak” a kevĂ©sbĂ© fontos logok, chatdarabok, eszköz-válaszok között.
- Költség és késleltetés: a hosszú prompt több időt és pénzt visz el. Ez telemedicinában, ügyfélszolgálatban vagy valós idejű készletkezelésnél nem „kényelmetlenség”, hanem üzleti kockázat.
- TörĂ©keny több lĂ©pĂ©ses logika: egy agent nem egyszer válaszol, hanem munkafolyamatot futtat. Ha az Ăşt közben rosszul sűrĂtĂĽnk, a kĂ©sĹ‘bbi lĂ©pĂ©sek fĂ©lrecsĂşszhatnak.
A kutatási absztraktbĂłl az derĂĽl ki, hogy a korábbi megközelĂtĂ©sek (összefoglalás, query-aware tömörĂtĂ©s) sokszor nem veszik komolyan az ĂĽgynöki tervezĂ©st. Pedig egy több lĂ©pĂ©ses folyamatban nem mindegy, hogy a következĹ‘ 1–3 feladat szempontjábĂłl mi releváns.
„A kontextus nem archĂvum. A kontextus egy munkalap.” Ha mindent Ĺ‘rzĂĽnk, a munkalap használhatatlan lesz.
Mit csinál máskĂ©nt a PAACE? A „plan-aware” megközelĂtĂ©s lĂ©nyege
A PAACE központi állĂtása: a kontextuskezelĂ©st a terv struktĂşrájához kell igazĂtani. Vagyis ne egy általános kivonatot kĂ©szĂtsĂĽnk, hanem olyan reprezentáciĂłt, ami a következĹ‘ lĂ©pĂ©sekhez tartja kĂ©znĂ©l a kritikus informáciĂłt.
A keretrendszer négy pillért emel ki (a cikk összefoglalója alapján):
- Next-k-task relevancia modellezĂ©s: a sűrĂtĂ©s cĂ©lja nem az, hogy „szĂ©p rövid” legyen, hanem hogy a következĹ‘ k feladathoz legyen optimális.
- Tervstruktúra-elemzés: a rendszer a plan szerkezetéből próbálja megérteni, mi a függőség, mi a mellékszál.
- InstrukciĂłk egyĂĽtt-finomszabályozása (instruction co-refinement): a feladatleĂrás Ă©s a kontextus egyĂĽtt formálĂłdik, hogy egyĂ©rtelmű legyen, mi a következĹ‘ teendĹ‘.
- FunkciĂłmegĹ‘rzĹ‘ tömörĂtĂ©s: a cĂ©l nem az informáciĂł „szĂ©psĂ©ge”, hanem a működĹ‘kĂ©pessĂ©g megĹ‘rzĂ©se (a kĂ©sĹ‘bbi lĂ©pĂ©sek helyesek maradjanak).
Két komponens: PAACE-Syn és PAACE-FT
A kutatás kĂ©t Ă©pĂtĹ‘elemet nevez meg:
- PAACE-Syn: szintetikus ĂĽgynöki munkafolyamatok nagy lĂ©ptĂ©kű generátora, lĂ©pĂ©senkĂ©nt annotált tömörĂtĂ©si felĂĽgyelettel.
- PAACE-FT: desztillált, plan-tudatos „kompresszor” modellek családja, amelyek sikeres tanár-demókból tanulnak.
Az eredmények (benchmarkokon) azért izgalmasak, mert nemcsak tokeneket spórolnak:
- AppWorld-ben jobb pontosság a baseline-okhoz kĂ©pest, miközben alacsonyabb a csĂşcskontextus Ă©s a kumulatĂv fĂĽggĹ‘sĂ©g.
- OfficeBench és multi-hop QA esetén jobb accuracy és F1, kevesebb lépés, kevesebb csúcstoken, kisebb attention-függőség.
- A desztillált PAACE-FT a leĂrás szerint a tanár teljesĂtmĂ©nyĂ©nek 97%-át tartja meg, miközben több mint nagyságrendi (10Ă—+) költsĂ©gcsökkenĂ©st hoz.
Ez a 97% azért fontos, mert a valós életben a legtöbb szervezet nem engedheti meg magának a „mindig a legnagyobb modell, mindig a leghosszabb kontextus” stratégiát.
Mit jelent ez az egész az egészségügyben? (És mi köze van a költségekhez)
A plan-tudatos kontextusmérnökség az egészségügyben nem elméleti játék. A klinikai döntéstámogatás, a triázs, a radiológiai leletezés vagy a betegút-szervezés mind több lépéses, sokforrású folyamat.
1) Diagnosztikai munkafolyamatok: „következő lépés relevancia” a gyakorlatban
Egy tipikus forgatókönyv:
- tünetek + anamnézis
- laboredmények
- képalkotó (CT/MR)
- korábbi epizódok
- gyĂłgyszerlista
- irányelv/rendelkezés
A gond nem az, hogy ezek ne lennĂ©nek fontosak, hanem hogy nem egyszerre fontosak. Egy plan-tudatos megközelĂtĂ©s azt mondja:
- Ha a következő lépés a gyógyszer-interakció ellenőrzés, akkor a friss labort és a gyógyszerlistát tartsd fókuszban.
- Ha a következő lépés a képalkotó értelmezés, akkor a releváns klinikai kérdés + előzmény + radiológiai megfigyelések legyenek elöl, ne a teljes chatnapló.
Ez nemcsak gyorsĂt. Csökkenti annak esĂ©lyĂ©t is, hogy a modell irreleváns rĂ©szletekbe kapaszkodva „fĂ©lrediagnosztizáljon”.
2) Telemedicina és elérhetőség: költség = hozzáférés
A sűrĂtĂ©s itt egyenesen hozzáfĂ©rĂ©si kĂ©rdĂ©s. Ha egy telemedicinás szolgáltatás 10Ă— olcsĂłbban futtathatĂł (a kutatás „nagyságrendi” csökkenĂ©st sugall a desztilláciĂłval), akkor:
- több konzultáció fér bele ugyanabba a költségkeretbe,
- kisebb intézmények is belevághatnak,
- és reálisabb a 24/7 támogatás.
A valós nyereség az, hogy a rendszer nem „spórolós” lesz, hanem fenntartható.
3) Adatminimalizálás és auditálhatóság
Az egĂ©szsĂ©gĂĽgyben a kontextus nemcsak technikai kĂ©rdĂ©s, hanem megfelelĂ©s Ă©s felelĹ‘ssĂ©g is. Egy plan-tudatos tömörĂtĂ©s elĹ‘nye lehet, hogy:
- kevesebb személyes adat kerül feleslegesen a promptba,
- könnyebb megindokolni, miért volt szükség egy adott információra,
- jobban auditálható, mit „látott” a rendszer egy döntésnél.
Miért érdekes ez a kiskereskedelemben és e-kereskedelemben is?
Ez a cikk a „Mesterséges intelligencia a kiskereskedelemben és e-kereskedelemben” sorozatba illeszkedik, mert ugyanaz a minta ismétlődik: sok adat + több lépéses döntés + költségérzékeny működés.
1) Személyre szabott ajánlások több lépésben
Egy modern ajánlórendszer agent-szerűen gondolkodik:
- értelmezi a felhasználói szándékot,
- figyelembe veszi a készletet,
- ellenőrzi a promókat,
- optimalizálja a kosárértéket,
- és közben A/B logikához igazodik.
Ha mindehhez minden korábbi eseményt és minden termékjellemzőt betolunk, hamar szétesik a fókusz. A plan-tudatos kontextuskezelés itt azt jelenti:
- a következĹ‘ 1–2 döntĂ©si lĂ©pĂ©shez tartjuk kĂ©znĂ©l a legfontosabb jeleket (pl. aktuális böngĂ©szĂ©s + kĂ©szlet + szállĂtási ĂgĂ©retek),
- a rĂ©gi, alacsony relevanciájĂş adatokat pedig funkciĂłmegĹ‘rzĹ‘ mĂłdon tömörĂtjĂĽk.
2) Kereslet-előrejelzés és készletkezelés: kevesebb zaj, jobb jel
Kereslet-előrejelzésnél nem ritka, hogy a rendszer egyszerre próbálja kezelni:
- szezonhatásokat (decemberi csúcs, év végi készletkisöprés),
- kampányokat,
- ár- és versenytárs adatokat,
- ellátási lánc késéseket.
A PAACE-szerű gondolkodás haszna: nem mindent kell mindig egyszerre optimalizálni. A következő lépés (pl. „rendelési mennyiség jövő hétre”) szempontjából releváns tényezők kerülnek előtérbe.
3) Ügyfélszolgálati agentek: rövidebb kontextus, kevesebb téves válasz
Az ügyfélszolgálatban a „túl hosszú kontextus” klasszikus hiba: a bot összekeveri a rendeléseket, félreérti a visszaküldési időablakot, vagy régi információt vesz alapul.
A plan-tudatos sűrĂtĂ©s itt kifejezetten azt szolgálja, hogy a bot:
- a következĹ‘ teendĹ‘t (azonosĂtás → státusz → megoldási opciĂłk → jĂłváhagyás) tartsa fĂłkuszban,
- Ă©s a rĂ©gi mellĂ©kszálakat visszacsomagolja egy rövid, megbĂzhatĂł állapotleĂrásba.
Hogyan kezdd el: gyakorlati lépések plan-tudatos kontextusmérnökséghez
A PAACE egy kutatási keretrendszer, de a szemlĂ©lete azonnal alkalmazhatĂł. Ha AI agenteket Ă©pĂtesz egĂ©szsĂ©gĂĽgyi vagy kereskedelmi környezetben, ezt a 6 lĂ©pĂ©st tartom a leghasznosabbnak:
- ĂŤrd le explicit mĂłdon a tervet (plan): ne csak prompt legyen, hanem lĂ©pĂ©ssor. PĂ©ldául: „azonosĂtás → adatellenĹ‘rzĂ©s → döntĂ©si pont → akciĂł → naplĂłzás”.
- Határozd meg a next-k lépéseket: tipikusan
k=2–3elĂ©g. EnnĂ©l többnĂ©l visszajön a zaj. - CĂmkĂ©zd a kontextust funkciĂł szerint: „bizonyĂtĂ©k”, „döntĂ©si indok”, „felhasználĂłi preferencia”, „szabály/irányelv”, „eszközválasz”.
- Vezess be két szintű memóriát:
- munkamemória (rövid, aktuális),
- archĂv (hosszabb, visszakereshetĹ‘, de nem mindig promptban).
- Mérj három dolgot minden release-nél:
- csĂşcstoken (peak context),
- lépésszám,
- hibaarány a kritikus pontokon (pl. rossz termĂ©k, rossz betegazonosĂtás, rossz visszatĂ©rĂtĂ©s).
- Desztillálj, amikor stabil a folyamat: ha már tudod, mi a „jó” tanári viselkedĂ©s, Ă©rdemes kisebb kompresszor modellt tanĂtani. A PAACE-FT iránya erre pĂ©lda.
Egy mondatban: elĹ‘bb legyen jĂłl megtervezett a munkafolyamat, Ă©s csak utána tömörĂts agresszĂven.
Mit érdemes hazavinni ebből 2025 végén?
A PAACE ĂĽzenete számomra nagyon praktikus: a kontextuskezelĂ©s nem kozmetika, hanem teljesĂtmĂ©ny Ă©s költsĂ©g kĂ©rdĂ©se. Ha plan-tudatosan sűrĂtesz, akkor egyszerre kapsz:
- pontosabb ügynöki döntéseket,
- alacsonyabb futtatási költséget,
- és stabilabb, auditálhatóbb működést.
A kiskereskedelmi és e-kereskedelmi projektekben (személyre szabott ajánlások, kereslet-előrejelzés, készletkezelés, ügyfélszolgálati automatizálás) ez ugyanúgy aranyat ér, mint az egészségügyben (diagnosztikai workflow, telemedicina, triázs). A közös nevező: többlépcsős folyamatoknál a „mindent bele” kontextus stratégia rossz kompromisszum.
Ha most Ă©pĂtesz vagy skálázol agent-rendszert, egyetlen kĂ©rdĂ©st tennĂ©k a csapat elĂ© a következĹ‘ sprinten: a következĹ‘ 2 lĂ©pĂ©shez mi az a 10 mondatnyi informáciĂł, ami tĂ©nyleg számĂt – Ă©s mi az, amit csak azĂ©rt Ĺ‘rzĂĽnk, mert fĂ©lĂĽnk elengedni?