Plan-tudatos AI: kisebb kontextus, pontosabb döntés

Mesterséges intelligencia a kiskereskedelemben és e-kereskedelemben••By 3L3C

Plan-tudatos kontextusmérnökség AI agentekhez: jobb pontosság kevesebb tokenből. Egészségügyi és e-kereskedelmi példákkal, lépésekkel.

LLM agentekkontextus tömörítésegészségügyi AItelemedicinae-kereskedelem automatizáláskészletoptimalizálás
Share:

Featured image for Plan-tudatos AI: kisebb kontextus, pontosabb döntés

Plan-tudatos AI: kisebb kontextus, pontosabb döntés

2025 végére egy furcsa jelenség lett mindennapos az AI-projektekben: nem az algoritmusok „buták”, hanem a kontextus túl kövér. A több lépéses ügynökök (agentek) – amelyek terveznek, eszközöket hívnak, jegyzetelnek, majd újraterveznek – pillanatok alatt több ezer, akár több tízezer tokennyi „munkamemóriát” gyártanak. A végeredmény gyakran csalódást keltő: drágább futás, lassabb válasz, és néha még rosszabb döntés is.

A PAACE (Plan-Aware Automated Context Engineering) című friss kutatás pont ezt a fájdalmat célozza: hogyan lehet az ügynökök folyamatosan növekvő kontextusát úgy sűríteni, hogy közben ne vesszen el a lényeg. Ami engem igazán megfogott benne, az nem a „szebb összefoglaló”, hanem a szemlélet: a kontextust nem egyben kell tömöríteni, hanem a terv (plan) következő lépései szerint kell rendben tartani.

És itt jön a csavar: miközben ez a munka a számítógépes ügynökök világából jön, nagyon jól fordítható egészségügyi és kiskereskedelmi/e-kereskedelmi folyamatokra is – pont oda, ahol sok adat, sok lépés és sok felelősség találkozik.

Miért fáj a „túl nagy kontextus” az ügynököknek?

A lényeg röviden: minél hosszabb a kontextus, annál drágább és zajosabb a gondolkodás.

Három tipikus probléma, amit a gyakorlatban látni

  1. Figyelemhígulás (attention dilution): az LLM figyelme szétszóródik. Fontos részletek „elcsúsznak” a kevésbé fontos logok, chatdarabok, eszköz-válaszok között.
  2. Költség és késleltetés: a hosszú prompt több időt és pénzt visz el. Ez telemedicinában, ügyfélszolgálatban vagy valós idejű készletkezelésnél nem „kényelmetlenség”, hanem üzleti kockázat.
  3. Törékeny több lépéses logika: egy agent nem egyszer válaszol, hanem munkafolyamatot futtat. Ha az út közben rosszul sűrítünk, a későbbi lépések félrecsúszhatnak.

A kutatási absztraktból az derül ki, hogy a korábbi megközelítések (összefoglalás, query-aware tömörítés) sokszor nem veszik komolyan az ügynöki tervezést. Pedig egy több lépéses folyamatban nem mindegy, hogy a következő 1–3 feladat szempontjából mi releváns.

„A kontextus nem archívum. A kontextus egy munkalap.” Ha mindent őrzünk, a munkalap használhatatlan lesz.

Mit csinál másként a PAACE? A „plan-aware” megközelítés lényege

A PAACE központi állítása: a kontextuskezelést a terv struktúrájához kell igazítani. Vagyis ne egy általános kivonatot készítsünk, hanem olyan reprezentációt, ami a következő lépésekhez tartja kéznél a kritikus információt.

A keretrendszer négy pillért emel ki (a cikk összefoglalója alapján):

  • Next-k-task relevancia modellezĂ©s: a sűrĂ­tĂ©s cĂ©lja nem az, hogy „szĂ©p rövid” legyen, hanem hogy a következĹ‘ k feladathoz legyen optimális.
  • TervstruktĂşra-elemzĂ©s: a rendszer a plan szerkezetĂ©bĹ‘l prĂłbálja megĂ©rteni, mi a fĂĽggĹ‘sĂ©g, mi a mellĂ©kszál.
  • InstrukciĂłk egyĂĽtt-finomszabályozása (instruction co-refinement): a feladatleĂ­rás Ă©s a kontextus egyĂĽtt formálĂłdik, hogy egyĂ©rtelmű legyen, mi a következĹ‘ teendĹ‘.
  • FunkciĂłmegĹ‘rzĹ‘ tömörĂ­tĂ©s: a cĂ©l nem az informáciĂł „szĂ©psĂ©ge”, hanem a működĹ‘kĂ©pessĂ©g megĹ‘rzĂ©se (a kĂ©sĹ‘bbi lĂ©pĂ©sek helyesek maradjanak).

Két komponens: PAACE-Syn és PAACE-FT

A kutatás két építőelemet nevez meg:

  • PAACE-Syn: szintetikus ĂĽgynöki munkafolyamatok nagy lĂ©ptĂ©kű generátora, lĂ©pĂ©senkĂ©nt annotált tömörĂ­tĂ©si felĂĽgyelettel.
  • PAACE-FT: desztillált, plan-tudatos „kompresszor” modellek családja, amelyek sikeres tanár-demĂłkbĂłl tanulnak.

Az eredmények (benchmarkokon) azért izgalmasak, mert nemcsak tokeneket spórolnak:

  • AppWorld-ben jobb pontosság a baseline-okhoz kĂ©pest, miközben alacsonyabb a csĂşcskontextus Ă©s a kumulatĂ­v fĂĽggĹ‘sĂ©g.
  • OfficeBench Ă©s multi-hop QA esetĂ©n jobb accuracy Ă©s F1, kevesebb lĂ©pĂ©s, kevesebb csĂşcstoken, kisebb attention-fĂĽggĹ‘sĂ©g.
  • A desztillált PAACE-FT a leĂ­rás szerint a tanár teljesĂ­tmĂ©nyĂ©nek 97%-át tartja meg, miközben több mint nagyságrendi (10Ă—+) költsĂ©gcsökkenĂ©st hoz.

Ez a 97% azért fontos, mert a valós életben a legtöbb szervezet nem engedheti meg magának a „mindig a legnagyobb modell, mindig a leghosszabb kontextus” stratégiát.

Mit jelent ez az egész az egészségügyben? (És mi köze van a költségekhez)

A plan-tudatos kontextusmérnökség az egészségügyben nem elméleti játék. A klinikai döntéstámogatás, a triázs, a radiológiai leletezés vagy a betegút-szervezés mind több lépéses, sokforrású folyamat.

1) Diagnosztikai munkafolyamatok: „következő lépés relevancia” a gyakorlatban

Egy tipikus forgatókönyv:

  • tĂĽnetek + anamnĂ©zis
  • laboredmĂ©nyek
  • kĂ©palkotĂł (CT/MR)
  • korábbi epizĂłdok
  • gyĂłgyszerlista
  • irányelv/rendelkezĂ©s

A gond nem az, hogy ezek ne lennének fontosak, hanem hogy nem egyszerre fontosak. Egy plan-tudatos megközelítés azt mondja:

  • Ha a következĹ‘ lĂ©pĂ©s a gyĂłgyszer-interakciĂł ellenĹ‘rzĂ©s, akkor a friss labort Ă©s a gyĂłgyszerlistát tartsd fĂłkuszban.
  • Ha a következĹ‘ lĂ©pĂ©s a kĂ©palkotĂł Ă©rtelmezĂ©s, akkor a releváns klinikai kĂ©rdĂ©s + elĹ‘zmĂ©ny + radiolĂłgiai megfigyelĂ©sek legyenek elöl, ne a teljes chatnaplĂł.

Ez nemcsak gyorsít. Csökkenti annak esélyét is, hogy a modell irreleváns részletekbe kapaszkodva „félrediagnosztizáljon”.

2) Telemedicina és elérhetőség: költség = hozzáférés

A sűrítés itt egyenesen hozzáférési kérdés. Ha egy telemedicinás szolgáltatás 10× olcsóbban futtatható (a kutatás „nagyságrendi” csökkenést sugall a desztillációval), akkor:

  • több konzultáciĂł fĂ©r bele ugyanabba a költsĂ©gkeretbe,
  • kisebb intĂ©zmĂ©nyek is belevághatnak,
  • Ă©s reálisabb a 24/7 támogatás.

A valós nyereség az, hogy a rendszer nem „spórolós” lesz, hanem fenntartható.

3) Adatminimalizálás és auditálhatóság

Az egészségügyben a kontextus nemcsak technikai kérdés, hanem megfelelés és felelősség is. Egy plan-tudatos tömörítés előnye lehet, hogy:

  • kevesebb szemĂ©lyes adat kerĂĽl feleslegesen a promptba,
  • könnyebb megindokolni, miĂ©rt volt szĂĽksĂ©g egy adott informáciĂłra,
  • jobban auditálhatĂł, mit „látott” a rendszer egy döntĂ©snĂ©l.

Miért érdekes ez a kiskereskedelemben és e-kereskedelemben is?

Ez a cikk a „Mesterséges intelligencia a kiskereskedelemben és e-kereskedelemben” sorozatba illeszkedik, mert ugyanaz a minta ismétlődik: sok adat + több lépéses döntés + költségérzékeny működés.

1) Személyre szabott ajánlások több lépésben

Egy modern ajánlórendszer agent-szerűen gondolkodik:

  • Ă©rtelmezi a felhasználĂłi szándĂ©kot,
  • figyelembe veszi a kĂ©szletet,
  • ellenĹ‘rzi a promĂłkat,
  • optimalizálja a kosárĂ©rtĂ©ket,
  • Ă©s közben A/B logikához igazodik.

Ha mindehhez minden korábbi eseményt és minden termékjellemzőt betolunk, hamar szétesik a fókusz. A plan-tudatos kontextuskezelés itt azt jelenti:

  • a következĹ‘ 1–2 döntĂ©si lĂ©pĂ©shez tartjuk kĂ©znĂ©l a legfontosabb jeleket (pl. aktuális böngĂ©szĂ©s + kĂ©szlet + szállĂ­tási Ă­gĂ©retek),
  • a rĂ©gi, alacsony relevanciájĂş adatokat pedig funkciĂłmegĹ‘rzĹ‘ mĂłdon tömörĂ­tjĂĽk.

2) Kereslet-előrejelzés és készletkezelés: kevesebb zaj, jobb jel

Kereslet-előrejelzésnél nem ritka, hogy a rendszer egyszerre próbálja kezelni:

  • szezonhatásokat (decemberi csĂşcs, Ă©v vĂ©gi kĂ©szletkisöprĂ©s),
  • kampányokat,
  • ár- Ă©s versenytárs adatokat,
  • ellátási lánc kĂ©sĂ©seket.

A PAACE-szerű gondolkodás haszna: nem mindent kell mindig egyszerre optimalizálni. A következő lépés (pl. „rendelési mennyiség jövő hétre”) szempontjából releváns tényezők kerülnek előtérbe.

3) Ügyfélszolgálati agentek: rövidebb kontextus, kevesebb téves válasz

Az ügyfélszolgálatban a „túl hosszú kontextus” klasszikus hiba: a bot összekeveri a rendeléseket, félreérti a visszaküldési időablakot, vagy régi információt vesz alapul.

A plan-tudatos sűrítés itt kifejezetten azt szolgálja, hogy a bot:

  • a következĹ‘ teendĹ‘t (azonosĂ­tás → státusz → megoldási opciĂłk → jĂłváhagyás) tartsa fĂłkuszban,
  • Ă©s a rĂ©gi mellĂ©kszálakat visszacsomagolja egy rövid, megbĂ­zhatĂł állapotleĂ­rásba.

Hogyan kezdd el: gyakorlati lépések plan-tudatos kontextusmérnökséghez

A PAACE egy kutatási keretrendszer, de a szemlélete azonnal alkalmazható. Ha AI agenteket építesz egészségügyi vagy kereskedelmi környezetben, ezt a 6 lépést tartom a leghasznosabbnak:

  1. Írd le explicit módon a tervet (plan): ne csak prompt legyen, hanem lépéssor. Például: „azonosítás → adatellenőrzés → döntési pont → akció → naplózás”.
  2. Határozd meg a next-k lépéseket: tipikusan k=2–3 elég. Ennél többnél visszajön a zaj.
  3. Címkézd a kontextust funkció szerint: „bizonyíték”, „döntési indok”, „felhasználói preferencia”, „szabály/irányelv”, „eszközválasz”.
  4. Vezess be két szintű memóriát:
    • munkamemĂłria (rövid, aktuális),
    • archĂ­v (hosszabb, visszakereshetĹ‘, de nem mindig promptban).
  5. Mérj három dolgot minden release-nél:
    • csĂşcstoken (peak context),
    • lĂ©pĂ©sszám,
    • hibaarány a kritikus pontokon (pl. rossz termĂ©k, rossz betegazonosĂ­tás, rossz visszatĂ©rĂ­tĂ©s).
  6. Desztillálj, amikor stabil a folyamat: ha már tudod, mi a „jó” tanári viselkedés, érdemes kisebb kompresszor modellt tanítani. A PAACE-FT iránya erre példa.

Egy mondatban: előbb legyen jól megtervezett a munkafolyamat, és csak utána tömöríts agresszíven.

Mit érdemes hazavinni ebből 2025 végén?

A PAACE üzenete számomra nagyon praktikus: a kontextuskezelés nem kozmetika, hanem teljesítmény és költség kérdése. Ha plan-tudatosan sűrítesz, akkor egyszerre kapsz:

  • pontosabb ĂĽgynöki döntĂ©seket,
  • alacsonyabb futtatási költsĂ©get,
  • Ă©s stabilabb, auditálhatĂłbb működĂ©st.

A kiskereskedelmi és e-kereskedelmi projektekben (személyre szabott ajánlások, kereslet-előrejelzés, készletkezelés, ügyfélszolgálati automatizálás) ez ugyanúgy aranyat ér, mint az egészségügyben (diagnosztikai workflow, telemedicina, triázs). A közös nevező: többlépcsős folyamatoknál a „mindent bele” kontextus stratégia rossz kompromisszum.

Ha most építesz vagy skálázol agent-rendszert, egyetlen kérdést tennék a csapat elé a következő sprinten: a következő 2 lépéshez mi az a 10 mondatnyi információ, ami tényleg számít – és mi az, amit csak azért őrzünk, mert félünk elengedni?