AI modellmĂ©ret folyamatos tanulásnál: mikor elĂ©g? Gyakorlati keret e-kereskedelmi Ă©s egĂ©szsĂ©gĂĽgyi pĂ©ldákkal, költsĂ©g–teljesĂtmĂ©ny fĂłkuszban.

AI-modellméret folyamatos tanulásnál: mennyi elég?
Egy AI-projektet nem az szokott megakasztani, hogy „nem elĂ©g okos” a modell, hanem az, hogy tĂşl drága fenntartani. A karácsonyi szezon utáni kĂ©szletkisöprĂ©snĂ©l pĂ©ldául naponta változik a kereslet, az árĂ©rzĂ©kenysĂ©g, a visszakĂĽldĂ©si arány – a modellnek pedig lĂ©pĂ©st kell tartania. Csakhogy ha a modellt tĂşl nagyra Ă©pĂted, a felhĹ‘költsĂ©g Ă©s a válaszidĹ‘ elszáll. Ha tĂşl kicsire, romlik az ajánlĂłrendszer, nĹ‘ a kĂ©szlethiány, csökken a kosárĂ©rtĂ©k.
Pont errĹ‘l szĂłl egy friss, 2025 vĂ©gĂ©n vĂ©glegesĂtett kutatás: folyamatos (continual) tanulásban hogyan állĂtsuk be a Gaussian process (GP) modell „mĂ©retĂ©t” Ăşgy, hogy ne pazaroljunk erĹ‘forrást, de a teljesĂtmĂ©ny közel optimális maradjon. A tanulság nem csak statisztika-rajongĂłknak Ă©rdekes. A kereskedelemben Ă©s az egĂ©szsĂ©gĂĽgyben ugyanaz a problĂ©ma: az adatok folyamatosan Ă©rkeznek, a vĂ©gsĹ‘ adatmennyisĂ©get elĹ‘re nem tudod, mĂ©gis stabil, gyors Ă©s megbĂzhatĂł rendszert kell ĂĽzemeltetni.
A posztban megmutatom, mit érdemes ebből a gondolatból átvenni a kiskereskedelmi és e-kereskedelmi AI (személyre szabott ajánlások, kereslet-előrejelzés, készletkezelés) világába, és miért fontos ugyanez a szemlélet az egészségügyi AI-ban (diagnosztika, telemedicina, kockázatbecslés) is.
A válasz röviden: nem fix modellméret kell, hanem „növekvő”
A kulcsgondolat egyszerű: a modellmĂ©retet nem Ă©rdemes elĹ‘re fixálni, mert folyamatos tanulásnál nem tudod, mekkora lesz a vĂ©gsĹ‘ adathalmaz. Ehelyett olyan megközelĂtĂ©s kell, ami automatikusan igazĂtja a kapacitást az Ăşj adatokhoz, Ă©s csak addig nĹ‘, amĂg az tĂ©nyleg hoz mĂ©rhetĹ‘ teljesĂtmĂ©nynyeresĂ©get.
A hivatkozott kutatás ezt a problĂ©mát Gaussian process modellekben vizsgálja. A GP-ket lehet Ăşgy tekinteni, mint olyan valĂłszĂnűsĂ©gi modelleket, amelyek nem csak jĂłsolnak, hanem bizonytalanságot is adnak. Ez a bizonytalanság a gyakorlatban aranyat Ă©r:
- e-kereskedelemben: mikor merj agresszĂvan árazni, Ă©s mikor „tĂşl kockázatos” az elĹ‘rejelzĂ©s?
- egĂ©szsĂ©gĂĽgyben: mikor bĂzhatĂł egy triázs- vagy diagnosztikai javaslat, Ă©s mikor kell emberi felĂĽlvizsgálat?
A GP-k tipikus „mĂ©retparamĂ©tere” a ritkĂtott (sparse) változatoknál az indukciĂłs pontok száma. MinĂ©l több van belĹ‘lĂĽk, annál nagyobb a kapacitás Ă©s a számĂtási költsĂ©g is. A kĂ©rdĂ©s: mikor elĂ©g?
Miért fáj a modellméret kérdése a kereskedelemben (és miért ugyanaz az egészségügyben)?
A válasz: mert a kereskedelemben a „túl nagy” modell nem csak drága, hanem üzletileg veszélyes.
E-kereskedelmi példa: ajánlórendszer csúcsforgalomban
Decemberben egy ajánlórendszer tipikusan több csatornán fut: web, app, e-mail, push. Ha a modell:
- túl nagy: nő a késleltetés (latency), romlik a felhasználói élmény, drágul az infrastruktúra.
- túl kicsi: csökken a relevancia, romlik a CTR, nő az irreleváns ajánlások miatti lemorzsolódás.
Ráadásul a folyamatos tanulás itt nem extra, hanem alap: új termékek jönnek, trendek mennek, visszaküldések mintázata változik, készlet fogy.
Egészségügyi párhuzam: telemedicina és folyamatosan változó populáció
Ugyanez a helyzet a telemedicinában vagy a kórházi döntéstámogatásban:
- Ăşj protokollok,
- szezonális betegséghullámok (influenza, RSV),
- intézményenként eltérő betegpopuláció,
- folyamatos adatbeáramlás.
Itt a „túl nagy modell” nem csak költség, hanem üzemeltetési kockázat (lassú válasz, nehéz validálás), a „túl kicsi” pedig szakmai kockázat (gyengébb predikció, rosszabb kalibráció).
Snippet-mondat: A jó modellméret nem „minél nagyobb”, hanem „pont akkora, amennyi az adatok információtartalmának kinyeréséhez kell”.
Mit ad a Gaussian process szemlélet a folyamatos tanuláshoz?
A fĹ‘ elĹ‘ny: a GP-k termĂ©szetĂĽknĂ©l fogva bizonytalanság-tudatos modellek. A bizonytalanság nem dĂsznek van, hanem döntĂ©shez.
1) Bizonytalanság = üzleti kontroll
E-kereskedelmi példák:
- Készletgazdálkodás: ha az előrejelzés bizonytalan, érdemes biztonsági készletet növelni bizonyos SKU-knál.
- Dinamikus árazás: magas bizonytalanságnál korlátozod az árváltoztatás lépésközét.
- Marketing költés: bizonytalan szegmenseknél kisebb licit/CPA plafont használsz.
Egészségügy:
- a bizonytalan esetek automatikusan „emberhez kerülnek”,
- csökken a tévesen magabiztos automatizmusok aránya,
- jobban kommunikálható a modell kockázata.
2) Folyamatos tanulásnál a „végső adatmennyiség” ismeretlen
A kutatás egyik fontos gyakorlati feltétele: a hiperparamétereket úgy kell megadni, hogy közben nem „leshetsz bele” az adathalmaz tulajdonságaiba (például végső méret, zajszint, variancia). Ez kifejezetten életszagú: éles rendszernél nem akarsz minden új adatfázisnál kézzel újrahangolni.
A tanulság kereskedelemben: ha olyan módszert választasz, ami csak akkor működik, ha előre tudod a forgalom volumenét vagy a szezonális kilengések mértékét, akkor a rendszered a legrosszabb pillanatban fog szétesni (például akciók, ünnepek, kampánycsúcsok).
Gyakorlati keretrendszer: mikor érdemes növelni a modellméretet?
A legjobb működő kompromisszum az, ha a modellméret növelése szabályhoz kötött, és az a szabály egyértelműen mér egy „nyereség vs. költség” arányt.
A döntési logika (üzletileg értelmezhető)
Nekem az vált be, hogy a bĹ‘vĂtĂ©srĹ‘l nem absztrakt metrikák alapján döntĂĽnk, hanem ilyen kĂ©rdĂ©sekre válaszolunk:
- Csökkent-e mérhetően a hiba? (pl. MAPE kereslet-előrejelzésnél, logloss ajánlásnál)
- Javult-e a kalibráció? (a bizonytalanság tényleg együtt mozog-e a tévedésekkel)
- Megéri-e a késleltetés / költség növekedése? (ms, CPU/GPU, memória)
Ha ezek közĂĽl kettĹ‘ nem javul, a modell bĹ‘vĂtĂ©se általában pazarlás.
Mit jelent ez GP-k nyelvén?
A ritkĂtott GP-kben a kapacitás gyakran az indukciĂłs pontok számával nĹ‘. A kutatás lĂ©nyege, hogy ezt a kapacitást folyamatos tanulás közben lehet Ăşgy bĹ‘vĂteni, hogy:
- a teljesĂtmĂ©ny közel optimális marad,
- közben nem kell minden datasethez külön hangolni,
- és a módszer többféle adaton stabilan működik.
A kereskedelmi analógia: ne fixen döntsd el, hogy „legyen 200 rejtett egység” vagy „legyen 10 millió paraméter”, hanem legyen egy folyamat, ami akkor növel, ha az tényleg hoz extra értéket.
Konkrét felhasználások a kiskereskedelemben és e-kereskedelemben
1) Kereslet-elĹ‘rejelzĂ©s több idĹ‘sĂkon
A GP-k erősek idősoros problémákban, főleg ha:
- több szezonalitás van (heti, havi, ünnepi),
- sok a hiányzó adat,
- és kell a bizonytalanság.
Folyamatos tanulásnál a modellmĂ©ret-igazĂtás azĂ©rt kritikus, mert a termĂ©kportfĂłliĂł sem fix: Ăşj SKU-k indulnak, rĂ©giek kifutnak.
AkciĂłtipp: vezess be olyan riasztást, ami akkor indĂt modellbĹ‘vĂtĂ©si kĂsĂ©rletet, ha a top SKU-k 20%-ánál a hibametrika 2 egymást követĹ‘ hĂ©ten romlik, miközben a bemeneti adatok minĹ‘sĂ©ge nem romlott (pl. nincs tracking kiesĂ©s).
2) SzemĂ©lyre szabott ajánlások (online frissĂtĂ©ssel)
Az ajánlĂłrendszerek egyik nagy baja a „hideg start” Ă©s a gyors trendváltás. GP-alapĂş vagy GP-szerű (bizonytalanságot modellezĹ‘) megoldásoknál a modellmĂ©ret dinamikus növelĂ©se segĂt, hogy:
- új felhasználói minták beépüljenek,
- de ne nőjön kontroll nélkül a futási költség.
Praktikus szabály: ha a modell bizonytalansága tartósan magas bizonyos kategóriákban (pl. új márkák), akkor érdemes célzottan ott növelni a kapacitást, nem globálisan.
3) Készletkezelés és visszaküldés-előrejelzés
A visszaküldések karácsony után külön „sportág”. Ha a modell folyamatosan tanul, a januári mintákból gyorsan profitálhatsz – de csak akkor, ha nem kötötted magad egy rosszul belőtt modellmérethez.
Itt a bizonytalanság is döntési tényező:
- magas bizonytalanság + magas várható visszaküldés → óvatosabb beszerzés
- alacsony bizonytalanság + stabil kereslet → agresszĂvebb kĂ©szletszint
„People also ask” – gyors válaszok a tipikus kérdésekre
GP-t vagy neurális hálót érdemes választani e-kereskedelemben?
Ha a cĂ©l bizonytalanság-alapĂş döntĂ©s Ă©s a stabil online frissĂtĂ©s, a GP-szemlĂ©let sokat ad. Ha Ăłriási skálán, nagyon heterogĂ©n jelekkel dolgozol (kĂ©p, szöveg, viselkedĂ©s), a DNN erĹ‘sebb lehet. A gyakorlatban a hibrid megoldás a nyerĹ‘: DNN a reprezentáciĂłra, GP-szerű fej a bizonytalanságra.
MiĂ©rt ne állĂtsuk fixre a modellmĂ©retet?
Mert folyamatos tanulásnál a vĂ©gsĹ‘ adatmennyisĂ©g Ă©s az informáciĂłtartalom nem ismert elĹ‘re. Fix modellmĂ©ret mellett vagy pazarlásba futsz (tĂşl nagy), vagy teljesĂtmĂ©nyromlásba (tĂşl kicsi).
MitĹ‘l lesz „near-optimal” a teljesĂtmĂ©ny?
AttĂłl, hogy a rendszer a kapacitást csak akkor növeli, amikor az Ăşj adatokbĂłl mĂ©g tĂ©nyleg kinyerhetĹ‘ extra jel, Ă©s nem csak a számĂtási költsĂ©get növeli.
Mit érdemes holnap bevezetni a saját AI-rendszeredben?
Három, gyorsan megvalĂłsĂthatĂł lĂ©pĂ©s:
- Tedd mérhetővé a „méret-költség” görbét: logold a modellváltozatok latency-jét, költségét és minőségét ugyanazon forgalmi szeleteken.
- Vezess be bĹ‘vĂtĂ©si kĂĽszöböt: ne „érzĂ©sre” növelj, hanem elĹ‘re definiált romlási feltĂ©telekre (hiba + kalibráciĂł + ĂĽzleti KPI).
- Kezeld a bizonytalanságot elsĹ‘ osztályĂş jelkĂ©nt: ha a modell nem tudja, az is informáciĂł. ÉpĂts rá fallbacket (szabályalapĂş ajánlás, Ăłvatos árazás, emberi review).
Amiért ezt szeretem: nem csak technikai, hanem üzemeltetési fegyelem. A modellméret-automatikázás valójában arról szól, hogy ne a legdrágább megoldást használd, hanem a leginkább indokoltat.
A sorozatunkban ("Mesterséges intelligencia a kiskereskedelemben és e-kereskedelemben") gyakran beszélünk ajánlásról, kereslet-előrejelzésről és készletkezelésről. Ez a téma mindegyikhez hozzátesz egy fontos szűrőt: a skálázás nem paraméterszám-verseny, hanem kontrollált kapacitásmenedzsment.
Ha most indĂtanál vagy ĂşjraĂ©pĂtenĂ©l egy AI-rendszert, te hol fĂ©lsz jobban: a „tĂşl nagy Ă©s drága” modelltĹ‘l, vagy a „tĂşl kicsi Ă©s pontatlan” modelltĹ‘l?