Adat nĂ©lkĂĽli folyamatos tanulás heterogĂ©n eszközökön: Ăgy frissĂĽlhet az AI felhĹ‘ben nyers adatok nĂ©lkĂĽl. Gyakorlati pĂ©ldákkal retailre Ă©s egĂ©szsĂ©gĂĽgyre.

Adat nélküli folyamatos tanulás: AI a felhő és eszközök között
A legtöbb cĂ©g ott rontja el a federált tanulást, hogy Ăşgy kezeli, mintha minden rĂ©sztvevĹ‘ ugyanazzal a modellel, ugyanolyan adatokkal Ă©s ugyanazzal a tempĂłval dolgozna. A valĂłság meg pont az ellenkezĹ‘je: a kĂłrházak, rendelĹ‘k, raktárak, ĂĽzletek Ă©s mobilos alkalmazások kĂĽlönbözĹ‘ eszközparkon, kĂĽlönbözĹ‘ adatmintázatokkal Ă©s kĂĽlönbözĹ‘ frissĂtĂ©si ciklusokkal futnak. Ez nem esztĂ©tikai problĂ©ma, hanem teljesĂtmĂ©ny- Ă©s kockázati kĂ©rdĂ©s.
A 2025 végén publikált FedDCL kutatás (adat nélküli, folyamatos tanulás a felhő–eszköz együttműködésben) azért érdekes, mert egy kényes pontot céloz: hogyan tud a szerveroldali (felhős) „központi” modell úgy fejlődni új feladatokkal és új eszközökkel, hogy közben nem kér nyers adatot, és mégsem felejt el mindent, amit korábban megtanult.
És itt jön a csavar: bár a kampányunk fĂłkusza az AI az egĂ©szsĂ©gĂĽgyben, ezt a megközelĂtĂ©st Ă©rdemes a „MestersĂ©ges intelligencia a kiskereskedelemben Ă©s e‑kereskedelemben” sorozatban is tárgyalni, mert a logika ugyanaz. A diagnosztikai modellek Ă©s a kereslet-elĹ‘rejelzĹ‘ rendszerek egyaránt folyamatosan változĂł, heterogĂ©n világban Ă©lnek.
Miért fáj ennyire a „heterogén” federált tanulás?
A rövid, egyenes válasz: mert a heterogenitás három kĂĽlön problĂ©mát egyszerre hoz be, Ă©s ezek egymást erĹ‘sĂtik.
1) Nem-IID adatok: mindenhol más a valóság
Federált tanulásnál az adatok az eszközöknél maradnak (pl. kórházi telephelyeknél, rendelői rendszereknél, pénztárgépeknél, bolti kameráknál). Csakhogy az adat eloszlása nem azonos (non-IID):
- Egy vidéki szakrendelőben más betegpopuláció jelenik meg, mint egy budapesti centrumkórházban.
- Egy belvárosi kisboltban más a kosárösszetétel, mint egy agglomerációs hipermarketben.
Ez a szerveroldali aggregációt instabillá teszi: a modell „rááll” pár domináns mintára, és gyengül ott, ahol a valóság ritkább vagy speciális.
2) Modellheterogenitás: nem minden eszköz bĂrja ugyanazt
A kutatás kulcsállĂtása: a gyakorlatban nem reális elvárni, hogy minden kliens ugyanazt a neurális hálĂłt futtassa.
- Klinikai környezetben lehet modern GPU-s szerver, de lehet régi PACS-integráció vagy hordozható ultrahang eszköz.
- Kiskereskedelemben lehet erős edge box a kamerákhoz, de lehet olcsó IoT-szenzor vagy mobilalkalmazás.
Ilyenkor jön a modellheterogenitás: eltérő architektúrák, paraméterszámok, kimeneti rétegek. A „klasszikus” FL ezt rosszul viseli.
3) Katasztrofális felejtés: ami új, letolja a régit
A folyamatos tanulásnál (continual learning) a modell Ăşj feladatokat kap idĹ‘ben egymás után. Ha nincs jĂł memĂłria-mechanizmus, az Ăşj tanulás felĂĽlĂrja a rĂ©git.
Az egĂ©szsĂ©gĂĽgyben ez konkrĂ©t kockázat: egy Ăşj protokoll vagy Ăşj eszközadat miatt romolhat a teljesĂtmĂ©ny rĂ©gebbi, de mĂ©g mindig releváns alcsoportokon.
Egy mondatban: heterogĂ©n eszközök + eltĂ©rĹ‘ adatok + folyamatos frissĂtĂ©s = nagy esĂ©llyel szĂ©tesĹ‘ minĹ‘sĂ©g.
Mit ad hozzá a FedDCL: „adat nélküli” folyamatos tanulás a szerveren
A lĂ©nyeg: a FedDCL keretrendszer a szerveroldali modellt Ăşgy frissĂti, hogy közben nem támaszkodik a klienseszközök nyers adataira, Ă©s mĂ©gis kĂ©pes:
- Szintetikus adatot generálni az aktuális feladathoz (a non-IID ellen).
- GeneratĂv visszajátszást vĂ©gezni korábbi feladatokhoz (a felejtĂ©s ellen).
- Dinamikus tudásátadást megoldani eltérő kliensmodellekből (a modellheterogenitás ellen).
A kutatás trĂĽkkje, hogy elĹ‘re betanĂtott diffĂşziĂłs modelleket használ „könnyű” osztály-prototĂpusok kinyerĂ©sĂ©re. Magyarul: a szerver kap egy olyan generatĂv kĂ©pessĂ©get, amivel kontrollált mĂłdon tud „pĂłtadatot” előállĂtani Ă©s „emlĂ©kezni”, miközben nem kell konkrĂ©t betegadat vagy vásárlĂłi tranzakciĂł a felhĹ‘be.
Mi az a „könnyű osztályprototĂpus”, Ă©s miĂ©rt számĂt?
A válasz: kicsi, hordozhatĂł reprezentáciĂł, ami egy osztály vagy fogalom lĂ©nyegĂ©t tömörĂti.
- EgĂ©szsĂ©gĂĽgy: prototĂpus lehet pĂ©ldául egy diagnosztikai kategĂłria jellemzĹ‘ mintázatának sűrĂtett leĂrása (nem azonosĂthatĂł nyers kĂ©pkocka).
- E-kereskedelem: prototĂpus lehet „visszatĂ©rĹ‘ vásárló”, „árĂ©rzĂ©keny kosár”, „szezonális termĂ©k” jellegzetessĂ©geinek tömör reprezentáciĂłja.
Ezekből a szerver „emlékeztető” jellegű szintetikus mintákat tud generálni, és ez az, ami adatmentesen támogatja a folyamatos tanulást.
Egészségügyi párhuzam: telemedicina, alacsony sávszél, gyors változás
A rövid válasz: az adat nĂ©lkĂĽli szerveroldali frissĂtĂ©s pont ott segĂt, ahol a rendszer nem enged adatmozgatást.
Alacsony sávszélességű együttműködés
Telemedicinában és régiós ellátásban tipikus, hogy a kapcsolat instabil vagy drága. Ha a felhőnek nem kell adathalmazokat mozgatni, csak modelleket/összegzett tudást, az:
- csökkenti az átviteli terhelést,
- gyorsĂtja a frissĂtĂ©si ciklust,
- Ă©s egyszerűsĂti a megfelelĹ‘sĂ©gi folyamatokat.
Folyamatos alkalmazkodás új protokollokhoz
2025-ben a klinikai AI egyik legnehezebb kĂ©rdĂ©se nem az, hogy „tud-e jĂł modellt tanĂtani?”, hanem hogy tud-e biztonságosan változni. Ăšj eszköz, Ăşj annotáciĂłs szabvány, Ăşj gyĂłgyszerelĂ©si protokoll, Ăşj populáciĂłs hullám — a modellnek lĂ©pĂ©st kell tartania anĂ©lkĂĽl, hogy a rĂ©gi teljesĂtmĂ©nyt feladná.
A FedDCL-szerű megközelĂtĂ©s itt azĂ©rt erĹ‘s, mert a generatĂv „visszajátszás” nem klasszikus adattárolás. Nem egy adatbázist Ĺ‘rzĂĽnk, hanem egy tudás-visszaidĂ©zĂ©si mechanizmust.
Kiskereskedelem és e-kereskedelem: ugyanaz a gond, csak más köntösben
A válasz: a kiskereskedelemben a kereslet-előrejelzés, a készletoptimalizálás és a személyre szabott ajánlórendszer pontosan olyan folyamatosan változó feladat, mint az orvosi AI.
December vége ráadásul különösen kegyetlen időszak az adatok szempontjából: karácsonyi lecsengés, ajándék-visszaküldések, év végi akciók, készletkisöprés, majd januári „újratervezés”. Ez tipikusan olyan helyzet, ahol a modell könnyen túlilleszkedik a friss mintára, és elfelejti a „normál” üzemet.
Gyakorlati példa: ajánlórendszer több boltban, több eszközön
Képzelj el egy láncot:
- nagy budapesti üzletekben erős edge szerver futtat valós idejű polcfelismerést,
- kisebb egységekben csak pénztáradat és készletszenzor van,
- az e-kereskedelmi oldal külön modellen számolja a kosár-ajánlásokat.
Ez modellheterogenitás a gyakorlatban.
FedDCL-szemlélettel a központi modell úgy tudna frissülni, hogy:
- az aktuális kampányhoz generál szintetikus mintákat (non-IID enyhĂtĂ©se),
- megtartja a korábbi szezonok „emlĂ©kĂ©t” generatĂv replay-jel,
- és különböző kliensmodellekből tudást vesz át anélkül, hogy mindenki ugyanazt a modellt futtatná.
Mit érdemes ebből átültetni 2026-os projektekbe? (Konkrét lépések)
A lényeg: nem kell holnap diffúziós modellt bevezetned ahhoz, hogy a gondolkodásmódot használd. Én ezt a 6 lépést javaslom, ha egészségügyi vagy kiskereskedelmi AI rendszert skálázol.
-
Írd le, hol keletkezik heterogenitás
- adat (non-IID),
- hardver (CPU/GPU/memĂłria),
- modell (külön architektúrák),
- frissĂtĂ©si gyakoriság.
-
Döntsd el, mi a „tiltott” adatmozgás
- nyers kép? nyers tranzakció? csak aggregátum mehet?
-
Válassz felejtés elleni stratégiát
- klasszikus: példatárolás (egészségügyben gyakran problémás),
- jobb: generatĂv replay vagy prototĂpus-alapĂş emlĂ©kezet.
-
Kezeld külön a „tudás-illesztést” (knowledge alignment)
- ha eltĂ©rĹ‘ modellek vannak, legyen explicit illesztĂ©si rĂ©teg vagy protokoll (pl. logit-szintű tudásátadás, prototĂpus-szinkron).
-
Mérj úgy, hogy a felejtés látszódjon
- ne csak összpontszám legyen, hanem idĹ‘beli bontás: „rĂ©gi feladatok” vs „új feladatok” teljesĂtmĂ©nye.
-
KĂ©szĂĽlj auditálhatĂł frissĂtĂ©sekre
- egészségügyben ez kötelező, kiskereskedelemben üzleti előny: visszakövethető, mikor miért változott az ajánlás vagy a készletjavaslat.
Gyakori kérdések, amiket a csapatok feltesznek
„Az adat nélküli tanulás akkor azt jelenti, hogy nincs is adat?”
Nem. A kliensoldalon van adat, csak a szerver nem kap nyers adatot. A szerver a tudásátadásbĂłl Ă©s a prototĂpusokbĂłl dolgozik.
„A szintetikus adat nem rontja el a modellt?”
Ha rosszul generálod, de. A kutatás ezĂ©rt támaszkodik elĹ‘re tanĂtott generatĂv modellekre Ă©s osztályprototĂpusokra, hogy a szintetikus minták kontrolláltabbak legyenek.
„Ez kiváltja a federált tanulást?”
Nem kiváltja, inkább felnĹ‘tt verziĂł heterogĂ©n környezetre: a federált tanulás alapelvĂ©t (adat helyben marad) megtartja, de hozzáad egy folyamatos tanulási Ă©s generatĂv memĂłriarĂ©teget.
Merre tart ez 2026-ban: skálázhatóság adat nélkül, felejtés nélkül
Az „adat nĂ©lkĂĽli folyamatos tanulás” ĂĽzenete szerintem egyszerű: a felhĹ‘ben futĂł központi modelleknek nem szabad minden frissĂtĂ©snĂ©l Ăşjra Ă©s Ăşjra „megenniĂĽk” az adatot, mert ez drága, lassĂş Ă©s sokszor tiltott. Ehelyett okosabb a tudásáthelyezĂ©sre, prototĂpusokra Ă©s generatĂv emlĂ©kezetre Ă©pĂteni.
A „Mesterséges intelligencia a kiskereskedelemben és e‑kereskedelemben” sorozatban ez azért kulcstéma, mert a személyre szabott ajánlások, a készletkezelés és a kereslet-előrejelzés 2026-ban még inkább edge-közeli lesz: több bolt, több csatorna, több eszköz, rövidebb kampányciklusok.
Ha most tervezel AI bevezetést egészségügyben vagy retailben, én ezt a kérdést tenném fel a legvégén a döntéshozói meetingen: a rendszerünk képes lesz tanulni új helyzetekből úgy, hogy közben nem felejt el régi, üzletileg vagy klinikailag kritikus mintákat?