供应链AI上线后变差,往往不是数据少,而是“遗忘”在发生。用自洽性视角建立切片评估、回放训练与版本治理,让预测、库存与调度长期稳定。
AI会“遗忘”你的供应链:用科研方法守住预测与决策稳定性
年底往往是供应链最“忙乱也最脆弱”的时候:促销尾声、春节备货前置、跨境航线与舱位波动、天气与政策扰动叠加。很多团队会把希望押在AI上——更准的需求预测、更快的调度、更低的库存。
但我见过一个反常的现象:模型上线后,前几周指标漂亮,之后逐月走弱;团队加大频率重训,结果在“新数据变好了、老场景变差了”的循环里越陷越深。问题不一定出在特征工程或算力,而是一个更底层的机制:遗忘(forgetting)。
最近一篇论文提出了一个很有用的视角:遗忘不是“模型记不住过去”这么泛泛的说法,而是学习者对未来经验的预测分布缺乏自洽性,表现为预测信息的流失。更直白点:模型在吸收新数据时,把自己原本对世界的“内部信念”改得前后矛盾,于是旧能力悄悄消失。
这篇文章放在“人工智能在科研与创新平台”系列里讲,意义很现实:科研给出的不是某个小技巧,而是一套可迁移的解释框架,能直接指导我们把AI做成长期稳定的物流与供应链系统,而不是一次性Demo。
供应链AI为什么更容易“遗忘”:因为你喂的是连续变化的世界
直接答案:供应链是典型的非平稳环境,模型持续学习时几乎必然面临遗忘。
论文用覆盖分类、回归、生成建模、强化学习的实验说明:遗忘并非只出现在某一类任务,而是深度学习设置里普遍存在,并且会显著影响学习效率。把这件事搬到供应链上,会更尖锐:
- 需求分布不断漂移:季节性、价格策略、渠道变化、竞品动作、短视频爆款,都会改变购买行为。
- 约束条件频繁改变:运力、时效承诺、清关、区域限行、仓网调整。
- 数据反馈有延迟:缺货导致的“看不见的需求”、配送失败回传、退货周期。
- 目标函数会变:从“GMV最大”切换到“履约率优先”,再到“现金流优先”。
在这样的环境里,如果你用“每周全量重训”或“线上增量学习”去追新数据,模型很可能出现:新SKU学会了、老SKU变差;新线路调度更优、旺季路径却失灵;新客召回更准、老客复购预测塌陷。
一句话概括:供应链的成功不是一次预测准确,而是长期、跨季节、跨场景的稳定准确。遗忘正好打在这个软肋上。
用“自洽性”理解遗忘:不是掉点,而是内部信念前后打架
直接答案:遗忘可以被视为“对未来数据的预测分布不再自洽”,导致可用预测信息减少。
传统上我们常用“旧任务准确率下降”来描述遗忘(比如连续学习里常见的指标)。但供应链经常没有清晰的“任务边界”:今天只是多了新站点、新活动、新渠道,你很难说这是“任务A到任务B”。这也是论文强调“算法与任务无关”的价值:它试图给遗忘一个更底层、更通用的定义。
把它翻译成工程语言,可以这样理解:
- 模型上线时,有一套参数(或隐变量)对应它对世界的理解。
- 当你用新数据更新模型时,如果更新方式让模型对“未来会遇到什么”这一点产生前后不一致的判断,那么它会丢掉一部分曾经能用的规律。
一句可复用的判断:当模型为了适配新分布而修改预测结构时,如果它对未来经验的预测不再自洽,遗忘就发生了。
这比“指标掉了”更早、更可诊断:你可以在指标大幅下滑前,先看到模型的内部预测已经开始互相矛盾。
三个高风险场景:遗忘如何悄悄拖垮预测、库存与路径规划
直接答案:遗忘会在需求预测、库存计划、路径/调度三类核心决策上放大成本,且往往先体现在“效率下降”。
1) 需求预测:新活动学会了,淡季基线丢了
典型现象是:大促期间模型为了追随短期波动,加大对促销特征、站内流量特征的权重;大促结束后,模型仍保留“波动性世界观”,对平稳时期的基线需求估计偏高或偏低。
落地后会出现两类损失:
- 预测误差的结构性变化:MAE可能没有立刻崩,但偏差(bias)持续累积。
- 决策链放大:预测偏差会被补货策略放大,最终体现在缺货率或滞销上。
2) 库存与补货:为了新SKU调参,老SKU安全库存不稳
很多团队会用分层模型或多任务学习:新SKU冷启动靠相似品、老SKU靠历史。问题是,当你为了新SKU把表示学习层更新得更“敏感”,老SKU的表示也被动改变。
结果常见:
- 安全库存策略变得更“抖”,补货频次上升但周转没变好;
- 仓间调拨变多,运输成本上升,库存账面看似健康,实际履约压力更大。
3) 路径规划/调度(强化学习或启发式+学习):新路况适配了,旺季策略失效
调度系统经常在线学习:今天某线路拥堵,策略更新;明天拥堵缓解,但策略没有回到更优状态。论文强调遗忘在强化学习中同样存在,这点对物流调度尤其重要。
你会看到:
- 单次仿真/单城指标改善,但跨城迁移变差;
- 异常情况下(天气、封控、爆仓)策略更不稳定。
一个很“供应链”的结论:遗忘先伤的是“鲁棒性”,再伤“平均指标”。
你该怎么管:把“遗忘”变成可监控、可治理的工程指标
直接答案:想让供应链AI长期可靠,必须同时管理“数据漂移、训练方式、评估体系”三件事,并把遗忘纳入指标看板。
下面是一套我更推荐的实操框架,适合做成团队的标准化流程。
1) 评估:别只盯总体误差,做“跨时间切片”的回归测试
把遗忘抓出来的最快方式,是把评估集按时间与场景切片,并固定一组“历史关键场景集”(旺季、淡季、极端天气、特定品类)。
建议最少做四类切片:
- 季节切片:去年双11、年货节、618等;
- 品类切片:高波动与低波动品类;
- 区域切片:干线与末端特征差异大的区域;
- 约束切片:运力紧张/宽松、仓网调整前后。
团队要形成硬纪律:
- 新模型在“最新窗口”提升多少;
- 在“历史关键场景集”下降多少;
- 下降是否超过阈值(例如任何关键场景指标下降超过2%就阻断发布)。
2) 训练:优先“保留旧能力”的更新策略,而不是盲目追新
如果你的系统必须频繁更新(大多数供应链都如此),训练策略要从“追逐最新数据”改为“在适应与记忆之间做约束”。常见可选项:
- 回放(replay):训练时混入代表性历史样本,保持旧分布覆盖;
- 正则化约束:对关键参数的变化加惩罚,减少对旧知识的破坏;
- 分层/模块化:把“稳定规律”(如季节性、价格弹性)与“短期扰动”(如活动、热搜)拆开;
- 贝叶斯思路的启发:论文指出贝叶斯学习者可以在适应中不遗忘。工程上未必全量上贝叶斯,但可以借鉴“保留不确定性、避免过度自信更新”的思想,例如用校准、置信度门控来控制更新强度。
我个人偏向的顺序是:先做回放+切片评估,成本低、收益高;之后再上更复杂的正则与模块化。
3) 运营:把“模型版本”当作供应链资产管理
供应链团队在管理仓网、运力合同时很成熟,但对模型常常缺少同等严谨。建议引入“模型资产管理”三件套:
- 版本与可追溯:每次上线记录训练窗口、特征版本、超参、数据质量报告;
- 灰度与回滚:关键线路/关键仓先灰度,出现遗忘迹象可快速回滚;
- 告警触发重训:不是“到了周一就重训”,而是“漂移/遗忘指标触发才重训”。
可执行的一句话:让重训从日程驱动变成信号驱动。
常见追问:是不是“多训练几次”就能解决遗忘?
直接答案:不能。更频繁的重训往往让遗忘更隐蔽、更难定位。
原因很现实:频繁更新会让模型不断改变内部表示,你看到的是“平均指标抖动”,却很难追到到底丢了哪些能力。解决路线不是更勤奋,而是更科学:
- 用切片回归测试锁定“丢在哪”;
- 用回放与约束让更新变得可控;
- 用运营机制保证问题可回滚、可复盘。
如果你的业务已经进入2026年春节备货窗口,建议先做一轮“关键场景集”建设——这往往比换一套更复杂的模型更值钱。
下一步:把“遗忘治理”纳入你的供应链AI路线图
供应链AI的真实门槛,不是训练出一个高分模型,而是让它在一年四季、各种扰动下都可靠。论文给我的启发是:遗忘不是偶发Bug,而是学习系统的常态风险;你要做的是建立一套能长期压住它的工程体系。
如果你正在搭建科研与创新平台(数据平台、特征平台、实验平台),我建议把“遗忘评估与回归测试”做成平台能力:它会直接提升需求预测准确率、降低库存波动、让路径规划更稳。
你更担心哪一种遗忘:模型对旺季的经验消失,还是对异常事件的鲁棒性下降?这个答案,会决定你优先改评估、改训练还是改运营。