人工智能在科研与创新平台•2025年12月20日•By 3L3C

供应链AI上线后变差，往往不是数据少，而是“遗忘”在发生。用自洽性视角建立切片评估、回放训练与版本治理，让预测、库存与调度长期稳定。

持续学习模型监控需求预测物流调度库存管理科研创新平台

AI会“遗忘”你的供应链：用科研方法守住预测与决策稳定性

年底往往是供应链最“忙乱也最脆弱”的时候：促销尾声、春节备货前置、跨境航线与舱位波动、天气与政策扰动叠加。很多团队会把希望押在AI上——更准的需求预测、更快的调度、更低的库存。

但我见过一个反常的现象：模型上线后，前几周指标漂亮，之后逐月走弱；团队加大频率重训，结果在“新数据变好了、老场景变差了”的循环里越陷越深。问题不一定出在特征工程或算力，而是一个更底层的机制：遗忘（forgetting）。

最近一篇论文提出了一个很有用的视角：遗忘不是“模型记不住过去”这么泛泛的说法，而是学习者对未来经验的预测分布缺乏自洽性，表现为预测信息的流失。更直白点：模型在吸收新数据时，把自己原本对世界的“内部信念”改得前后矛盾，于是旧能力悄悄消失。

这篇文章放在“人工智能在科研与创新平台”系列里讲，意义很现实：科研给出的不是某个小技巧，而是一套可迁移的解释框架，能直接指导我们把AI做成长期稳定的物流与供应链系统，而不是一次性Demo。

供应链AI为什么更容易“遗忘”：因为你喂的是连续变化的世界

直接答案：供应链是典型的非平稳环境，模型持续学习时几乎必然面临遗忘。

论文用覆盖分类、回归、生成建模、强化学习的实验说明：遗忘并非只出现在某一类任务，而是深度学习设置里普遍存在，并且会显著影响学习效率。把这件事搬到供应链上，会更尖锐：

需求分布不断漂移：季节性、价格策略、渠道变化、竞品动作、短视频爆款，都会改变购买行为。
约束条件频繁改变：运力、时效承诺、清关、区域限行、仓网调整。
数据反馈有延迟：缺货导致的“看不见的需求”、配送失败回传、退货周期。
目标函数会变：从“GMV最大”切换到“履约率优先”，再到“现金流优先”。

在这样的环境里，如果你用“每周全量重训”或“线上增量学习”去追新数据，模型很可能出现：新SKU学会了、老SKU变差；新线路调度更优、旺季路径却失灵；新客召回更准、老客复购预测塌陷。

一句话概括：供应链的成功不是一次预测准确，而是长期、跨季节、跨场景的稳定准确。遗忘正好打在这个软肋上。

用“自洽性”理解遗忘：不是掉点，而是内部信念前后打架

直接答案：遗忘可以被视为“对未来数据的预测分布不再自洽”，导致可用预测信息减少。

传统上我们常用“旧任务准确率下降”来描述遗忘（比如连续学习里常见的指标）。但供应链经常没有清晰的“任务边界”：今天只是多了新站点、新活动、新渠道，你很难说这是“任务A到任务B”。这也是论文强调“算法与任务无关”的价值：它试图给遗忘一个更底层、更通用的定义。

把它翻译成工程语言，可以这样理解：

模型上线时，有一套参数（或隐变量）对应它对世界的理解。
当你用新数据更新模型时，如果更新方式让模型对“未来会遇到什么”这一点产生前后不一致的判断，那么它会丢掉一部分曾经能用的规律。

一句可复用的判断：当模型为了适配新分布而修改预测结构时，如果它对未来经验的预测不再自洽，遗忘就发生了。

这比“指标掉了”更早、更可诊断：你可以在指标大幅下滑前，先看到模型的内部预测已经开始互相矛盾。

三个高风险场景：遗忘如何悄悄拖垮预测、库存与路径规划

直接答案：遗忘会在需求预测、库存计划、路径/调度三类核心决策上放大成本，且往往先体现在“效率下降”。

1) 需求预测：新活动学会了，淡季基线丢了

典型现象是：大促期间模型为了追随短期波动，加大对促销特征、站内流量特征的权重；大促结束后，模型仍保留“波动性世界观”，对平稳时期的基线需求估计偏高或偏低。

落地后会出现两类损失：

预测误差的结构性变化：MAE可能没有立刻崩，但偏差（bias）持续累积。
决策链放大：预测偏差会被补货策略放大，最终体现在缺货率或滞销上。

2) 库存与补货：为了新SKU调参，老SKU安全库存不稳

很多团队会用分层模型或多任务学习：新SKU冷启动靠相似品、老SKU靠历史。问题是，当你为了新SKU把表示学习层更新得更“敏感”，老SKU的表示也被动改变。

结果常见：

安全库存策略变得更“抖”，补货频次上升但周转没变好；
仓间调拨变多，运输成本上升，库存账面看似健康，实际履约压力更大。

3) 路径规划/调度（强化学习或启发式+学习）：新路况适配了，旺季策略失效

调度系统经常在线学习：今天某线路拥堵，策略更新；明天拥堵缓解，但策略没有回到更优状态。论文强调遗忘在强化学习中同样存在，这点对物流调度尤其重要。

你会看到：

单次仿真/单城指标改善，但跨城迁移变差；
异常情况下（天气、封控、爆仓）策略更不稳定。

一个很“供应链”的结论：遗忘先伤的是“鲁棒性”，再伤“平均指标”。

你该怎么管：把“遗忘”变成可监控、可治理的工程指标

直接答案：想让供应链AI长期可靠，必须同时管理“数据漂移、训练方式、评估体系”三件事，并把遗忘纳入指标看板。

下面是一套我更推荐的实操框架，适合做成团队的标准化流程。

1) 评估：别只盯总体误差，做“跨时间切片”的回归测试

把遗忘抓出来的最快方式，是把评估集按时间与场景切片，并固定一组“历史关键场景集”（旺季、淡季、极端天气、特定品类）。

建议最少做四类切片：

季节切片：去年双11、年货节、618等；
品类切片：高波动与低波动品类；
区域切片：干线与末端特征差异大的区域；
约束切片：运力紧张/宽松、仓网调整前后。

团队要形成硬纪律：

新模型在“最新窗口”提升多少；
在“历史关键场景集”下降多少；
下降是否超过阈值（例如任何关键场景指标下降超过2%就阻断发布）。

2) 训练：优先“保留旧能力”的更新策略，而不是盲目追新

如果你的系统必须频繁更新（大多数供应链都如此），训练策略要从“追逐最新数据”改为“在适应与记忆之间做约束”。常见可选项：

回放（replay）：训练时混入代表性历史样本，保持旧分布覆盖；
正则化约束：对关键参数的变化加惩罚，减少对旧知识的破坏；
分层/模块化：把“稳定规律”（如季节性、价格弹性）与“短期扰动”（如活动、热搜）拆开；
贝叶斯思路的启发：论文指出贝叶斯学习者可以在适应中不遗忘。工程上未必全量上贝叶斯，但可以借鉴“保留不确定性、避免过度自信更新”的思想，例如用校准、置信度门控来控制更新强度。

我个人偏向的顺序是：先做回放+切片评估，成本低、收益高；之后再上更复杂的正则与模块化。

3) 运营：把“模型版本”当作供应链资产管理

供应链团队在管理仓网、运力合同时很成熟，但对模型常常缺少同等严谨。建议引入“模型资产管理”三件套：

版本与可追溯：每次上线记录训练窗口、特征版本、超参、数据质量报告；
灰度与回滚：关键线路/关键仓先灰度，出现遗忘迹象可快速回滚；
告警触发重训：不是“到了周一就重训”，而是“漂移/遗忘指标触发才重训”。

可执行的一句话：让重训从日程驱动变成信号驱动。

常见追问：是不是“多训练几次”就能解决遗忘？

直接答案：不能。更频繁的重训往往让遗忘更隐蔽、更难定位。

原因很现实：频繁更新会让模型不断改变内部表示，你看到的是“平均指标抖动”，却很难追到到底丢了哪些能力。解决路线不是更勤奋，而是更科学：

用切片回归测试锁定“丢在哪”；
用回放与约束让更新变得可控；
用运营机制保证问题可回滚、可复盘。

如果你的业务已经进入2026年春节备货窗口，建议先做一轮“关键场景集”建设——这往往比换一套更复杂的模型更值钱。

下一步：把“遗忘治理”纳入你的供应链AI路线图

供应链AI的真实门槛，不是训练出一个高分模型，而是让它在一年四季、各种扰动下都可靠。论文给我的启发是：遗忘不是偶发Bug，而是学习系统的常态风险；你要做的是建立一套能长期压住它的工程体系。

如果你正在搭建科研与创新平台（数据平台、特征平台、实验平台），我建议把“遗忘评估与回归测试”做成平台能力：它会直接提升需求预测准确率、降低库存波动、让路径规划更稳。

你更担心哪一种遗忘：模型对旺季的经验消失，还是对异常事件的鲁棒性下降？这个答案，会决定你优先改评估、改训练还是改运营。