AI会“遗忘”你的供应链:用科研方法守住预测与决策稳定性

人工智能在科研与创新平台By 3L3C

供应链AI上线后变差,往往不是数据少,而是“遗忘”在发生。用自洽性视角建立切片评估、回放训练与版本治理,让预测、库存与调度长期稳定。

持续学习模型监控需求预测物流调度库存管理科研创新平台
Share:

AI会“遗忘”你的供应链:用科研方法守住预测与决策稳定性

年底往往是供应链最“忙乱也最脆弱”的时候:促销尾声、春节备货前置、跨境航线与舱位波动、天气与政策扰动叠加。很多团队会把希望押在AI上——更准的需求预测、更快的调度、更低的库存。

但我见过一个反常的现象:模型上线后,前几周指标漂亮,之后逐月走弱;团队加大频率重训,结果在“新数据变好了、老场景变差了”的循环里越陷越深。问题不一定出在特征工程或算力,而是一个更底层的机制:遗忘(forgetting)

最近一篇论文提出了一个很有用的视角:遗忘不是“模型记不住过去”这么泛泛的说法,而是学习者对未来经验的预测分布缺乏自洽性,表现为预测信息的流失。更直白点:模型在吸收新数据时,把自己原本对世界的“内部信念”改得前后矛盾,于是旧能力悄悄消失。

这篇文章放在“人工智能在科研与创新平台”系列里讲,意义很现实:科研给出的不是某个小技巧,而是一套可迁移的解释框架,能直接指导我们把AI做成长期稳定的物流与供应链系统,而不是一次性Demo。

供应链AI为什么更容易“遗忘”:因为你喂的是连续变化的世界

直接答案:供应链是典型的非平稳环境,模型持续学习时几乎必然面临遗忘。

论文用覆盖分类、回归、生成建模、强化学习的实验说明:遗忘并非只出现在某一类任务,而是深度学习设置里普遍存在,并且会显著影响学习效率。把这件事搬到供应链上,会更尖锐:

  • 需求分布不断漂移:季节性、价格策略、渠道变化、竞品动作、短视频爆款,都会改变购买行为。
  • 约束条件频繁改变:运力、时效承诺、清关、区域限行、仓网调整。
  • 数据反馈有延迟:缺货导致的“看不见的需求”、配送失败回传、退货周期。
  • 目标函数会变:从“GMV最大”切换到“履约率优先”,再到“现金流优先”。

在这样的环境里,如果你用“每周全量重训”或“线上增量学习”去追新数据,模型很可能出现:新SKU学会了、老SKU变差;新线路调度更优、旺季路径却失灵;新客召回更准、老客复购预测塌陷

一句话概括:供应链的成功不是一次预测准确,而是长期、跨季节、跨场景的稳定准确。遗忘正好打在这个软肋上。

用“自洽性”理解遗忘:不是掉点,而是内部信念前后打架

直接答案:遗忘可以被视为“对未来数据的预测分布不再自洽”,导致可用预测信息减少。

传统上我们常用“旧任务准确率下降”来描述遗忘(比如连续学习里常见的指标)。但供应链经常没有清晰的“任务边界”:今天只是多了新站点、新活动、新渠道,你很难说这是“任务A到任务B”。这也是论文强调“算法与任务无关”的价值:它试图给遗忘一个更底层、更通用的定义。

把它翻译成工程语言,可以这样理解:

  • 模型上线时,有一套参数(或隐变量)对应它对世界的理解。
  • 当你用新数据更新模型时,如果更新方式让模型对“未来会遇到什么”这一点产生前后不一致的判断,那么它会丢掉一部分曾经能用的规律。

一句可复用的判断:当模型为了适配新分布而修改预测结构时,如果它对未来经验的预测不再自洽,遗忘就发生了。

这比“指标掉了”更早、更可诊断:你可以在指标大幅下滑前,先看到模型的内部预测已经开始互相矛盾。

三个高风险场景:遗忘如何悄悄拖垮预测、库存与路径规划

直接答案:遗忘会在需求预测、库存计划、路径/调度三类核心决策上放大成本,且往往先体现在“效率下降”。

1) 需求预测:新活动学会了,淡季基线丢了

典型现象是:大促期间模型为了追随短期波动,加大对促销特征、站内流量特征的权重;大促结束后,模型仍保留“波动性世界观”,对平稳时期的基线需求估计偏高或偏低。

落地后会出现两类损失:

  • 预测误差的结构性变化:MAE可能没有立刻崩,但偏差(bias)持续累积。
  • 决策链放大:预测偏差会被补货策略放大,最终体现在缺货率或滞销上。

2) 库存与补货:为了新SKU调参,老SKU安全库存不稳

很多团队会用分层模型或多任务学习:新SKU冷启动靠相似品、老SKU靠历史。问题是,当你为了新SKU把表示学习层更新得更“敏感”,老SKU的表示也被动改变。

结果常见:

  • 安全库存策略变得更“抖”,补货频次上升但周转没变好;
  • 仓间调拨变多,运输成本上升,库存账面看似健康,实际履约压力更大。

3) 路径规划/调度(强化学习或启发式+学习):新路况适配了,旺季策略失效

调度系统经常在线学习:今天某线路拥堵,策略更新;明天拥堵缓解,但策略没有回到更优状态。论文强调遗忘在强化学习中同样存在,这点对物流调度尤其重要。

你会看到:

  • 单次仿真/单城指标改善,但跨城迁移变差;
  • 异常情况下(天气、封控、爆仓)策略更不稳定。

一个很“供应链”的结论:遗忘先伤的是“鲁棒性”,再伤“平均指标”。

你该怎么管:把“遗忘”变成可监控、可治理的工程指标

直接答案:想让供应链AI长期可靠,必须同时管理“数据漂移、训练方式、评估体系”三件事,并把遗忘纳入指标看板。

下面是一套我更推荐的实操框架,适合做成团队的标准化流程。

1) 评估:别只盯总体误差,做“跨时间切片”的回归测试

把遗忘抓出来的最快方式,是把评估集按时间与场景切片,并固定一组“历史关键场景集”(旺季、淡季、极端天气、特定品类)。

建议最少做四类切片:

  • 季节切片:去年双11、年货节、618等;
  • 品类切片:高波动与低波动品类;
  • 区域切片:干线与末端特征差异大的区域;
  • 约束切片:运力紧张/宽松、仓网调整前后。

团队要形成硬纪律:

  1. 新模型在“最新窗口”提升多少;
  2. 在“历史关键场景集”下降多少;
  3. 下降是否超过阈值(例如任何关键场景指标下降超过2%就阻断发布)。

2) 训练:优先“保留旧能力”的更新策略,而不是盲目追新

如果你的系统必须频繁更新(大多数供应链都如此),训练策略要从“追逐最新数据”改为“在适应与记忆之间做约束”。常见可选项:

  • 回放(replay):训练时混入代表性历史样本,保持旧分布覆盖;
  • 正则化约束:对关键参数的变化加惩罚,减少对旧知识的破坏;
  • 分层/模块化:把“稳定规律”(如季节性、价格弹性)与“短期扰动”(如活动、热搜)拆开;
  • 贝叶斯思路的启发:论文指出贝叶斯学习者可以在适应中不遗忘。工程上未必全量上贝叶斯,但可以借鉴“保留不确定性、避免过度自信更新”的思想,例如用校准、置信度门控来控制更新强度。

我个人偏向的顺序是:先做回放+切片评估,成本低、收益高;之后再上更复杂的正则与模块化。

3) 运营:把“模型版本”当作供应链资产管理

供应链团队在管理仓网、运力合同时很成熟,但对模型常常缺少同等严谨。建议引入“模型资产管理”三件套:

  • 版本与可追溯:每次上线记录训练窗口、特征版本、超参、数据质量报告;
  • 灰度与回滚:关键线路/关键仓先灰度,出现遗忘迹象可快速回滚;
  • 告警触发重训:不是“到了周一就重训”,而是“漂移/遗忘指标触发才重训”。

可执行的一句话:让重训从日程驱动变成信号驱动。

常见追问:是不是“多训练几次”就能解决遗忘?

直接答案:不能。更频繁的重训往往让遗忘更隐蔽、更难定位。

原因很现实:频繁更新会让模型不断改变内部表示,你看到的是“平均指标抖动”,却很难追到到底丢了哪些能力。解决路线不是更勤奋,而是更科学:

  • 用切片回归测试锁定“丢在哪”;
  • 用回放与约束让更新变得可控;
  • 用运营机制保证问题可回滚、可复盘。

如果你的业务已经进入2026年春节备货窗口,建议先做一轮“关键场景集”建设——这往往比换一套更复杂的模型更值钱。

下一步:把“遗忘治理”纳入你的供应链AI路线图

供应链AI的真实门槛,不是训练出一个高分模型,而是让它在一年四季、各种扰动下都可靠。论文给我的启发是:遗忘不是偶发Bug,而是学习系统的常态风险;你要做的是建立一套能长期压住它的工程体系。

如果你正在搭建科研与创新平台(数据平台、特征平台、实验平台),我建议把“遗忘评估与回归测试”做成平台能力:它会直接提升需求预测准确率、降低库存波动、让路径规划更稳。

你更担心哪一种遗忘:模型对旺季的经验消失,还是对异常事件的鲁棒性下降?这个答案,会决定你优先改评估、改训练还是改运营。