用TQF做多变量不确定性预测:让供应链决策更稳

人工智能在科研与创新平台By 3L3C

TQF(断层分位数森林)把多变量不确定性预测落到供应链:联合需求、时效与成本风险可量化、可决策,适合做预测与风控试点。

不确定性量化需求预测供应链AI物流风控机器学习落地科研到产业
Share:

用TQF做多变量不确定性预测:让供应链决策更稳

12 月往往是一年里供应链最“紧”的时候:促销余波还没消,春节备货又开始提速,仓网、干线、末端的任何一个小波动,都可能被放大成缺货、爆仓或高价加急。多数企业其实不是“预测不准”,而是只给了一个点预测,却没把风险范围讲清楚。当你同时要预测“需求量 + 退货率 + 到货时效 + 多仓库存变化”,单点数字几乎注定会误导决策。

这也是为什么 2025-12-19 在机器学习领域引起讨论的一篇新论文——Tomographic Quantile Forests(TQF,断层分位数森林)——对物流与供应链很有价值。它的核心不是再做一个更强的回归器,而是解决一个更现实的问题:多维目标(multivariate targets)的不确定性量化。简单说,它能告诉你“可能发生什么”和“发生到什么程度”,而不仅是“最可能是多少”。

作为「人工智能在科研与创新平台」系列的一篇,我更关心的是:这种研究型方法,怎么落到供应链预测与风控里,变成能推动业务拿线索(LEADS)的解决方案。

多变量不确定性量化:供应链预测里最常被低估的一环

直接结论:供应链的关键预测几乎都是多变量问题,单变量置信区间不够用。

在真实运营里,你很少只预测一个数。更常见的是一组彼此关联的指标:

  • 同一 SKU 在多渠道/多区域的需求联动(“A 城涨了,B 城往往也涨”)
  • 需求与价格、促销强度的耦合(“降价带来销量上涨,但波动也更大”)
  • 到货时效与运力、天气、拥堵的相关性(“晚到的时候往往还伴随更高的破损率/退货率”)
  • 库存、缺货率、履约成本的联动(“缺货少了,可能是因为你付了更贵的加急费”)

很多团队会把这些拆成多个模型,各自输出均值和区间,再“拼在一起”。问题是:拼出来的联合风险常常是假的。你可能得到了每个指标都“很安全”的区间,但当它们同时偏离时,系统风险反而更大。

一句话很适合做团队共识:

供应链的风险不是某个变量的波动,而是多变量一起偏离时的连锁反应。

TQF到底做了什么:用“方向投影”把多维不确定性变成可学的分位数

直接结论:TQF把多维输出的分布学习,拆解成很多“方向上的一维分位数学习”,再把这些方向信息重建回多维分布。

论文里的设定是:输入是特征 (\mathbf{x})(比如时间、价格、促销、天气、产能、上游交期等),输出是多维目标 (\mathbf{y})(比如多个仓的需求向量,或“需求/退货/时效”等组成的向量)。

传统的分位数回归/分位数森林擅长做一维目标:给你 P50、P90 之类的分位数。但 (\mathbf{y}) 是多维时,“直接学条件分布”会变得很难。

TQF用了一种很工程化也很聪明的思路:

1)先把多维目标投影到很多个方向

选一个单位方向向量 (\mathbf{n}),把输出投影成一个标量:(\mathbf{n}^\top \mathbf{y})。

这一步的直觉:你可以把“多仓需求向量”从不同角度去看,每个角度都是一个一维随机变量。一维分位数我们会学,多维难点先绕开。

2)用一棵“同时看x和方向n”的树模型学分位数

论文强调的一点是:很多方向分位数方法需要“每个方向训练一个模型”,成本高、难维护。TQF把方向 (\mathbf{n}) 也作为输入的一部分,让模型覆盖所有方向。

对供应链团队来说,这个优点很务实:

  • 你不需要为 200 个方向维护 200 套模型与监控
  • 更容易做 MLOps:一套训练、版本、回滚、告警体系

3)推理时,把很多方向的分位数“拼回”多维分布

论文用**sliced Wasserstein distance(切片 Wasserstein 距离)**来度量“方向切片上的分布差异”,再通过一个高效的交替优化方案重建联合分布。你不需要在业务侧理解全部数学细节,但要抓住结果:

  • 输出不只是一个“椭圆形/凸的置信区域”(许多方向分位数方法会受凸性限制)
  • 可以得到更贴近真实的、形状更灵活的风险区域

这点对供应链很关键,因为真实分布经常是偏态、多峰的:比如“平时平稳 + 大促爆发 + 极端天气的尾部风险”。

把TQF放进供应链:3个高价值用例(需求、时效、库存联动)

直接结论:TQF最适合用于“要同时预测多个指标,并且要把置信范围用于决策”的场景。

用例一:多仓/多区域需求联合预测,用于补货与调拨

常见做法是对每个仓单独预测需求,然后按安全库存公式加 buffer。问题在于:

  • 仓与仓之间需求相关,尤其是同城多仓、同线路的替代效应
  • 促销/短缺会造成跨仓吸收与迁移

用TQF你可以直接预测一个多维需求向量的条件分布,从而回答更贴近决策的问题:

  • “华东三仓合计需求超过 12 万件的概率是多少?”
  • “在 P90 风险下,应该把调拨阈值设到多少,才能把缺货风险压到 5%?”

用例二:到货时效 + 破损/退货的联动风控

很多企业把 ETA(预计到达时间)做得越来越准,但晚到往往不是孤立事件:晚到时破损、投诉、退货也可能同步上升。

TQF这类多变量不确定性模型适合做:

  • 同时输出“时效分布 + 退货率分布 + 波动的相关结构”
  • 把“尾部情形”显式暴露给运营(比如 P95 的极端路径)

运营侧的动作也更清晰:

  • 当模型提示“晚到与退货共同上尾”时,优先做线路切换/包材加固/客服预案

用例三:库存-缺货-履约成本的多目标风险预算

库存优化经常被做成一个确定性问题:给定预测需求,算一个最优补货。真正让利润波动的,是不确定性下的多目标权衡。

如果你能得到联合分布,就可以更自然地做“风险预算”:

  • 允许缺货率不超过 2% 的同时,让履约成本的 P90 不超过某个阈值
  • 用“概率约束”表达服务水平,而不是拍脑袋加安全系数

一句很实用的观点:

安全库存不是一个常数,而是一种对尾部风险的定价。

落地路线:从科研方法到可上线的预测与风控组件

直接结论:先用“小范围、多变量、强决策耦合”的场景试点,比全域替换更稳。

我建议的落地步骤(也方便你和供应链/数据团队对齐):

  1. 选对多变量目标:优先选“天然联动且会驱动动作”的变量组,例如(多仓需求向量)、(ETA+延误概率+退货率)。
  2. 定义可执行的风险指标:不要只看 CRPS/Pinball loss 等学术指标,增加业务指标:
    • 缺货率(按 SKU-仓-日)
    • 过量库存天数
    • 加急运输费用
    • 服务水平(OTIF)
  3. 方向采样与推理成本评估:TQF推理要聚合多方向信息。上线前就要给出 SLA:例如单次推理 200 个方向、耗时上限、批量预测窗口。
  4. 把“分布”接到决策器:别停在可视化层。
    • 补货:从“点预测+安全库存”升级为“概率约束补货”
    • 调拨:用“联合上尾概率”触发调拨与锁仓策略
  5. 监控不确定性是否可信(校准):供应链最怕“区间很漂亮但不准”。必须做回测:P90 是否真的覆盖了 90% 的真实结果。

常见问题(团队评审时一定会问)

Q1:我们用分位数回归/分位数森林就够了,为什么还要多变量?

A:如果你的决策只依赖单一指标,确实够。但只要你做的是“多仓协同”“多指标约束”,拆成单变量会丢掉相关结构,导致联合风险被低估。

Q2:多变量分布重建会不会太复杂,维护成本太高?

A:复杂度主要在推理端的方向聚合与重建。工程上可以通过方向数量、批量化推理、缓存特征来控成本。相对训练 200 套模型,TQF“一套模型覆盖全方向”的思路反而更利于维护。

Q3:这类方法对数据量要求高吗?

A:多变量学习确实更吃数据,但供应链数据有优势:按天/小时、按仓/线路/承运商切片后样本量很快起来。关键是特征治理和标签对齐(例如 ETA 的真实到达时间与事件延迟标签)。

你应该从哪一步开始:把“不确定性”变成可销售的能力

预测做得再准,如果不能解释风险、不能驱动动作,业务很难为它买单。TQF带来的启发是:把模型输出从“一个数字”升级为“一个可用于约束和优化的分布”,供应链决策才会更稳、更可控。

如果你正在推进 AI 预测平台、智能补货、运输时效风控,建议先做一个 4-6 周的小试点:选一个多仓品类或一条高波动线路,把多变量不确定性输出接到补货/调度策略里,用回测证明“风险真的被压住了”。这往往就是生成高质量线索(LEADS)的最佳入口:你不是在卖模型,而是在卖“可量化的风险收益”。

接下来一个值得继续追问的问题是:当你能得到联合分布后,你的供应链策略,是继续用经验规则,还是把它升级为真正的概率约束优化?