人工智能在科研与创新平台•2025年12月20日•By 3L3C

TQF（断层分位数森林）把多变量不确定性预测落到供应链：联合需求、时效与成本风险可量化、可决策，适合做预测与风控试点。

不确定性量化需求预测供应链AI物流风控机器学习落地科研到产业

用TQF做多变量不确定性预测：让供应链决策更稳

12 月往往是一年里供应链最“紧”的时候：促销余波还没消，春节备货又开始提速，仓网、干线、末端的任何一个小波动，都可能被放大成缺货、爆仓或高价加急。多数企业其实不是“预测不准”，而是只给了一个点预测，却没把风险范围讲清楚。当你同时要预测“需求量 + 退货率 + 到货时效 + 多仓库存变化”，单点数字几乎注定会误导决策。

这也是为什么 2025-12-19 在机器学习领域引起讨论的一篇新论文——Tomographic Quantile Forests（TQF，断层分位数森林）——对物流与供应链很有价值。它的核心不是再做一个更强的回归器，而是解决一个更现实的问题：多维目标（multivariate targets）的不确定性量化。简单说，它能告诉你“可能发生什么”和“发生到什么程度”，而不仅是“最可能是多少”。

作为「人工智能在科研与创新平台」系列的一篇，我更关心的是：这种研究型方法，怎么落到供应链预测与风控里，变成能推动业务拿线索（LEADS）的解决方案。

多变量不确定性量化：供应链预测里最常被低估的一环

直接结论：供应链的关键预测几乎都是多变量问题，单变量置信区间不够用。

在真实运营里，你很少只预测一个数。更常见的是一组彼此关联的指标：

同一 SKU 在多渠道/多区域的需求联动（“A 城涨了，B 城往往也涨”）
需求与价格、促销强度的耦合（“降价带来销量上涨，但波动也更大”）
到货时效与运力、天气、拥堵的相关性（“晚到的时候往往还伴随更高的破损率/退货率”）
库存、缺货率、履约成本的联动（“缺货少了，可能是因为你付了更贵的加急费”）

很多团队会把这些拆成多个模型，各自输出均值和区间，再“拼在一起”。问题是：拼出来的联合风险常常是假的。你可能得到了每个指标都“很安全”的区间，但当它们同时偏离时，系统风险反而更大。

一句话很适合做团队共识：

供应链的风险不是某个变量的波动，而是多变量一起偏离时的连锁反应。

TQF到底做了什么：用“方向投影”把多维不确定性变成可学的分位数

直接结论：TQF把多维输出的分布学习，拆解成很多“方向上的一维分位数学习”，再把这些方向信息重建回多维分布。

论文里的设定是：输入是特征 (\mathbf{x})（比如时间、价格、促销、天气、产能、上游交期等），输出是多维目标 (\mathbf{y})（比如多个仓的需求向量，或“需求/退货/时效”等组成的向量）。

传统的分位数回归/分位数森林擅长做一维目标：给你 P50、P90 之类的分位数。但 (\mathbf{y}) 是多维时，“直接学条件分布”会变得很难。

TQF用了一种很工程化也很聪明的思路：

1）先把多维目标投影到很多个方向

选一个单位方向向量 (\mathbf{n})，把输出投影成一个标量：(\mathbf{n}^\top \mathbf{y})。

这一步的直觉：你可以把“多仓需求向量”从不同角度去看，每个角度都是一个一维随机变量。一维分位数我们会学，多维难点先绕开。

2）用一棵“同时看x和方向n”的树模型学分位数

论文强调的一点是：很多方向分位数方法需要“每个方向训练一个模型”，成本高、难维护。TQF把方向 (\mathbf{n}) 也作为输入的一部分，让模型覆盖所有方向。

对供应链团队来说，这个优点很务实：

你不需要为 200 个方向维护 200 套模型与监控
更容易做 MLOps：一套训练、版本、回滚、告警体系

3）推理时，把很多方向的分位数“拼回”多维分布

论文用**sliced Wasserstein distance（切片 Wasserstein 距离）**来度量“方向切片上的分布差异”，再通过一个高效的交替优化方案重建联合分布。你不需要在业务侧理解全部数学细节，但要抓住结果：

输出不只是一个“椭圆形/凸的置信区域”（许多方向分位数方法会受凸性限制）
可以得到更贴近真实的、形状更灵活的风险区域

这点对供应链很关键，因为真实分布经常是偏态、多峰的：比如“平时平稳 + 大促爆发 + 极端天气的尾部风险”。

把TQF放进供应链：3个高价值用例（需求、时效、库存联动）

直接结论：TQF最适合用于“要同时预测多个指标，并且要把置信范围用于决策”的场景。

用例一：多仓/多区域需求联合预测，用于补货与调拨

常见做法是对每个仓单独预测需求，然后按安全库存公式加 buffer。问题在于：

仓与仓之间需求相关，尤其是同城多仓、同线路的替代效应
促销/短缺会造成跨仓吸收与迁移

用TQF你可以直接预测一个多维需求向量的条件分布，从而回答更贴近决策的问题：

“华东三仓合计需求超过 12 万件的概率是多少？”
“在 P90 风险下，应该把调拨阈值设到多少，才能把缺货风险压到 5%？”

用例二：到货时效 + 破损/退货的联动风控

很多企业把 ETA（预计到达时间）做得越来越准，但晚到往往不是孤立事件：晚到时破损、投诉、退货也可能同步上升。

TQF这类多变量不确定性模型适合做：

同时输出“时效分布 + 退货率分布 + 波动的相关结构”
把“尾部情形”显式暴露给运营（比如 P95 的极端路径）

运营侧的动作也更清晰：

当模型提示“晚到与退货共同上尾”时，优先做线路切换/包材加固/客服预案

用例三：库存-缺货-履约成本的多目标风险预算

库存优化经常被做成一个确定性问题：给定预测需求，算一个最优补货。真正让利润波动的，是不确定性下的多目标权衡。

如果你能得到联合分布，就可以更自然地做“风险预算”：

允许缺货率不超过 2% 的同时，让履约成本的 P90 不超过某个阈值
用“概率约束”表达服务水平，而不是拍脑袋加安全系数

一句很实用的观点：

安全库存不是一个常数，而是一种对尾部风险的定价。

落地路线：从科研方法到可上线的预测与风控组件

直接结论：先用“小范围、多变量、强决策耦合”的场景试点，比全域替换更稳。

我建议的落地步骤（也方便你和供应链/数据团队对齐）：

选对多变量目标：优先选“天然联动且会驱动动作”的变量组，例如（多仓需求向量）、（ETA+延误概率+退货率）。
定义可执行的风险指标：不要只看 CRPS/Pinball loss 等学术指标，增加业务指标：
- 缺货率（按 SKU-仓-日）
- 过量库存天数
- 加急运输费用
- 服务水平（OTIF）
方向采样与推理成本评估：TQF推理要聚合多方向信息。上线前就要给出 SLA：例如单次推理 200 个方向、耗时上限、批量预测窗口。
把“分布”接到决策器：别停在可视化层。
- 补货：从“点预测+安全库存”升级为“概率约束补货”
- 调拨：用“联合上尾概率”触发调拨与锁仓策略
监控不确定性是否可信（校准）：供应链最怕“区间很漂亮但不准”。必须做回测：P90 是否真的覆盖了 90% 的真实结果。

常见问题（团队评审时一定会问）

Q1：我们用分位数回归/分位数森林就够了，为什么还要多变量？

A：如果你的决策只依赖单一指标，确实够。但只要你做的是“多仓协同”“多指标约束”，拆成单变量会丢掉相关结构，导致联合风险被低估。

Q2：多变量分布重建会不会太复杂，维护成本太高？

A：复杂度主要在推理端的方向聚合与重建。工程上可以通过方向数量、批量化推理、缓存特征来控成本。相对训练 200 套模型，TQF“一套模型覆盖全方向”的思路反而更利于维护。

Q3：这类方法对数据量要求高吗？

A：多变量学习确实更吃数据，但供应链数据有优势：按天/小时、按仓/线路/承运商切片后样本量很快起来。关键是特征治理和标签对齐（例如 ETA 的真实到达时间与事件延迟标签）。

你应该从哪一步开始：把“不确定性”变成可销售的能力

预测做得再准，如果不能解释风险、不能驱动动作，业务很难为它买单。TQF带来的启发是：把模型输出从“一个数字”升级为“一个可用于约束和优化的分布”，供应链决策才会更稳、更可控。

如果你正在推进 AI 预测平台、智能补货、运输时效风控，建议先做一个 4-6 周的小试点：选一个多仓品类或一条高波动线路，把多变量不确定性输出接到补货/调度策略里，用回测证明“风险真的被压住了”。这往往就是生成高质量线索（LEADS）的最佳入口：你不是在卖模型，而是在卖“可量化的风险收益”。

接下来一个值得继续追问的问题是：当你能得到联合分布后，你的供应链策略，是继续用经验规则，还是把它升级为真正的概率约束优化？