TQF(断层分位数森林)把多变量不确定性预测落到供应链:联合需求、时效与成本风险可量化、可决策,适合做预测与风控试点。
用TQF做多变量不确定性预测:让供应链决策更稳
12 月往往是一年里供应链最“紧”的时候:促销余波还没消,春节备货又开始提速,仓网、干线、末端的任何一个小波动,都可能被放大成缺货、爆仓或高价加急。多数企业其实不是“预测不准”,而是只给了一个点预测,却没把风险范围讲清楚。当你同时要预测“需求量 + 退货率 + 到货时效 + 多仓库存变化”,单点数字几乎注定会误导决策。
这也是为什么 2025-12-19 在机器学习领域引起讨论的一篇新论文——Tomographic Quantile Forests(TQF,断层分位数森林)——对物流与供应链很有价值。它的核心不是再做一个更强的回归器,而是解决一个更现实的问题:多维目标(multivariate targets)的不确定性量化。简单说,它能告诉你“可能发生什么”和“发生到什么程度”,而不仅是“最可能是多少”。
作为「人工智能在科研与创新平台」系列的一篇,我更关心的是:这种研究型方法,怎么落到供应链预测与风控里,变成能推动业务拿线索(LEADS)的解决方案。
多变量不确定性量化:供应链预测里最常被低估的一环
直接结论:供应链的关键预测几乎都是多变量问题,单变量置信区间不够用。
在真实运营里,你很少只预测一个数。更常见的是一组彼此关联的指标:
- 同一 SKU 在多渠道/多区域的需求联动(“A 城涨了,B 城往往也涨”)
- 需求与价格、促销强度的耦合(“降价带来销量上涨,但波动也更大”)
- 到货时效与运力、天气、拥堵的相关性(“晚到的时候往往还伴随更高的破损率/退货率”)
- 库存、缺货率、履约成本的联动(“缺货少了,可能是因为你付了更贵的加急费”)
很多团队会把这些拆成多个模型,各自输出均值和区间,再“拼在一起”。问题是:拼出来的联合风险常常是假的。你可能得到了每个指标都“很安全”的区间,但当它们同时偏离时,系统风险反而更大。
一句话很适合做团队共识:
供应链的风险不是某个变量的波动,而是多变量一起偏离时的连锁反应。
TQF到底做了什么:用“方向投影”把多维不确定性变成可学的分位数
直接结论:TQF把多维输出的分布学习,拆解成很多“方向上的一维分位数学习”,再把这些方向信息重建回多维分布。
论文里的设定是:输入是特征 (\mathbf{x})(比如时间、价格、促销、天气、产能、上游交期等),输出是多维目标 (\mathbf{y})(比如多个仓的需求向量,或“需求/退货/时效”等组成的向量)。
传统的分位数回归/分位数森林擅长做一维目标:给你 P50、P90 之类的分位数。但 (\mathbf{y}) 是多维时,“直接学条件分布”会变得很难。
TQF用了一种很工程化也很聪明的思路:
1)先把多维目标投影到很多个方向
选一个单位方向向量 (\mathbf{n}),把输出投影成一个标量:(\mathbf{n}^\top \mathbf{y})。
这一步的直觉:你可以把“多仓需求向量”从不同角度去看,每个角度都是一个一维随机变量。一维分位数我们会学,多维难点先绕开。
2)用一棵“同时看x和方向n”的树模型学分位数
论文强调的一点是:很多方向分位数方法需要“每个方向训练一个模型”,成本高、难维护。TQF把方向 (\mathbf{n}) 也作为输入的一部分,让模型覆盖所有方向。
对供应链团队来说,这个优点很务实:
- 你不需要为 200 个方向维护 200 套模型与监控
- 更容易做 MLOps:一套训练、版本、回滚、告警体系
3)推理时,把很多方向的分位数“拼回”多维分布
论文用**sliced Wasserstein distance(切片 Wasserstein 距离)**来度量“方向切片上的分布差异”,再通过一个高效的交替优化方案重建联合分布。你不需要在业务侧理解全部数学细节,但要抓住结果:
- 输出不只是一个“椭圆形/凸的置信区域”(许多方向分位数方法会受凸性限制)
- 可以得到更贴近真实的、形状更灵活的风险区域
这点对供应链很关键,因为真实分布经常是偏态、多峰的:比如“平时平稳 + 大促爆发 + 极端天气的尾部风险”。
把TQF放进供应链:3个高价值用例(需求、时效、库存联动)
直接结论:TQF最适合用于“要同时预测多个指标,并且要把置信范围用于决策”的场景。
用例一:多仓/多区域需求联合预测,用于补货与调拨
常见做法是对每个仓单独预测需求,然后按安全库存公式加 buffer。问题在于:
- 仓与仓之间需求相关,尤其是同城多仓、同线路的替代效应
- 促销/短缺会造成跨仓吸收与迁移
用TQF你可以直接预测一个多维需求向量的条件分布,从而回答更贴近决策的问题:
- “华东三仓合计需求超过 12 万件的概率是多少?”
- “在 P90 风险下,应该把调拨阈值设到多少,才能把缺货风险压到 5%?”
用例二:到货时效 + 破损/退货的联动风控
很多企业把 ETA(预计到达时间)做得越来越准,但晚到往往不是孤立事件:晚到时破损、投诉、退货也可能同步上升。
TQF这类多变量不确定性模型适合做:
- 同时输出“时效分布 + 退货率分布 + 波动的相关结构”
- 把“尾部情形”显式暴露给运营(比如 P95 的极端路径)
运营侧的动作也更清晰:
- 当模型提示“晚到与退货共同上尾”时,优先做线路切换/包材加固/客服预案
用例三:库存-缺货-履约成本的多目标风险预算
库存优化经常被做成一个确定性问题:给定预测需求,算一个最优补货。真正让利润波动的,是不确定性下的多目标权衡。
如果你能得到联合分布,就可以更自然地做“风险预算”:
- 允许缺货率不超过 2% 的同时,让履约成本的 P90 不超过某个阈值
- 用“概率约束”表达服务水平,而不是拍脑袋加安全系数
一句很实用的观点:
安全库存不是一个常数,而是一种对尾部风险的定价。
落地路线:从科研方法到可上线的预测与风控组件
直接结论:先用“小范围、多变量、强决策耦合”的场景试点,比全域替换更稳。
我建议的落地步骤(也方便你和供应链/数据团队对齐):
- 选对多变量目标:优先选“天然联动且会驱动动作”的变量组,例如(多仓需求向量)、(ETA+延误概率+退货率)。
- 定义可执行的风险指标:不要只看 CRPS/Pinball loss 等学术指标,增加业务指标:
- 缺货率(按 SKU-仓-日)
- 过量库存天数
- 加急运输费用
- 服务水平(OTIF)
- 方向采样与推理成本评估:TQF推理要聚合多方向信息。上线前就要给出 SLA:例如单次推理 200 个方向、耗时上限、批量预测窗口。
- 把“分布”接到决策器:别停在可视化层。
- 补货:从“点预测+安全库存”升级为“概率约束补货”
- 调拨:用“联合上尾概率”触发调拨与锁仓策略
- 监控不确定性是否可信(校准):供应链最怕“区间很漂亮但不准”。必须做回测:P90 是否真的覆盖了 90% 的真实结果。
常见问题(团队评审时一定会问)
Q1:我们用分位数回归/分位数森林就够了,为什么还要多变量?
A:如果你的决策只依赖单一指标,确实够。但只要你做的是“多仓协同”“多指标约束”,拆成单变量会丢掉相关结构,导致联合风险被低估。
Q2:多变量分布重建会不会太复杂,维护成本太高?
A:复杂度主要在推理端的方向聚合与重建。工程上可以通过方向数量、批量化推理、缓存特征来控成本。相对训练 200 套模型,TQF“一套模型覆盖全方向”的思路反而更利于维护。
Q3:这类方法对数据量要求高吗?
A:多变量学习确实更吃数据,但供应链数据有优势:按天/小时、按仓/线路/承运商切片后样本量很快起来。关键是特征治理和标签对齐(例如 ETA 的真实到达时间与事件延迟标签)。
你应该从哪一步开始:把“不确定性”变成可销售的能力
预测做得再准,如果不能解释风险、不能驱动动作,业务很难为它买单。TQF带来的启发是:把模型输出从“一个数字”升级为“一个可用于约束和优化的分布”,供应链决策才会更稳、更可控。
如果你正在推进 AI 预测平台、智能补货、运输时效风控,建议先做一个 4-6 周的小试点:选一个多仓品类或一条高波动线路,把多变量不确定性输出接到补货/调度策略里,用回测证明“风险真的被压住了”。这往往就是生成高质量线索(LEADS)的最佳入口:你不是在卖模型,而是在卖“可量化的风险收益”。
接下来一个值得继续追问的问题是:当你能得到联合分布后,你的供应链策略,是继续用经验规则,还是把它升级为真正的概率约束优化?