KAN-Matrix用PKAN与MKAN把供应链非线性关系“画出来”。用于特征筛选、冗余分析与模型解释,让需求预测、ETA与产能优化更可落地。
用KAN-Matrix看懂供应链非线性:从相关性到可解释决策
旺季一到,很多供应链团队会同时遇到两件事:数据变多了,解释却更难了。你用皮尔逊相关系数看“促销力度”和“缺货率”,可能几乎没相关;但业务同事一句话点破:促销到一定阈值才会触发抢购,仓配跟不上就开始缺货——这就是典型的非线性关系,靠线性相关很容易“看不见”。
2025-12,arXiv 上一篇新论文提出了 KAN-Matrix(基于 Kolmogorov-Arnold Networks, KAN 的矩阵化可视化方法),给了我一个很务实的感受:它不是在“把模型变得更复杂”,而是在把复杂关系画出来、讲清楚。论文里提供两类矩阵:PKAN(成对关系矩阵)和MKAN(多变量贡献矩阵),主打用颜色编码的方式展示变量间的非线性结构,并把它用在特征筛选、冗余分析和模型解释上。
这篇文章放在「人工智能在科研与创新平台」系列里,我们把它翻译成供应链语言:如何用可视化的非线性贡献分析,让路径优化、需求预测、库存策略不再是“黑箱调参”,而是可解释、可复用的决策流程。
相关性分析在供应链里为什么经常失灵
结论先说:供应链问题常见“阈值效应、饱和效应、交互效应”,线性相关只看得到其中一小部分。
供应链数据里最典型的三类“相关性陷阱”是:
- 阈值效应:
- 例:当订单量低于某阈值,分拣节拍稳定;超过后,拥堵导致单位订单时长突然上升。
- 饱和效应:
- 例:增加骑手/车辆数量在早期明显降低时效,接近产能上限后收益递减。
- 变量共线(强相关但含义不同):
- 例:
订单量、拣选行数、SKU数高度共线;你想预测出库时长时,很容易把冗余变量一起喂给模型,导致解释混乱。
- 例:
很多团队会用两招解决:要么继续堆模型(更深的网络、更强的集成),要么强行降维(PCA 之类)。问题是:你得到的可能是更好的分数,但更差的理解。而供应链的难点往往不在“预测”,而在“能不能把预测变成动作”。
KAN-Matrix 的价值就在这里:它用 KAN 的结构把非线性关系显式化,再用矩阵可视化把“可解释”做成工作流的一部分。
KAN-Matrix是什么:PKAN看关系,MKAN看贡献
一句话:PKAN 用来画出每对变量的非线性关联形状;MKAN 用来给多变量模型做“非线性版特征重要性排名”。
论文把 KAN 用作可解释建模的基础,然后构建了两种可视化矩阵:
PKAN:Pairwise KAN Matrix(成对非线性关系地图)
PKAN 的作用是:把“变量A对变量B的关系”从一个数字(相关系数)变成一条函数形状。
在供应链里,我更愿意把 PKAN当作“关系排雷图”:
- 你能快速发现:
订单密度vs晚到率是不是 S 型(超过阈值急剧恶化)库存周转vs缺货率是不是 U 型(太低缺货、太高积压,存在最优区间)站点覆盖半径vs单均配送成本是否存在拐点(规模效应与距离成本的拉扯)
更关键的是:它对非线性更敏感,并且能在变量共线的背景下提供更“像业务规律”的结构线索。
MKAN:Multivariate KAN Contribution Matrix(多变量贡献矩阵)
MKAN 的作用是:在预测某个目标变量时,量化各输入变量的相对贡献,并保留非线性特征。
如果你做过供应链需求预测或 ETA 模型解释,你会知道“特征重要性”常常尴尬:
- 线性模型的重要性好解释,但往往不够准
- 树模型/深度模型更准,但重要性排序不稳定、解释经常被质疑
MKAN 的定位更像是:用 KAN 的结构做一套“可视化的非线性特征排序工具”。它能辅助:
- 特征选择:去掉贡献低、且与其他变量高度冗余的特征
- 冗余分析:识别“看似重要但其实是别的变量的影子”的特征
- 模型后解释:给业务侧一个更接近规律的说法,而不是一句“模型就是这么算的”
我很认同论文的一个隐含立场:与其争论“哪个模型更强”,不如先把变量关系看清楚,模型自然更稳。
把KAN-Matrix落到物流与供应链:三类高ROI场景
答案很直接:凡是你怀疑存在阈值/拐点/交互效应的场景,KAN-Matrix都值得用来做“可解释预诊断”。
1)路径优化与时效:找出“拥堵触发点”和关键交互
路径优化不只看距离,还看拥堵、装卸效率、路况波动、波峰波谷。
- 用 PKAN 看:
线路停靠点数与准点率是否在某点后断崖式下降装载率与平均配送时长是否出现反向拐点(过载导致装卸变慢)
- 用 MKAN 看:
- 预测
到站时刻偏差时,天气、路况指数、站点排队长度、司机熟练度谁贡献更大 - 识别交互:比如“同样的路况指数,在雨天影响更大”这类结构更容易浮出水面
- 预测
落地动作会更具体:你不是“建议少停靠”,而是“停靠点超过12个后准点率显著变差,建议按区域拆分线路或引入中继仓”。这种建议更容易变成 SOP。
2)需求预测与补货:识别促销阈值、价格弹性非线性
需求预测的难点常常不是模型,而是“变量关系被误读”。
- PKAN 能帮你画出:
折扣率与销量是否存在平台期(折扣继续加大但销量不再涨)曝光与转化是否存在饱和
- MKAN 能帮你排序:
- 对
未来7天销量的贡献中,历史销量、活动强度、竞品价格差、缺货历史谁更关键
- 对
我建议把它用作“预测前的变量体检”:先用 PKAN/MKAN把关系理清,再决定是用时间序列、树模型还是深度模型。很多时候你会发现:与其再加一层网络,不如把几个冗余特征删掉、把阈值特征显式化。
3)仓内效率与产能:用非线性贡献做“产能瓶颈定位”
仓内系统常见一个现象:KPI 之间互相打架。
波次大小增大会提升拣选效率,但可能拉高集货拥堵人员排班增加会降低积压,但可能造成闲置
用 KAN-Matrix 的思路,你可以:
- PKAN:找到
入库节拍与待上架积压的拐点(何时开始堆积) - MKAN:对
出库周期建模,量化上架时延、拣选距离、复核台占用、打包工位数的贡献
最终目标不是做一张好看的图,而是形成“瓶颈解释模板”:当出库周期变差时,先看哪几个变量的贡献上升,再决定是调人、调波次还是调库位策略。
实施路线:把PKAN/MKAN变成供应链“解释层”
最实用的做法是:把 KAN-Matrix 放在建模流程的前后各一次——前面用于筛特征,后面用于解释与复盘。
第一步:定义目标与变量字典(别跳过)
供应链里同名字段常常含义不同。我的习惯是先定清:
- 目标变量:如
晚到率、缺货率、单均成本、订单履约时长 - 输入变量:统一口径、时间粒度、滞后项(T-1、T-7)、异常值规则
第二步:用PKAN做“关系盘点”
你要的不是“所有变量都画一遍”,而是带着问题画:
- 哪些变量可能存在阈值?(产能、负载、排队长度)
- 哪些变量可能有最优区间?(库存、覆盖半径、波次大小)
- 哪些变量可能与目标存在非单调关系?
输出物建议固定成两类:
- Top 关系对清单:最强的若干对非线性关系(含形状描述)
- 冗余候选清单:彼此高度相关/形状相似的一组变量,用于后续压缩特征
第三步:用MKAN做特征排序与冗余消解
把 MKAN 当作“进入生产前的特征治理”:
- 保留高贡献、低冗余的特征
- 对高贡献但高度共线的特征做选择(只留一个,或做业务合成特征)
- 对贡献低但业务强相关的特征,反而要复查数据质量(是不是埋点口径错了)
第四步:把矩阵结果写进复盘机制
供应链 AI 最怕“模型一上线就没人信”。解决办法不是写更长的技术文档,而是:
- 每次策略调整/模型迭代,固定产出一页:
- 贡献变化最大的 3 个变量
- 新出现的阈值/拐点
- 对应的业务动作与验证计划
这样做久了,你会得到一份“系统规律档案”,这正是「人工智能在科研与创新平台」强调的能力:让模型服务于知识沉淀,而不是一次性预测。
常见问题:团队会卡在哪
答案很现实:卡在数据口径、非平稳、以及把“图”误当“因果”。
-
PKAN/MKAN能证明因果吗? 不能。它们更像高效的“规律探测器”。要做因果,需要实验设计、工具变量或自然实验等方法。
-
时间序列的非平稳怎么办? 供应链旺季/淡季切换时,关系会漂移。建议按场景分段建模:
- 大促期 vs 常态期
- 城市分层(超一线/二三线)
- 站点规模分层
-
高维变量很多,矩阵会不会太大? 会。所以要先做变量治理:合并同义指标、删除明显冗余、按业务链路分组(需求侧、仓内、运输、末端)。矩阵不是越大越好,越能回答问题越好。
把非线性“看见”,供应链决策就更敢下手
KAN-Matrix(PKAN 与 MKAN)给供应链团队一个很清晰的方向:先把非线性关系和多变量贡献讲明白,再谈模型上线与策略自动化。我见过太多项目卡在“模型分数不错,但业务不敢用”;而一旦你能指出拐点、阈值和关键变量贡献,推进速度会明显快。
如果你正在做需求预测、ETA、仓内产能优化或成本归因,我建议把 KAN-Matrix 当作“解释层”加入流程:先用它筛特征、找冗余,再用它做上线后的复盘解释。你会发现,很多争论(到底是人手问题还是波次问题)会变成可验证的假设。
接下来一个更值得思考的问题是:当你把这些非线性规律沉淀为可视化资产后,你的供应链是否能从“经验驱动”真正转为“规律驱动”?
想把这种“非线性可解释分析”落到你的物流与供应链数据上?可以从一个小场景开始:选一个目标 KPI(如晚到率),做一次 PKAN 关系盘点 + MKAN 贡献排序,用一周时间跑完“发现—解释—动作—验证”的闭环。