人工智能在半导体与芯片设计•2026年2月12日•By 3L3C

英伟达-OpenAI千亿美元意向未落地，暴露推理成本与供应链风险。对比特斯拉垂直整合路线，拆解车企AI战略的关键差异。

AI基础设施推理芯片智能驾驶半导体Dojo异构计算

Featured image for 英伟达-OpenAI千亿美元“爽约”：特斯拉AI路径为何更稳

英伟达-OpenAI千亿美元“爽约”：特斯拉AI路径为何更稳

2025-09，一纸“最高1000亿美元”的意向书，把英伟达与OpenAI的AI基础设施叙事推到顶点：10GW算力系统、耗电量相当于约10座核反应堆。到2026-02，这个数字却被英伟达CEO黄仁勋公开淡化为“从未承诺”，交易也迟迟未落地。更微妙的是，路透社还披露OpenAI从去年起就在悄悄寻找英伟达GPU之外的推理芯片替代方案。

这件事之所以值得写一篇，不是为了八卦“谁打了谁的脸”，而是因为它把一个现实摆在所有做AI的公司面前：当AI进入“推理为王、成本敏感、供电受限”的阶段，单纯靠堆GPU、靠大额绑定式合作，很容易在执行层面走形。而这恰好能作为镜子，照出特斯拉与中国汽车品牌在AI战略上的核心差异：一个更偏向垂直整合与软件闭环，另一个更常见的是横向采购与生态拼装。

一句话立场：大额合作的新闻很好看，但AI真正的护城河在“数据-算法-芯片-工程化”的闭环里，而不是在融资口径里。

1) “千亿美元”消失的本质：意向书不是执行力

先把事实讲清楚：英伟达与OpenAI在2025-09公布的是Letter of Intent（意向书），不是具备约束力的合同。意向书的作用通常是：定调合作方向、稳定市场预期、为后续融资与供应链协调争取时间。但它也有天然缺陷——可撤回、可改口、可延迟。

这次“爽约感”来自两个变化叠加：

口径回撤：黄仁勋在2026-01末公开强调“1000亿美元从未是承诺”，投资将“一步一步来”。
技术与路线分歧浮出水面：路透社称OpenAI对部分英伟达芯片在**推理（inference）**任务上的速度不满意，问题在其代码生成工具Codex的体验上更明显。

这里的关键点是：训练（training）和推理是两门生意。

训练GPU神话，挡不住推理的“成本会计”

训练阶段可以容忍昂贵硬件与高功耗，因为它更像“建工厂”：一次性投入，产出模型能力。而推理阶段更像“开连锁店”：每一次用户请求都要付电费、折旧、运维与延迟成本。

当OpenAI开始对推理延迟、单位token成本、能效比更敏感时，它天然会：

引入专用推理芯片（如Cerebras、Groq这类主打低延迟路线的厂商）；
与第二供应商合作（如AMD）；
甚至走向自研/定制ASIC（与博通合作的方向）。

这不是“背叛”，而是推理规模化后的必然。

2) 供应链与资本的“循环投资”，为什么会让市场不安

原文里提到一个尖锐观察：英伟达投资某些AI公司，而这些公司又用融资去买英伟达GPU，形成“钱转一圈又回到英伟达”的结构。站在短期财务角度，这能拉动出货、稳定生态；但站在长期风险角度，它会带来三层不确定性：

需求真实性：如果下游商业化不成立，买GPU的“需求”只是融资驱动。
议价权变化：当客户规模足够大，会反过来要求更定制化、更低成本、更可控的供给。
技术路线漂移：推理场景分化后，GPU不再是唯一答案，异构加速器会抬头。

市场不喜欢不确定性。尤其在2026年，AI基础设施已经从“讲故事阶段”进入“算账阶段”：

电力与机房指标成为瓶颈（10GW这种规模，落到任何国家都要过电网、审批、散热与土地）。
单位推理成本成为竞争点（谁能把每次交互成本压下去，谁就能把产品价格打下来）。

3) 用这面镜子看特斯拉：为什么它不需要千亿美元绑定

把视角切到汽车行业，你会发现特斯拉的AI策略几乎是反着来的：少讲绑定式投资，多做垂直整合。它的核心目标不是“成为GPU最大客户”，而是“把自动驾驶与具身智能的闭环跑通”。

特斯拉的三段式闭环：数据、训练、部署

特斯拉在AI上有一个很清晰的工程路径：

数据闭环：车队规模带来持续、真实的道路数据；数据分布变化能迅速反馈到模型迭代。
训练系统自控：从Dojo到GPU集群的混合策略，本质是把训练成本与吞吐控制权抓在自己手里。
部署极致化：车端推理必须在功耗、成本、可靠性约束下运行，这逼着它把模型做小、做快、做稳。

这套逻辑与“签一个大合作、堆一个大数据中心”最大的区别在于：每一块算力都能直接映射到产品体验与交付指标，不是映射到融资故事。

可引用的一句话：汽车AI的胜负手，不在训练榜单上，而在车端推理的成本、延迟与故障率上。

4) 再看中国汽车品牌：更像“横向拼装”，但正在分化

中国车企在过去两年普遍走的是“快”字诀：

通过采购GPU云、合作大模型、引入供应商算法栈，快速把城市NOA、座舱大模型、语音助手做出来；
用更高频的车型迭代与更激进的定价，抢市场窗口。

这条路能快速起量，但会遇到两类天花板：

天花板A：推理成本与算力账单

当功能从“演示可用”走向“全量交付”，推理成本会从后台悄悄吃掉毛利。

车端算力不足 → 需要更贵的域控/更高功耗
云端兜底更多 → 需要更大的带宽与持续的云推理成本

天花板B：供应链依赖与迭代节奏

当模型升级、算子优化、编译器适配、芯片供货被多方牵制，迭代节奏会被外部变量决定。你会看到一些品牌“功能上线慢半拍”，根子往往不在团队不努力，而在横向依赖太多。

当然，中国车企也在分化：头部品牌正在加大自研比例，尤其在数据治理、仿真、端侧模型、芯片适配上投入更深。这也正好呼应我们系列主题“人工智能在半导体与芯片设计”：未来差距不只在模型，更在算子-编译器-芯片-系统的协同。

5) 给做AI与做车的人：三条可落地的决策清单

如果你负责AI战略或智能驾驶/座舱的技术路线，我建议用这三条把“热闹合作”转成“可执行计划”。

5.1 把“训练规模”指标换成“推理单次成本”指标

具体做法：

统一口径计算：每1000次交互/每公里行驶的推理成本（含折旧、电费、运维）。
将延迟指标拆开：P50/P95端到端延迟，而不是平均值。

这是从“发布会指标”回到“经营指标”。

5.2 采用异构算力，但别把系统复杂度外包

可以多供应商，但必须自己掌控：

模型的算子分解与量化策略
编译与部署管线（如针对不同NPU/GPU的编译优化）
A/B与灰度发布机制

否则你会得到一堆“能跑”的demo，却得不到“可规模交付”的系统。

5.3 把半导体协同前移：从采购到共同定义

与其等芯片出来再适配，不如在早期共同定义：

目标工作负载（workload）：推理占比、稀疏性、KV cache、视频多流输入等
关键算子：attention、卷积/时序融合、BEV相关算子
能耗与温度约束：车规环境下的持续功耗曲线

这就是“人工智能加速芯片设计验证、制程优化和良率提升”的落点：工作负载明确，验证才有靶心；靶心明确，良率与成本才可控。

结尾：别被“最大数字”带偏，真正的差距在闭环

英伟达与OpenAI的“1000亿美元消失”，更像一记提醒：AI基础设施不是比谁承诺更大，而是比谁能把算力变成稳定、可复制、可盈利的产品能力。对汽车行业来说，这种提醒更直接——因为车端推理天然受限，任何“算力浪费”都会变成成本与体验问题。

我更看好特斯拉式的路线：以垂直整合确保迭代速度，以软件与数据闭环降低长期推理成本。中国汽车品牌如果想在下一阶段拉开差距，也必须从“拼资源”转向“建闭环”，特别是在端侧推理、编译优化、芯片协同与工程化交付上。

如果你正在评估自研与合作的边界、或者想把智能驾驶/座舱的推理成本压下来，我建议先问团队一个更硬的问题：你们的AI闭环里，哪一段是别人一断供就会停摆的？