自动驾驶 AI：Tesla 与中国车企的发展路径对比•2025年12月31日•By 3L3C

Waymo校车事件说明：自动驾驶的短板常在强规则场景的决策与验证。用软件更新、强规则护栏与数据闭环，才能同时提升安全与用户体验。

WaymoRobotaxiNHTSA安全合规软件更新用户体验

Featured image for 自动驾驶遇到校车：Waymo事件暴露AI决策与体验短板

自动驾驶遇到校车：Waymo事件暴露AI决策与体验短板

美国监管机构近期多次向 Waymo 了解一类“看上去不该发生”的场景：无人出租车在奥斯汀多次从停靠校车旁驶过。这类事件之所以刺眼，是因为校车的规则并不复杂——很多地区要求车辆在校车停车、警示灯闪烁、停止标志展开时必须停车等待。复杂的是：现实道路里，灯光、角度、遮挡、反光、施工、临停车辆、道路标线缺失，会把“简单规则”变成AI 的高风险边界条件。

Waymo 表示已向车队推送软件更新以改善表现；而监管机构早在 10 月就因其在校车场景的表现展开调查。这条新闻不只是监管与公关的拉锯，它更像一面镜子：自动驾驶的安全，很大一部分是软件更新迭代出来的；用户体验，也是在这些更新里被重新定义的。

放到我们“自动驾驶 AI：Tesla 与中国车企的发展路径对比”系列里看，这个案例很适合用来讨论一件常被忽略的事：AI 在车里的应用不只有“开得像人”，更关键的是“在关键规则上比人更守规矩”。校车，就是典型的“规则刚性 + 后果极重”的场景。

1) 这类事件的核心，不是感知失灵，而是“行为决策”缺口

答案先说：校车场景的难点往往在“该不该停、停多久、何时可以走”的决策，而不仅是看没看到校车。

很多人第一反应是“摄像头没识别到校车”，但在真实系统里，更常见的麻烦是：

识别到了校车，却对“校车是否处于需要全车道停车的状态”判断不稳（停止臂是否展开、警示灯模式、车身角度）。
识别到了停止臂，却对“我所在车道/对向车道是否必须停车”在不同道路形态下逻辑不一致（是否有隔离带、是否为双向多车道）。
识别与规则都没问题，但行为规划为了保证通行效率选择了“缓慢通过”“绕行贴边”等策略，结果在法规或公众观感上都不可接受。

这里的关键是：自动驾驶不是“看见—就刹车”这么粗暴。它是一个层层约束的系统：感知 → 预测 → 规划 → 控制。校车这种强约束对象，会把“规划层的取舍”暴露得非常明显。

规则型场景，最怕“概率化”

校车相关规则在很多地区属于强规则（hard rule）：宁可多停一会儿，也不能赌一次。AI 模型天生擅长在不确定性里做概率判断，但在强规则面前，“大概率没事”也等于不合格。

我更倾向于把这种问题定义为：系统对法规与安全策略的表达方式不够硬，导致模型在边界条件下出现了策略漂移。

2) 软件更新为什么能“救场”？因为它改的不止模型，还改策略与验证

答案先说：一次有效的软件更新，通常同时改三件事——识别阈值、行为策略、以及回归测试覆盖。

Waymo 提到“已推送软件更新改善表现”。对外一句话，对内往往是一整套工程动作：

规则约束上提：把“校车停车”从“可学习的经验”上提为“强约束状态机”，满足条件就必须停车，且具备最小等待时间、最大谨慎策略等。
边界条件补齐：补数据、补标签、补特征。例如：
- 不同角度的停止臂识别
- 夜间闪灯反光
- 校车临停但停止臂未展开的灰区
仿真回归加严：把真实事件复盘成可复现的仿真用例，加入持续回归（每次发布必须过）。

“更新即治理”：自动驾驶的安全能力是被运营出来的

传统汽车安全更多依赖机械可靠性与法规测试；而自动驾驶更像云服务：上线后仍然在学习、修复、加护栏。这也是为什么监管会持续追问：当你把车当软件发版时，你的“变更管理”是否足够可审计？

对用户体验来说，更新也不是抽象的技术词，而是：

今天能否更早、更稳地识别校车并减速
是否避免突然急刹导致乘客不适
是否能在不妨碍校车周边交通的情况下安全停车

安全与体验在这里是同一件事：让乘客“感觉到你很守规矩”。

3) 校车是“边界条件之王”：它拷问的是端到端与多传感器路线的底层哲学

答案先说：校车这种强规则场景，天然更偏向“可解释、可约束”的系统；纯粹依赖端到端学习更容易在小概率状态上出错。

在本系列里我们一直在对比两条路线：

Tesla 端到端倾向：用大模型把感知到控制的链路尽可能学习化，依赖海量数据与持续训练。
中国车企常见的多传感器 + 多模块 + 供应商协同：激光雷达/毫米波/视觉融合，规划与规则引擎更模块化，强调安全冗余与可解释。

校车场景为什么具有代表性？因为它需要三类能力同时在线：

感知稳定：校车、停止臂、闪灯模式、周边儿童动态。
法规映射：道路结构（是否隔离）、所在车道关系、地方性规则差异。
强约束规划：宁可“保守、可预期”，也不要“聪明但冒险”。

端到端模型当然也能学会停车，但它面临一个天然挑战：强规则的覆盖率在真实数据里并不高（尤其是极端角度、极端天气、极端道路形态）。当训练数据不足时，模型可能在“看起来合理”的策略上产生偏差。

相反，模块化方案可以把“校车停车”写成更硬的策略：一旦识别可信度超过阈值，就触发强制停车逻辑，并用多传感器交叉确认降低漏检。

我的观点比较明确：**凡是“规则刚性 + 风险极高”的场景，都应该让规则比学习更靠前。**学习负责提升体验上限，规则负责兜底下限。

4) 监管为什么会反复追问？因为这是“可验证安全”的试金石

答案先说：监管关心的不是你有没有 AI，而是你能否证明“遇到校车就一定会做对”。

在自动驾驶商业化中，监管的逻辑很朴素：

你说系统很安全，证据是什么？
你说更新修复了，如何证明没有引入新问题？
你在不同城市扩张时，地方规则差异如何管理？

校车事件会被放大，是因为它满足三个条件：

公众可理解：普通人也知道“校车要停”。
风险极端：涉及儿童，容错率接近零。
可审计：事件容易复盘，容易形成明确对错。

给中国车企/供应链的现实启示：别把“合规”当最后一步

很多团队在做功能演示时，会优先跑通“顺畅跟车、变道超车”。但真正决定能不能规模落地的，常常是这些“麻烦的小规则”：校车、消防车、临时交通管制、施工人员手势、无保护左转等。

如果你的研发流程里，合规是“上牌前再补”，那就等着在线上被现实教育。

5) 把这个案例落到可执行：车企如何用AI把安全与体验一起做实

答案先说：用“强规则护栏 + 数据闭环 + 可观测指标”三件套，才能把校车这类场景从公关风险变成可控能力。

(1) 强规则护栏：把“必须停”写进系统底层

建议落地成明确的策略与状态机，而不是仅靠模型输出：

触发条件：校车识别 + 停止臂/闪灯状态 + 车道关系
行为：提前减速、平稳刹停、保持距离、禁止绕行
退出条件：停止臂收回/灯灭 + 周边行人清空 + 最小等待时间满足

一句话：**该保守时就保守，而且要“保守得一致”。**一致性本身就是用户体验。

(2) 数据闭环：把每一次“差点做错”都变成训练与回归

可以设立“校车事件管线”：

车端触发：识别到校车即上报片段（含隐私脱敏）
云端筛选：找出“策略异常/犹豫/绕行/急刹”片段
标注与合成：补标签、做仿真变体（角度/光照/遮挡）
回归门禁：新版本必须通过“校车用例集”

(3) 可观测指标：别只看“事故率”，要看“规则遵守率”

对外能讲清楚、对内能持续优化的指标，建议至少包括：

校车停车触发准确率（识别到应停场景时成功停车占比）
误停率（不该停却停，影响体验与交通）
提前减速距离分布（越稳定越可预期）
停车舒适度（纵向加速度峰值、急刹占比）

事故率很重要，但它太滞后。规则遵守率才是提前量。

一句“可被引用”的标准：自动驾驶想规模运营，必须把“高风险强规则场景”做成可审计的工程能力，而不是靠运气。

写给关心自动驾驶落地的人：2026会更像“软件运营战”

Waymo 在奥斯汀的校车事件提醒我们：自动驾驶的竞争，不只是在模型大小、算力多少、传感器多贵；更是在谁能把真实世界的边界条件收敛成稳定的产品体验。

放到 Tesla 与中国车企路径对比里，我更看好一种融合思路：**用学习把体验做顺，用规则把底线钉死，用更新把问题变少。**校车这种场景，是检验“底线能力”的最好尺子。

如果你正在评估自动驾驶方案、规划 Robotaxi 运营，或者搭建座舱与行车体验指标体系，我建议从一个反直觉的清单开始：先把最难堪的边界条件（校车、急救车辆、临时交管）逐个做成“强约束可验证”的模块，再谈规模化与体验上限。更快，也更稳。

下一步值得追问的是：当 2026 年更多城市开始对自动驾驶提出可审计要求，你的系统能否用一份清晰的更新记录和指标曲线证明——它确实在变得更安全？