零飞行员 eVTOL 首飞背后:自动驾驶 AI 的安全与体验启示

自动驾驶 AI:Tesla 与中国车企的发展路径对比By 3L3C

Wisk 零飞行员 eVTOL 首飞把“可证明安全”推到台前。对比 Tesla 与中国车企路线,拆解自动驾驶 AI 的认证与用户体验关键。

eVTOL自动驾驶AI安全智能座舱航空认证Tesla中国车企
Share:

Featured image for 零飞行员 eVTOL 首飞背后:自动驾驶 AI 的安全与体验启示

零飞行员 eVTOL 首飞背后:自动驾驶 AI 的安全与体验启示

2025-12-16 12:26(PST),一架没有驾驶杆、没有脚蹬、也没有飞行员的载人 eVTOL 在美国加州 Hollister 离地。很多 eVTOL 的首飞早就不稀奇了,但这次不一样:Wisk Aero 的 Gen 6 被称为美国首个面向 FAA 型号认证的“自主载人 eVTOL 候选机型”

我更关注的点不是“飞起来了”,而是它把一个长期被误解的问题摆到台面上:越接近商业化,越不能把“AI 很聪明”当安全方案。Wisk 明确说自己的飞控“不是那种能实时解决未知问题的真 AI”,而是以逻辑规则与流程算法为主,再叠加一整套探测与避让(DAA)传感器与导航系统,目标做到接近民航级的超低故障概率。

这对我们这组系列文章《自动驾驶 AI:Tesla 与中国车企的发展路径对比》其实很有启发:天上的飞行出租车、地上的智能汽车,最后都会走向同一个现实——算法要过关、体验要可控、监管要能审计。差别只在于,航空把这些写进了“第一天就要面对的硬门槛”。

航空的“自主”更像工程控制,不像大模型

先给结论:Wisk 的自主飞行路线强调“可验证”和“可审计”,而不是“自我学习更强”。

从公开信息看,Gen 6 的飞控采用逻辑驱动、程序化的控制策略。它的价值在于:

  • 行为边界清晰:在什么条件下做什么动作,能被形式化描述。
  • 验证路径更短:更容易用测试用例覆盖,能跑大量仿真、台架与飞行测试。
  • 失效模式可枚举:航空监管最在意“你没想到的那一类失效”,规则系统更容易做系统级 FMEA/FTA(失效模式/故障树)分析。

这点和智能汽车行业里“端到端”热潮形成对比。端到端模型的优势是泛化能力强、体验流畅;但弱点同样明显:可解释性弱、边界难界定、回归测试复杂。你很难把一个神经网络的“想法”写成一条条审计友好的条款。

如果把它映射到我们的主题:

  • Tesla 更像“端到端能力优先”,用数据闭环持续迭代驾驶体验;
  • 许多中国车企更像“多传感器 + 多供应商 + 规则/学习混合”,强调可控、安全冗余与快速上车。

Wisk 的路径更接近后者:先把“能证明安全”做到极致,再谈规模化运营。

“多机监督员”机制:把自动化和人类责任重新分配

Wisk 的另一个关键设计是 Multi-Vehicle Supervisor(多机监督员):地面人员可以同时监督最多三架飞机,而不是每架飞机配一个飞行员。

这不是简单的“省人力”,而是在重新定义人类角色:

  • 人不再负责连续操控(手脚忙不过来、易疲劳),而是负责监督与介入决策
  • 系统必须提供高质量态势感知界面,让监督员在少量信息里快速判断;
  • 人机交接必须有明确的“可用时间窗口”和“最小必要操作”。

这件事放到汽车上,就是我们常说的 L2/L2+ 里最容易出事故的环节:接管

很多车企把“接管”当一句提示音,但航空的逻辑更严厉:如果你要让人介入,你就必须证明——

  1. 系统能提前多久发现异常;
  2. 人在多大负荷下仍能正确理解;
  3. 交接动作是否足够简单;
  4. 交接失败时是否仍有兜底。

汽车行业在 2026 年前后会越来越像航空:监管与媒体关注点会从“能不能自动开”,转向“在最糟糕的 0.1% 场景里,你怎么保证用户不做错”。

从认证逻辑看:自动驾驶 AI 需要“可证明的安全”

先给结论:航空认证的核心不是“跑得多聪明”,而是“风险被量化且可接受”。

Wisk 提到的目标是接近民航安全水平的超低失效概率(文章用“十亿分之一”来形容量级)。不管具体数字如何落地,它至少传达了航空思维:

  • 把风险写成概率与条件;
  • 把系统拆成可验证模块;
  • 用冗余与隔离把单点故障变成“可控故障”。

对汽车软件与自动驾驶 AI 来说,我认为接下来三件事会成为“硬通货”。

1)把“智能”拆成可审计模块,而不是一个黑盒

用户体验团队常常想要“更像人”的驾驶,但监管与安全团队更需要“更像系统”。更好的方式是做分层:

  • 感知层:多模态传感器融合(摄像头/毫米波/激光雷达等),输出可置信度量化的目标与车道;
  • 策略层:可以用学习模型增强,但要有边界与安全约束;
  • 控制层:尽量规则化、可验证,保证车辆动态稳定与可预测。

这也是很多中国车企“多传感器、多供应商协同方案”能快速落地的原因:它不追求单模型包打天下,而是追求系统工程上的可控。

2)把测试从“路测里程”升级到“场景覆盖率”

“跑了多少公里”越来越难说服人。更有效的指标是:

  • 高风险场景覆盖:施工改道、鬼探头、匝道汇入、弱光逆光、雨雪反光;
  • 交互场景覆盖:非机动车穿插、行人犹豫、对向车抢行;
  • 退化场景覆盖:传感器遮挡、定位漂移、地图缺失。

航空的优势在于它从一开始就高度依赖仿真与流程化测试。汽车行业也在快速靠拢:你会看到更多“场景库”“回归基准”“安全证据链”等词进入产品发布会。

3)把 OTA 当成“受控变更”,不是“随时上新”

我一直认为,OTA 是智能车最强的能力之一,但它也带来一个副作用:每次升级都可能改变安全边界

航空的变更管理非常严格,汽车行业也在补课。务实做法包括:

  • 安全相关功能与娱乐相关功能的软件隔离
  • 版本灰度的分群策略与可追溯回滚;
  • 关键功能升级前后的自动化回归测试与证据留存。

当智能驾驶从“功能卖点”变成“日常依赖”,用户最怕的不是“没新功能”,而是“今天突然变得不一样”。

用户体验:天上和地上都在争夺“安心感”

先给结论:自动化体验的胜负手不是炫技,而是让用户在关键时刻不紧张。

eVTOL 的乘客不是飞行员,他们要的是两件事:

  1. 我现在安全不安全?
  2. 如果出了问题,谁在负责?

智能汽车也一样。座舱屏幕上再多的动画与提示,如果不能回答这两件事,体验就是“信息噪音”。

给智能座舱团队的一个可抄作业清单

如果把 eVTOL 的“多机监督”映射到汽车的“人机共驾”,我建议优先打磨这些体验细节:

  • 状态表达统一:同一个状态不要在仪表、HUD、中控用三套说法。
  • 接管理由具体:不要只说“请接管”,要说“前方施工锥桶密集,视野受限”。
  • 最小化干预:接管动作越少越好,最好是“握方向盘 + 轻踩刹车”就能稳定退出。
  • 可回放的事件卡片:事后给用户一张“发生了什么”的简报,减少猜疑。

我见过不少项目把精力花在“拟人语音”“情绪化提示”,但用户真正买单的是确定性:系统不含糊、不耍小聪明、行为可预测。

Tesla 与中国车企:从 eVTOL 事件看两条路线的互补点

先给结论:端到端带来体验上限,系统工程带来商业下限;要规模化,最后一定会融合。

把 Wisk 这类航空自主系统当镜子,你会发现:

  • Tesla 的强项在于数据闭环、模型统一、体验一致性,类似“一个大脑管全身”;
  • 中国车企的强项在于生态整合、供应链协同、硬件冗余与本地化功能,类似“多系统协作、分工明确”。

而航空给汽车行业的最大提醒是:当你要进监管与规模化运营,系统必须能被证明安全,而不是被相信安全。

反过来,汽车也能教航空:

  • 如何做海量用户的产品化运营(客服、诊断、远程维护);
  • 如何把复杂系统体验做得“傻瓜化”(上车就会用);
  • 如何通过软件持续改进效率与舒适度。

2026 年开始,城市空中交通(UAM)如果真要在个别城市试运营,用户会用同一套标准看它:像一辆靠谱的智能车一样好用

写给产品负责人:把“AI 能力”翻译成可交付的指标

先给结论:别用“更智能”做目标,用“更可控、更可解释、更可回归”做目标。

如果你负责智能驾驶或智能座舱产品,我建议把需求写成下面这种“能验收”的语言:

  1. 接管提前量:在施工/汇入/遮挡类场景,最晚提前 X 秒提示接管。
  2. 误触发率:每 1000 km 误提示接管不超过 Y 次。
  3. 可解释输出:每次降级/退出给出明确原因分类(例如 10 类以内)。
  4. 回归基准:每次 OTA 对核心场景库(不少于 N 个场景)跑完自动化回归。
  5. 安全兜底:关键传感器失效时,系统进入最小风险状态的策略与触发条件明确。

这类指标看起来“不性感”,但它们直接决定你能不能把 AI 从演示变成日常。

下一步:天空的认证压力,会倒逼地面更务实

零飞行员 eVTOL 的首飞像一记提醒:真正困难的不是把自动化做出来,而是把自动化做成“可被监管、可被用户信任、可被规模化运营”的产品。

放在《自动驾驶 AI:Tesla 与中国车企的发展路径对比》的语境里,我的立场很明确:未来的赢家不是“端到端”或“多传感器”某一派,而是能把两者融合成一条证据链的人——既能把体验做得顺滑,也能把安全讲得明白、测得出来、审得过去。

接下来值得追的一件事是:当航空把“可证明安全”的方法论继续细化,汽车行业会不会把同样的门槛提前到 L3/L4 的量产之前?如果会,我们的智能驾驶产品路线、供应链协同方式,以及用户体验设计,都会被迫更成熟。