Waymo在费城等城市开启自动驾驶测试,真正考验的是城市级软件与用户体验。本文拆解Robotaxi扩张背后的AI栈与运营逻辑。

Waymo入局费城:机器人出租车如何打磨城市级用户体验
2025 年的最后一周,自动驾驶行业最现实的信号不是发布会上的新概念,而是“又多了一座城市”。Waymo 开始在费城进行自动驾驶测试,同时把巴尔的摩、匹兹堡、圣路易斯也拉进了它的城市清单。这类扩张看起来像运营动作,实际更像一次“城市级软件验收”:同一套 AI 驾驶系统与车队运营软件,放到不同道路规则、不同驾驶风格、不同天气与路况中,能否稳定地把乘客从 A 点送到 B 点。
这件事对汽车软件与用户体验(UX)的人尤其重要。机器人出租车的竞争,本质上不是“车更聪明”这么简单,而是AI + 车端软件 + 云端调度 + 乘客端体验共同组成的一整套服务系统。很多公司在单车智能上做得很漂亮,但一进城就露馅:接驾时间不稳、绕路、上车点混乱、客服无法闭环,都会把“自动驾驶”变成一次糟糕的打车体验。
作为本系列《自动驾驶 AI:Tesla 与中国车企的发展路径对比》的其中一篇,我想借 Waymo 进入费城这条新闻,拆解一个更关键的问题:自动驾驶从“能开”到“能运营”,到底靠哪些 AI 能力在背后把用户体验磨出来?
为什么“进新城市”是对自动驾驶 AI 最残酷的考试
答案很直接:城市差异会把长尾问题放大,而长尾恰恰是自动驾驶的主战场。费城这类东海岸城市,道路形态往往更复杂:历史街区的窄路、非直角路口、临停密集、施工频繁、行人穿行更随机。对 AI 来说,这不是“多训练几条视频”就能解决的。
更重要的是,自动驾驶并不是在模拟器里跑分。它是“开进现实”,一切都要能解释、能复现、能持续优化:
- 感知的边界条件:逆光、雨雪、夜间眩光、车窗反射、遮挡行人等。
- 行为预测的文化差异:不同城市的驾驶风格、礼让习惯、加塞频率。
- 地图与规则的细粒度差异:临时交通管制、可变车道、学校路段时段规则。
- 运营层面的不可控:上下客点被占、道路临时封闭、活动散场潮汐流。
一句话:进城不是“复制粘贴”,而是把 AI 系统放到新的分布里重新做稳定性工程。
从“自动驾驶能力”到“乘客体验”:Waymo扩张背后的四层软件栈
答案先放在前面:机器人出租车的 UX 不是 UI 设计出来的,而是被软件栈“约束”出来的。Waymo 在多城推进测试,意味着它需要让四层能力一起达到可运营标准。
1)车端 AI:安全不是口号,而是可度量的系统指标
对乘客来说,“安全感”往往来自几个可感知的细节:刹车不突兀、并线不犹豫、路口不抢行。但这些体验背后对应的是算法系统的取舍。
我观察到一个行业共识:乘客更讨厌“吓人但没出事”的驾驶风格,而不是“稍慢一点”。因此在城市扩张阶段,很多车队会把策略调得更保守,这会牺牲部分通行效率,却能换来更高的乘坐接受度。
可度量的 UX 相关指标通常包括:
- 急刹次数(每百公里)
- 纵向加速度/横向加速度峰值与分布
- 让行/犹豫导致的“卡住”次数
- 非必要绕行里程
这些不是“体验部门”的 KPI,而是自动驾驶模型训练、规划与控制共同优化的目标函数。
2)车队运营 AI:接驾时间与上车点,决定了你会不会再用第二次
打车体验里最致命的并不是车开得慢,而是你在路边冻 8 分钟还找不到车。Waymo 进入费城,真正的难点之一是:如何在城市高密区域稳定地完成“找得到、停得下、上得去”。
这依赖车队层面的智能调度:
- 热区预测:根据历史需求、活动日历、天气与通勤潮汐进行供需预测。
- 动态派单:把“最近的车”改成“最合适的车”,兼顾电量、路况、车型、服务半径。
- 上下客点推荐:在复杂路段给出更安全、更不堵、更易识别的上车点。
乘客端看到的可能只是“上车点在路口东侧”,但背后是地图、实时路况、法规与车辆能力共同算出来的结果。
3)本地化与合规:城市不是一张地图,而是一套规则网络
自动驾驶进入新城市,合规工作量经常被低估。不同州、不同市对测试车、数据记录、事故报告、远程协助(remote assistance)等要求差异很大。
从软件角度看,这意味着:
- 规则引擎要能配置化,不能每次改代码
- 日志与回放系统要支持合规取证与内部复盘
- 远程协助的权限、触发条件、响应时延要“可审计”
这也是为什么同样是自动驾驶,有的公司更像互联网产品,有的更像安全关键系统(safety-critical system)。路线不同,组织能力也不同。
4)乘客体验(UX):AI 时代的“打车产品”,比你想的更像服务业
机器人出租车的 UX 不是“车里放一块大屏”就结束了。它更像一套服务闭环:
- 预期管理:告诉乘客为什么改上车点、为什么绕路、为何短暂停车
- 透明但不过度:给足安全感(例如可视化周边车辆/行人),但别把乘客变成副驾驶
- 异常处理:遇到封路、警察指挥、临停占道时,乘客端如何解释、如何改派、如何赔付
我比较认可的一句话是:自动驾驶的用户体验,80% 来自“问题发生时你怎么处理”。
Waymo的城市扩张,对比Tesla与中国车企路线:谁更擅长“规模化体验”?
先给结论:
- Waymo 代表的是“高确定性、重运营”的 Robotaxi 路线。
- Tesla 更像“端到端模型 + 车主自用规模”的扩散路线。
- 中国车企主流更偏“多传感器、多供应商协同 + 快速上车”的工程路线。
Waymo:重地图、重运营,把难题留给系统工程
Waymo 的优势在于它把“服务质量”放到第一位:固定运营区域(ODD)、车队可控、调度可控。它扩城慢一点,但每一步都更像把服务打磨到可复用。
对应到软件与 UX:它能把体验指标做成运营指标,例如接驾时长、取消率、投诉率、异常处理时长。
Tesla:端到端的野心在“泛化”,但体验一致性更难约束
Tesla 走的是规模与数据闭环:大量车主场景、快速迭代模型。优点是泛化能力一旦成熟,扩区域速度会非常快;挑战是不同驾驶风格与风险偏好会被放大,尤其在“服务型出行”里,乘客容忍度更低。
一句更直白的话:车主可能愿意适应车,但乘客不会。
中国车企:多传感器与供应商协同,强在落地速度,弱在体验统一
中国车企在城区 NOA、记忆泊车、车位到车位等功能上推进很快,背后常见是多传感器(激光雷达/毫米波/摄像头)+ 多算法供应商协作。优势是工程落地效率高;难点在于软件架构与数据闭环链路复杂,跨城市/跨车型的一致体验更难统一。
这也解释了为什么“用户体验”会成为下一阶段的分水岭:不是能不能用,而是不同城市、不同车型、不同版本还能不能保持同样好用。
车企与出行平台能从Waymo学到的三件实操事
答案先说:把“自动驾驶能力”当产品卖,会陷入演示思维;把它当服务交付,才会把体验做扎实。
- 用服务指标倒逼算法指标:把急刹、犹豫、绕路、接驾时长变成核心指标,直接进入版本发布门槛。
- 把本地化做成平台能力:规则、地图、上车点、禁停区等必须配置化,支持灰度与快速回滚。
- 为异常场景设计 UX:封路、临检、活动散场、暴雪天气这些不是“少数情况”,而是决定口碑的关键时刻。
可复制的一条经验:越是自动化的系统,越要在人机协同上做“清晰且克制”的解释。
常见追问:费城测试意味着Waymo很快商业化运营吗?
更合理的判断是:测试是商业化的前置条件,但不是时间表。从行业节奏看,一个城市从测试到可规模运营,往往取决于三个因素:
- ODD 的清晰边界能否定义(哪些区、哪些时段、哪些天气)
- 安全与合规流程是否跑通(包括事故与异常处理)
- 运营指标是否达标(接驾、取消率、投诉、车辆利用率)
如果你在汽车软件团队里,这其实是个提醒:自动驾驶不是“功能上线”,而是“服务上线”。上线之后每天都在经营。
机器人出租车扩城的真正意义:AI正在把汽车变成可迭代的服务
Waymo 进入费城,表面是新增测试城市,背后是一个更清晰的趋势:AI 让汽车从硬件产品变成持续迭代的软件服务。城市越多,越能逼出软件体系的成熟度:数据闭环、仿真回放、灰度发布、体验度量、合规审计,一个都少不了。
如果你正在关注“Tesla 端到端路线”与“中国车企多传感器路线”的差异,我建议把视角再往上抬一层:最终赢的不一定是某种传感器组合,也不一定是某个大模型,而是能把自动驾驶能力稳定交付为用户体验的那套软件与运营体系。
下一步该怎么做?如果你负责车载软件、智能座舱或出行产品,我更愿意你从一个问题开始:当车辆在陌生城市遇到陌生路况时,你的系统能不能在 30 秒内给乘客一个清楚、可信、可行动的解释?