智立方把具身智能做成可复制的模块化服务单元,三年计划部署1000台。本文用它对照智能座舱,拆解人机协作、峰谷调度与体验KPI。

模块化具身智能服务空间:智立方给智慧城市与汽车座舱的三点启发
2025-12-29,AI² Robotics 在北京与深圳同步发布并落地了“智立方(ZhiCube)”:一个把人形机器人“放进”可拼装服务空间里的标准化服务单元。公司给出的目标也很明确——三年内在全国部署 1000 个。这不是又一个“会走路的机器人”新闻,而是一个更现实的信号:具身智能开始用产品化、模块化的方式进入城市公共空间。
我更在意的点在于:智立方把“AI 的能力”从屏幕里拎出来,落到可运营的商业与公共服务场景里——咖啡、冰淇淋、零售、娱乐,都是高频、可复制、对体验敏感的场景。它像一个“城市版智能座舱”:同样强调多模块、同样要在人流高峰与低谷中动态调度、同样需要人机协作把体验做到稳定。
这篇文章放在《人工智能在智慧城市建设》系列里,我想借智立方做一个案例,讲清楚三件事:模块化具身智能到底解决什么问题、它和汽车软件/用户体验的共性是什么、以及如果你是做城市运营或车载体验,该怎么把它落到指标与流程上。
智立方到底“新”在哪:把具身智能做成可复制的城市基础单元
智立方的新,不是“机器人能做咖啡”——这个行业早就见过。真正的新在于:它把机器人能力封装进一个可拼装、可部署、可运营的空间单元里,让具身智能第一次像“基础设施”一样被规划。
AI² Robotics 的做法是:在模块化空间里部署自研的 AlphaBot 2 人形机器人,并以全身具身大模型 GOVLA 为核心,让机器人具备环境感知、任务理解与角色切换能力。更关键的是,它不是单机表演,而是围绕“日常运营”设计了系统级智能:人流少时分工做服务与引流,人流高时协作分担高负载任务,遇到复杂需求(例如精品咖啡)由人负责创意、机器人负责标准化执行。
“模块化”带来的三种确定性
对智慧城市项目来说,最怕的是“样板间很好看,规模化很难”。模块化的意义就在于,它把不确定性压缩到可控范围:
- 空间确定性:咖啡/零售/娱乐/冰淇淋四个模块自由组合,面向商圈、景区、综合体可快速适配。
- 能力确定性:标准流程由机器人稳定执行,减少对“高手员工”的依赖。
- 交付确定性:从“单点试点”变成“可复制交付”,才有可能谈 1000 台这种规模。
可靠性不是宣传点,是能不能活下去的门槛
源内容提到其核心部件累计 50,000 小时无故障运行,并且有自建产线保障一致性、还有跨十多个行业的数据反馈闭环。对城市公共空间而言,这些指标比“模型有多大”更重要:
- 在景区/商场这类场景,宕机 10 分钟就会直接影响排队与口碑。
- 一致性决定了规模化运维成本,决定了城市合作方是否敢买单。
人机协作运营模型:智慧城市的“调度系统”,也是智能座舱的“体验大脑”
我对智立方最认可的部分,是它没有把“无人化”当目标,而是把“人机协作”当常态。现实世界的服务体验,永远不是一个模型就能兜底的。
从“排班”到“算法调度”:高峰与低谷决定体验成败
智立方会依据客流变化自动调整协作策略:低峰时一部分机器人负责服务,另一部分负责吸引顾客;高峰时机器人协同完成高负载任务。这其实就是智慧城市常见的思路:
- 交通管理靠动态信控适配流量波动
- 城市治理靠事件分级与资源编排
- 公共服务靠峰谷调度保障体验
把这个逻辑映射到汽车软件与用户体验,你会发现几乎一致:
- 通勤早高峰:导航、拥堵预测、车内提醒要更“强干预”,减少驾驶分心
- 夜间/低频场景:语音助手更偏“陪伴与轻交互”,不要频繁打断
- 复杂场景(例如陌生城市、雨雪路况):人(驾驶员)负责判断,系统负责信息整合与执行辅助
一句话概括:好的 AI 不是一直抢镜,而是在合适的时机接手合适的环节。
“角色切换”是体验系统的核心能力
智立方强调机器人可动态切换角色:服务员、引导员、执行者、协作者。这对车载智能座舱同样关键。很多车企做 AI 助手做不出差异,问题往往不是 ASR/TTS,而是没有“角色体系”:
- 它什么时候应该像“副驾驶”(提醒、规划、复述)
- 什么时候应该像“管家”(一键执行、无感完成)
- 什么时候必须退后(不在驾驶关键期打扰)
把角色做清楚,才能把体验稳定做出来。
模块化服务空间与智能座舱的共同命题:生态拼装,而不是功能堆叠
智立方给智慧城市的启发是:城市服务正在从“一个柜台”变成“可插拔的体验节点”。而汽车行业正在经历相似转变:从“硬件定义功能”走向“软件定义体验”,从单一车机走向“生态系统”。
共同点一:模块是产品策略,不是工程拆分
智立方的咖啡/零售/娱乐模块,本质是把服务拆成可组合的“业务积木”。汽车座舱也一样:导航、娱乐、支付、充电、停车、售后,如果只是堆在一个大屏里,用户感受是混乱的;只有当它们可被场景化编排,才像“一个系统”。
我见过有效的做法通常包含两层:
- 能力模块化:语音、推荐、支付、身份、内容、地图等基础能力统一封装
- 场景编排:通勤/长途/亲子/露营/商务等场景调用不同组合
共同点二:数据闭环决定迭代速度
智立方强调多行业场景数据的持续反馈。具身智能与车载 AI 都有一个共同难题:离线训练很强,不代表线上好用。真正的门槛是:
- 数据采集是否合规可持续
- 标注与回流是否自动化
- 版本发布是否可灰度、可回滚
对智慧城市项目而言,这会直接影响“第二年还能不能续约”;对汽车而言,这会直接影响 OTA 之后口碑是上升还是翻车。
共同点三:体验 KPI 必须可量化
“看起来很聪明”不是 KPI。智立方如果要跑通规模化,最终要回到可量化指标:出杯时间、峰值吞吐、故障恢复时间、客诉率、复购率等。智能座舱同样需要从“功能有无”转向“体验指标”:
- 任务完成率:一句话能不能把导航/空调/媒体设置成功
- 平均交互轮次:从 5 轮降到 2 轮,体验会差很多
- 关键场景打扰率:驾驶关键期的无意义打断要接近 0
现实落地:给城市运营方与汽车团队的四个可执行清单
如果你在做智慧商圈、景区数字化,或做智能座舱/车载软件体验,智立方这个案例可以直接转成行动项。
1)先选“高频、低争议、可标准化”的服务
优先从咖啡、零售这类流程清晰的业务切入。原因很直白:先用标准化场景把可靠性跑出来,再谈体验创新。
2)把“峰谷调度”写进方案,而不是写进 PPT
建议明确三类策略并落到规则:
- 低峰:引流/讲解/互动优先
- 高峰:吞吐/排队/容错优先
- 异常:降级服务与人工接管路径优先
这套逻辑迁移到座舱也成立:高负载(导航+电话+驾驶)时减少花哨交互,保证关键功能稳定。
3)建立“人机交接点”,避免责任模糊
人机协作最怕“谁都以为对方会处理”。有效的做法是把交接点制度化:
- 哪些任务必须人工确认(例如定制化口味、敏感支付)
- 哪些异常必须人工介入(例如连续失败 N 次)
- 人工介入后系统如何记录并反哺模型
4)用最小指标集做第一轮验收
我建议第一阶段别贪多,抓住 6 个指标就够:
- 吞吐:高峰每小时可完成订单数
- 时延:平均出杯/出货时间
- 稳定性:MTBF/无故障运行时长
- 恢复:故障平均恢复时间(MTTR)
- 体验:客诉率/差评率
- 成本:单笔订单人力占比
这些指标一旦跑顺,你才有资格谈“城市级复制”。
智慧城市的下一步:从“智能点位”走向“可复制的体验网络”
智立方这种模块化具身智能服务空间,代表了一种更务实的智慧城市路径:不是先做宏大平台,而是先把一个个可运营的智能单元铺进真实人流里,然后用数据与运维把它们连成网。城市体验会因此变得更一致,管理也会更可控。
对汽车行业来说,这同样是个提醒:智能座舱的竞争,最后拼的是“模块化能力 + 场景编排 + 人机协作 + 可量化体验指标”。功能堆得再多,只要在关键时刻不稳定,用户就会给你一次性判死刑。
如果你的团队正在评估具身智能在园区/商圈/交通枢纽的落地,或者在做车载 AI 助手与座舱体验体系,我建议把智立方当作一个“对照样本”:**先把可复制的模块跑通,再把系统级智能做深,最后用数据闭环把体验做稳。**下一次你走进商场看到机器人在忙碌,不妨想想:车里那套 AI,也应该学会同样的“峰谷调度”和“角色切换”。