人工智能在机器人产业•2025年12月31日•By 3L3C

“华为系”具身智能团队用刺绣Demo证明世界模型与数据闭环的价值。本文拆解其方法论，并对比特斯拉与中国品牌的AI路线，给出座舱落地三步法。

具身智能智能座舱汽车软件用户体验世界模型数据闭环

Featured image for 具身智能“华为系”新动向：AI如何重塑汽车软件与座舱体验

具身智能“华为系”新动向：AI如何重塑汽车软件与座舱体验

2025-12-31，具身智能圈子最扎眼的一条信息，不是“又一个机器人会叠衣服”，而是一家低调团队用机器人完成了刺绣这种长程、精细、且面对柔性物体的任务。更值得汽车行业关注的点在于：这支被称作“华为系”的团队，把他们在智能驾驶里踩过的坑、修过的工程链路，原封不动带到了具身智能——尤其是数据闭环、端到端、世界模型这三件事。

我一直觉得，汽车行业聊“AI体验”最容易跑偏：大家把注意力放在大屏、语音、AIGC壁纸上，但真正决定用户体验上限的，是软件是否能持续进化，以及它是否能把“看得见的界面”和“看不见的物理世界”连接起来。具身智能看起来离车远，其实很近：它逼着团队解决触觉、力控、实时决策、硬件协同这些难题，而这些能力，正是下一代智能座舱、车内服务机器人、甚至整车软件平台走向“可执行智能”的底座。

下面我们就借“它石智航”的公开信息，结合汽车软件与用户体验的落地逻辑，拆开讲清楚：华为系团队在做什么、为什么刺绣这种 Demo 有意义、以及它对特斯拉和中国汽车品牌的 AI 策略意味着什么。

刺绣不是炫技：它在验证“车端AI”最缺的一块能力

刺绣这个场景的价值，核心不在“好看”，而在“难”。难点集中在三件事：

柔性物体不可建模：布料会形变、回弹、褶皱，状态空间爆炸。
长程任务不可容错：刺绣是多步骤链条，前面偏一点，后面全崩。
精细操作需要多模态：视觉不够用，必须引入力/触觉反馈。

这三点对应到汽车软件与用户体验里，其实就是我们天天在解决的“体验卡点”：

只靠摄像头做感知，到了雨雪泥泞、逆光、遮挡就掉链子；
只把智能当“功能点”，一旦流程变长（比如跨App、跨设备、跨场景），体验立刻碎掉；
只做语音/视觉交互，不做触觉/力反馈的闭环，所谓的“智能”会停留在对话层。

换句话说，刺绣这种 Demo 在证明：团队不是在做一个单点技能，而是在押注一套能迁移的“世界理解 + 行为生成”框架。这对汽车行业很重要，因为座舱体验的下一步，不是更会聊，而是更会做。

世界模型为什么关键？因为“体验”本质是可预测的反馈

它石智航强调世界模型（他们称为具身基础模型 TARS AWE 2.0），要解决两类预测：

看见场景后采取什么行动
行动后世界如何演化

把它翻译成座舱语言：

现在用户说“我冷”，系统不该只会开空调；它应该预测“把风量加大/温度上调/座椅加热打开”对用户舒适度会发生什么变化，并根据反馈继续调整。
当用户在车里拿东西、吃东西、照顾孩子，系统不该只会弹通知；它应该理解“接下来可能发生的动作链”，提前把灯光、空间、提醒方式调到位。

多数公司做不到这一点，是因为缺少真实世界的反馈数据，只有“点按/唤醒/意图”这种薄数据。具身智能反过来逼你面对“真实动作—真实反馈—真实代价”。它会倒逼汽车软件把体验从 UI 升级到 闭环控制系统。

“2019年的智驾”这句话，给汽车软件团队提了个醒

陈亦伦把具身智能类比为“智驾的2019年”，我认同这个判断，而且它对座舱 AI 也同样成立。

2019 年前后，行业从“规则堆栈 + 工程修补”转向“数据驱动 + 模型收敛”。当时最痛的不是算法本身，而是：

数据不够
数据不成体系
数据到训练再到部署没有闭环

具身智能现在面临同样问题，只是更极端：他们判断具身智能起步要100万小时真实场景数据（智驾商用级大约 10 万小时精选片段）。这个数字的意义在于：

具身智能的竞争，本质是“谁能更低成本、更高质量地生产数据”。

汽车行业也一样。现在很多“座舱大模型”卡在体验不稳定，根源往往不是模型小，而是：

没有覆盖真实用车链路的语料与多模态数据
没有把错误反馈回灌训练的机制
OTA 只更新功能，不更新“能力曲线”

Human Centric 数据采集，对车企的启发是什么？

它石智航自研 SenseHub（手套 + 全景相机），提出“以人为中心”的数据采集：看人之所看、感人之所感，并强调操作精度要到毫米级。

对车企而言，这给了一个很现实的路线：从“车端传感器数据”扩展到“人类行为数据”。

座舱不是只有语音指令，还有眼动、手势、身体姿态、触控压力、甚至情绪与疲劳。
用户体验不是“识别意图”就结束，而是要把“操作结果”纳入学习。

我见过不少车企做“情绪座舱”，最后做成了“表情识别 + 氛围灯变色”。原因很简单：缺少高质量标注的、可闭环的真实交互数据。Human Centric 的方法论，至少指出了数据工程的方向：把人当成传感器阵列的一部分。

华为、特斯拉、中国品牌：AI路线差异其实在“系统边界”

很多讨论把差异简化成“谁的模型更强”，但我更看重的是：谁定义了更合理的系统边界。

华为系：强整合、强工程、软硬件一起做

从文章披露的信息看，它石智航的思路是“三件事一起做”：

超级算法（端到端/世界模型/Scaling）
超级本体（自研硬件，让硬件成为算法载体）
超级应用（产业化，不止 Demo）

这很“华为”：先把工程链路打穿，再谈规模化。好处是体验一致性更强，尤其适合汽车这种对安全与可靠性要求极高的行业。代价是投入重、周期长。

特斯拉：极度数据驱动，把车当“数据工厂”

特斯拉的强项在于：车队规模天然形成数据闭环，把问题暴露、数据回传、训练迭代变成日常。它更像“用规模换智能”。

但在座舱体验上，特斯拉并不追求面面俱到的交互花活，而是强调“统一入口 + 极简流程”。这也解释了它的策略：把 AI 的主要资源投向能产生大量驾驶数据的环节，而不是投向碎片化的座舱场景。

中国汽车品牌：应用丰富，但容易陷入“功能堆叠”

中国品牌的优势是场景定义强、落地快、供应链迭代速度高。短板也明显：

座舱功能多，但跨应用体验割裂
大模型上车多，但缺少持续评测与能力回灌
硬件平台分裂，导致软件能力难以复用

具身智能团队强调的“端到端 + 数据闭环 + 自研关键硬件”，其实是在给行业提一个更硬的要求：别只做“能演示的智能”，要做“可量产、可维护、可迭代的智能系统”。

从具身智能反推座舱AI：落地最该做的三件事

如果你的目标是把 AI 真正用在汽车软件与用户体验里，我建议优先做三件事（不花哨，但很管用）：

1）先定义“闭环体验指标”，别只看唤醒率

把座舱体验指标从“交互成功”升级到“任务完成 + 用户满意度”。例如：

导航设置：从“识别目的地”变成“在 30 秒内完成路线确认并减少二次打断”
空调调节：从“执行指令”变成“10 分钟内保持舒适区且能解释调整原因”

闭环指标一旦明确，你就知道该采集什么数据、该训练什么模型、该怎么做 A/B。

2）建立“多模态数据最小闭环”，从单一高频场景开始

不要一上来就做全车智能体。选一个高频、可控、可评测的场景，做多模态闭环：

语音 + 视觉（车内摄像头/仪表）+ 触控 + 车辆状态
关键是加入“结果反馈”：用户是否撤销、是否二次调整、是否转手动

这一步做成，才谈得上 Scaling。

3）把AI放进平台层：让“能力”随OTA成长

很多团队把大模型当成一个 App。更好的做法是把它放进平台层，像智驾那样：

有统一的能力编排（工具调用、权限、记忆、个性化）
有统一的评测体系（离线集 + 在线灰度）
有可追溯的数据链路（发生—记录—回放—训练—验证）

做不到平台化，AI体验一定会变成“时灵时不灵”。用户会迅速失去耐心。

结尾：具身智能的终点，可能是“车内可执行智能”

把它石智航的路径看清楚，会发现一个很现实的趋势：具身智能不是在和座舱抢叙事，而是在帮座舱补短板——尤其是世界模型、触觉/力控、多模态闭环这些“从聊天走向执行”的关键能力。

如果你负责汽车软件或用户体验，2026 年最值得警惕的，不是友商又上了一个更大的模型，而是友商把数据闭环跑通了：体验会像滚雪球一样越做越顺。

你更愿意押注哪条路线：像特斯拉那样用规模驱动迭代，还是像华为系那样用软硬一体把工程体系做厚？对中国品牌来说，答案可能是第三条——用最快速度把闭环搭起来，然后用平台化把能力沉淀下去。

如果你正在评估“AI 在汽车软件与智能座舱中的应用路径”，我建议从“数据闭环设计”开始做方案评审：没有闭环，任何体验都只是一段演示视频。