AI 正在离开屏幕,进入家庭和工地等物理世界。借灵宇宙消费机器人的实践,解析智慧工地如何从“看得见”走向“动得起来”。

AI 正在“下楼”:从虚拟世界走向工地和家庭
2024年,中国建筑业新增项目中,带有“智慧工地”“数字孪生”标签的项目比例,很多地区已经超过30%。但多数工地上的“智能”,还停留在摄像头加平台、考勤加人脸识别这个层面。
真正的突破点,其实在一个方向:AI 不再只在屏幕里,而是进入物理世界,成为会“动”的智能体——无论是在家庭里的消费机器人,还是在塔吊旁的施工机器人。
灵宇宙创始人顾嘉唯提出的观点,很适合作为建筑行业的一个参照系:
“World as prompt,World as interface——把世界变成提示词,把世界变成交互界面。”
这篇文章就借灵宇宙的实践,拆解 AI 从虚拟到物理的路径,并类比到智慧工地:家用机器人走的路,很可能就是未来施工机器人、安全巡检机器人要走的路。
一、从文本到空间:AI 的“第二次涌现”
AI 的第一次爆发靠的是文本和互联网数据,第二次爆发一定来自物理世界的数据和行动。
顾嘉唯的判断很清晰:
- GPT-3 到今天的大模型,主要建立在文本、代码、网页数据之上;
- 下一阶段的智能涌现,需要空间数据 + 行为数据,也就是 AI 在真实世界中“看、听、动”的全过程;
- 想做到这一点,必须像特斯拉做 FSD 一样,先铺开足够多的“带传感器的设备”,再通过闭环数据训练“世界模型”和“具身智能”。
这和建筑业有什么关系?
建筑行业这几年喊的几个关键词:
- 智慧工地
- 施工过程数字化
- BIM+AI
- 施工机器人
本质上都在回答同一个问题:
如何把工地这个高不确定性、强物理属性的环境,变成 AI 能读得懂、学得会、动得起来的“世界”?
灵宇宙做的是家庭场景:用“灵宇宙小方机”等 AI 终端,采集家庭里的语言、位置、物体、孩子行为数据,构建“空间交互大模型”。
建筑企业如果想真正走向“智慧工地 2.0”,路径非常相似:
- 把摄像头、人员定位卡、安全帽、塔吊传感器等,视为工地的“眼耳手脚”;
- 把工人走动路线、机械动作、材料堆放、危险源变化,当作 AI 的训练数据;
- 目标不是只做监控告警,而是让 AI 逐步学会“理解”和“动作决策”。
这一层思路对很多建筑管理者挺关键:
智慧工地不只是“做平台”,而是要有意识地下“硬件棋”,为未来的空间智能留出数据地基。
二、“南坡路径”:为什么要从小而轻的硬件开始
顾嘉唯反复提到一个词:“特斯拉 FSD 的南坡路径”。
简单说,就是:
- 不一上来就做复杂、昂贵的人形机器人;
- 而是先做能规模铺开的消费级产品(比如绘本机器人 Luka、小方机);
- 用大量真实场景数据,逐步训练空间交互模型和具身智能;
- 等“软”的模型足够成熟,再扩展到更复杂的机器人形态。
建筑行业的“南坡路径”可以怎么走?
很多建筑企业一提到 AI+机器人,就直接想:
- 全自动砌砖机器人
- 全自动钢筋绑扎机器人
- 全无人塔吊和运输车
现实是:
- 成本高;
- 场景复杂、标准化程度低;
- 一个工地一个样,推广困难。
更务实的思路,是借鉴这种“南坡路径”:
**从轻量级、半自动、强数据采集能力的设备做起。**例如:
- 可在楼层巡逻的安全巡检机器人,先做“移动摄像头 + AI 安全检测”,不急着上复杂机械臂;
- 塔吊、升降机、泵车先做“AI 助手”,自动识别风险动作、优化调度,而不是一开始就完全无人化;
- 穿戴式设备(安全帽、马甲)从定位考勤升级到“行为识别 + 疲劳检测 + 危险提醒”。
先把工地变成“能被 AI 看清楚、听清楚、记得住”的世界,再慢慢让它“动起来”。
这是灵宇宙对消费机器人走的路,也是智慧工地更现实、更容易拿到 ROI 的路线。
三、“World as interface”:把世界变成交互界面
顾嘉唯提出的“World as interface”,本质是:
不再把人机交互局限在屏幕和 App 里,而是让现实世界的物体、空间、动作本身就是交互。
在家庭里,灵宇宙的做法是:
- 小方机不是一个“语音问答盒子”,而是能感知孩子表情、动作、位置,做更自然的互动;
- AI 可以记住孩子的阅读习惯、作息节奏,主动发起陪伴和引导;
- 用“关系算法”替代单纯推荐算法——不是推荐内容,而是在建立一段长期关系。
把这个思路搬到智慧工地,会发生什么?
现在很多工地的“互动方式”是这样的:
- 安全员拿着对讲机四处喊;
- 项目经理在微信群里发各种通知;
- 办公区里再上一个大屏,轮播各类指标。
如果把“World as interface”搬到工地,画面会完全不一样:
-
人和工地设施的交互
- 工人走近危险区域,安全帽震动并语音提醒;
- 塔吊即将超载,驾驶室内 AR 屏幕直接给出风险等级和调整建议;
- 智能仓库自动识别领料人、领料时间和材料去向,无需额外扫码。
-
管理者和“工地大脑”的交互
- 项目经理对着手机或对讲设备说:
- “给我看 3 号楼今天的高空作业风险情况。”
- 系统直接把对应楼栋的三维模型、作业面、当日风险点叠加在 BIM 模型上展示,并给出整改优先级;
- 需要某个周报,不再导数十个表,而是自然语言提问:
- “本周混凝土浇筑进度和计划差多少?”
- 项目经理对着手机或对讲设备说:
- 设备之间的交互
- 塔吊调度系统读取卸料区的堆放状态,自动优化吊运顺序;
- 混凝土罐车接近工地,地磅、门禁、浇筑区域系统自动串联,全程少人工指挥。
这背后其实是同一套东西:
- 多模态感知(视频、语音、定位、传感器);
- 世界模型(把工地“数字化成一个可计算的世界”);
- 具身智能(机器人、设备可以基于理解做动作决策)。
灵宇宙是在家庭里实验“世界即界面”,建筑企业则可以在工地上做“AI 场景化交互”的试验田。
四、终局思维:先想清楚“未来工地长什么样”
顾嘉唯说,他做灵宇宙,是先想清楚终局:
家里有能端茶倒水、照顾老人小孩、分担重复家务和陪伴的机器人。
然后倒推出来两条路线:
- 先做轻量级的 AI 终端,铺量、拿数据;
- 再走向更强的具身形态,把软件能力迁移到机器人上。
建筑行业如果也用这种“终局思维”,问题会变得更清楚:
未来 5-10 年,你希望的“终局工地”是什么?
有几个典型画面可以参考:
- 现场有一套“工地大脑”,实时理解每一块作业面在干什么、风险在哪;
- 危险工种(高空、深基坑、有毒有害环境)优先由机器人和远程操控设备完成;
- 工人更多做决策、检查、协同,不再是纯体力堆砌;
- BIM 模型不再只用在投标和汇报,而是成为进度、安全、质量的**“操作系统”**;
- 管理者可以像和人聊天一样“问工地”,随时获取可靠数据和可执行建议。
如果这个终局大致认同,反推回来,今天可以做的步骤就会更聚焦:
-
把核心数据采起来:
- 人(位置、行为、安全状态)
- 机(运行状态、故障预警)
- 料(进出场、堆放位置、损耗)
- 法(工序执行情况)
- 环(温湿度、噪音、粉尘等环境指标)
-
做针对性的 AI 应用,而不是大而全平台:
- 安全风险识别和预警
- 进度偏差分析和预测
- 质量缺陷自动识别
- 设备能耗和维护策略优化
-
预留“具身智能”的接口:
- 给巡检机器人、喷淋机器人、测量机器人留好接入标准和数据格式;
- 让它们成为“工地大脑”的一部分,而不是各自为政的孤岛设备。
顾嘉唯说:
“预测未来最好方式就是去做它。”
对建筑企业来说,也是一样:
- 不必等标准完全清晰再行动;
- 找一两个高价值场景,先从“小而准”的智慧工地试点做起;
- 在做的过程中不断更新对“终局工地”的想象。
五、关于数据、隐私与“幻觉”:建筑场景更要提前想清楚
灵宇宙在儿童、家庭场景下,极其关注隐私和数据安全:
- 摄像头会长期采集孩子的日常行为;
- 设备会保存大量语音、图像和互动记录;
- 如果处理不好,就是对家庭隐私的巨大风险。
建筑行业同样有自己的敏感点:
- 工人轨迹、行为习惯、违章记录;
- 工程质量数据和问题分布;
- 成本和进度信息,涉及企业核心竞争力。
我自己的建议是:
-
一开始就把数据治理当成“产品的一部分”,而不是附加条款。
- 明确哪些数据做实时分析,哪些做脱敏后训练模型;
- 给工人合理的知情权和安全承诺,避免“监控感”。
-
对大模型的“幻觉”保持敬畏,分清楚“聊天”和“决策”。
- Chat 交互可以帮助理解图纸、方案、规范,给出参考意见;
- 真正涉安全、质量、成本的动作,一定要有人在回路里;
- 可以用“规则 + 模型”的组合:模型找问题、规则卡底线。
灵宇宙能降低幻觉,一部分靠底层基座模型的进步,一部分靠自己多年的数据和微调经验。建筑企业也类似:
- 通用大模型负责语言理解、知识问答;
- 行业自有的“工程知识库 + 项目数据”负责校正和约束;
- 最终的行为(让机器人动、让设备改参数),要经过明确的安全策略。
结语:从孩子到工人,从客厅到工地,AI 正在进入物理世界
顾嘉唯从绘本机器人 Luka,到“灵宇宙小方机”,做的是一条很清晰的路:
- 把 AI 从屏幕里请出来,放进一个有传感器、有动作能力的「身体」里;
- 让 AI 在真实世界中积累“见识”和“经验”;
- 最终自然过渡到更复杂的具身机器人形态。
对于处在数字化转型关键期的中国建筑企业,这是一个非常值得参考的范本:
- 智慧工地不是终点,而是 AI 进入物理工地世界的起点;
- 从轻量化、可落地的终端和场景做起,慢慢构建自己的“工地世界模型”;
- 把“World as prompt,World as interface”当成设计原则,让数据、设备和人真正联成一个系统。
如果你的项目正在做或准备做智慧工地,建议可以自问三件事:
- 我们铺在工地上的硬件,能不能为未来的空间智能留出数据基础?
- 我们现在做的 AI 应用,是临时工具,还是可持续演进为“工地大脑”的积木?
- 我们心里有没有一个足够清晰的“终局工地画面”?
下一篇,我们会结合更多施工场景,拆解AI 在安全监控、进度管理和质量控制上的落地路径,把这套“从虚拟到物理”的思路,进一步细化成可操作的实施步骤。