AI 正在从屏幕走向工地。借灵宇宙的“南坡路径”,这篇文章拆解AI终端、空间智能和数据闭环,给智慧工地提供一套可落地思路。

AI 正在“落地”,而不只是“上云”
2024年,全球AI投融资里有一个有意思的数字:超过40%的资金开始流向具身智能、机器人和智能硬件,而不仅仅是算法和云服务。这背后反映的是同一件事——AI 正在从虚拟世界,系统性进入物理世界。
对于中国建筑企业来说,这一点尤其关键。过去几年,大家谈“智慧工地”“BIM+AI”,更多还停留在看板、报表、图像识别上,价值有限、落地偏浅。而灵宇宙这类消费级AI硬件公司的实践,其实给智慧工地提供了一条非常值得借鉴的路:
先用可规模铺开的硬件终端,占据物理场景的数据入口,形成“类特斯拉FSD”的南坡路径,再基于真实世界数据迭代AI能力。
这篇文章就借着对灵宇宙创始人顾嘉唯的公开访谈内容,聊聊:AI 如何从“屏幕里的模型”,变成“工地上的同事”,以及建筑企业在规划智慧工地和AI投资时,可以直接拿来用的几条方法论。
一、从“World as prompt”看智慧工地:场景本身就是提示词
顾嘉唯提出一个很有意思的概念:“World as prompt,World as interface”——把世界变成提示词,把世界变成交互界面。
对C端机器人来说,是客厅、儿童房;对建筑行业来说,就是工地、楼宇、园区。
在智慧工地语境下,这句话可以翻译成更直接的三点:
- 工地环境本身就是数据输入:
- 塔吊运行状态、脚手架变形、人员走位、材料堆场、扬尘噪声,这些都不该只是一堆“传感器数值”,而是AI理解现场意图和风险的“提示词”。
- 工人和管理者的行为是“空间交互”:
- 安全员的巡检路线、工长的停工指令、班组长的排班调整,都是“行为数据”,决定AI该如何辅助决策。
- 工地本身要变成交互界面:
- 不是打开一个App看报表,而是走到升降机口,电子屏和语音系统就提醒今天的风速超标、哪些楼层有高危作业;
- 进入隧道,头盔上的AI助手自动切换到“隧道场景”,叠加风险提示和施工流程。
这和灵宇宙做消费机器人,本质是同一套底层逻辑:
不再把AI只放在电脑和手机里,而是嵌进空间,让“场景=交互界面,数据=提示词”。
智慧工地项目如果还在“做一个App、搞一个平台”这个思路里打转,基本就走偏了。
二、灵宇宙的“南坡路径”,给智慧工地的三点启发
顾嘉唯非常强调一个词:“南坡路径”——类比特斯拉FSD,不是先闭门造出一个“完美机器人”,而是先用可以规模铺开的轻量终端,把真实世界数据闭环起来。
这对建筑行业很有参考价值。
1. 不要一上来就想“全能施工机器人”
很多施工企业的AI设想是:
- 会砌砖、会焊接、会抹灰、会巡检的“万能机器人”;
- 一台替代几名工人,ROI一次算清。
现实是,这样的项目要么烂尾,要么常年“试点”。
灵宇宙的做法是:
- 先从绘本阅读机器人 Luka 做起,深耕一个细分场景;
- 再到随身AI终端“小方机”,把空间交互、长期陪伴的数据持续积累。
对应到工地,我更认同的顺序是:
- 从“单点高频问题”的智能终端切入
- 比如:塔吊吊装指挥助手、临边防护和洞口监测终端、智慧安全帽/工牌等;
- 通过大量铺设,先把数据盘活
- 把高危动作、违规行为、施工节奏、环境波动这些行为数据沉淀下来;
- 再逐步往“具身智能+施工机器人”走
- 有了真实空间数据,才谈得上让机器人理解楼层、材料、工序之间的关系。
没有南坡路径,直接冲北坡,大概率摔下来。
2. 硬件只是20%,软件和数据才是80%
顾嘉唯提到一句我非常赞同的话:
“从投入度和价值资产看,我们是软件占80%,硬件只占20%,但必须做硬件。”
原因很简单:只有掌握终端,才能掌握场景数据和用户体验。
放到智慧工地:
- 智慧安全帽、工地摄像头、环境传感器,这些硬件本身不会产生很高毛利;
- 真正的价值在于:
- 能否在多工地、多项目之间形成“数据飞轮”;
- 能否通过模型持续优化安全预警、进度预测、质量识别。
所以,建设方在选型时,别只盯着传感器的品牌和参数,更要问三个问题:
- 数据归属和开放程度怎样?
- 厂商是否有清晰的AI模型进化路线?
- 终端形态未来能不能扩展“具身能力”,比如自动巡检、自动复核?
3. 把“关系算法”引入工地,而不只是推荐算法
在C端,顾嘉唯把新一代AI称为**“关系算法”**:
- 不再只是“千人千面推荐内容”,
- 而是“千人千面关系”,Agent 会根据与你共同经历的历史,建立主动的、长期的陪伴和记忆。
搬到智慧工地,其实非常适合做三件事:
- 针对个人的安全风险画像
- 某个工人过去半年有哪些违规记录?习惯在哪些时间段疲劳作业?
- AI 安全助手可以对不同人给出不同强度和频次的提醒,而不是“一刀切广播”。
- 针对班组/总包的施工节奏画像
- 哪个班组在钢筋绑扎上效率更高?哪个总包在机电安装上质量问题多?
- 模型可以基于历史行为,给出更贴合实际的进度预估和资源配置方案。
- 针对“楼栋/区域”的风险关系图谱
- 某一层是否经常发生同类问题?是否与材料供应、监理频次相关?
简而言之:
传统智慧工地更多是“事件管理系统”,新一代AI智慧工地应该先变成“关系理解系统”,再长出决策和自动化能力。
三、从家庭到工地:具身智能的数据闭环如何复制?
顾嘉唯判断:
过去 GPT-3 到现在的大模型,主要靠互联网文本数据涌现;下一步的智能跃迁,需要大量来自物理世界的“空间行为数据”。
他做灵宇宙,是为了在家庭场景里采集这类数据;而在建筑行业,这个“物理世界”的黄金矿,就是复杂的施工现场。
1. 建筑场景为什么适合做“世界模型”?
对AI来说,工地有几个独特优势:
- 空间结构清晰:楼层、构件、构配件,天然就是一个三维拓扑结构,非常适合和BIM模型结合;
- 行为模式相对可预测:钢筋、模板、混凝土、机电安装,有标准工序和规则,不是完全无序的“街景”;
- 风险和收益高度挂钩:安全事故、工期延误、返工,成本巨大,企业有动力持续投入。
如果能像特斯拉那样,持续从成百上千个工地“采样”:
- AI 就能从“看图识别安全帽”,升级为“理解这一层的施工状态和潜在风险”;
- 进一步能在数字孪生或BIM模型中,形成对整个项目的“世界模型”。
2. 如何一步步构建工地“世界模型”?
借鉴灵宇宙+特斯拉FSD的思路,一个可执行的三步走是:
-
先解决“视角问题”:让AI看得见
- 核心是多类型终端:固定摄像头、移动巡检机器人、智慧安全帽、车辆行车记录仪;
- 目标不是多,而是覆盖关键视角:高处作业、深基坑、临边、大型机械、出入口等。
-
再解决“标注问题”:让AI看得懂
- 初期用传统CV+规则引擎,快速搭一套“基本安全识别”;
- 随着数据累积,引入多模态大模型,对行为和场景做更高层语义理解,例如“违规攀爬脚手架”“临边防护缺失但未施工”等。
-
最后解决“闭环问题”:让AI能影响现实
- 通过语音广播、电子工牌提醒、塔吊限制、闸机联动等,把AI建议变成现场动作;
- 长期形成反馈数据:哪些预警被采纳、哪些无效、哪些误报,从而不断优化模型。
这套路径和灵宇宙做儿童陪伴机器人,在逻辑上是同一层:
先铺开终端,采集场景数据;再用数据训练“空间智能”;最后让AI从“看见”走向“能做”。
四、投资视角:AI智慧工地也需要“终局思维”
顾嘉唯反复提到,他是先画好终局,再倒推两条路线图。这个思路,对地产企业、施工总包、城投平台在做AI投资决策时,很有借鉴意义。
1. 先回答:终局想要什么样的现场?
如果没有终局视角,智慧工地往往会变成“堆功能”:
- 今年上安全帽识别,
- 明年上劳务实名和门禁,
- 后年再搞个机械管理平台……
几年花了不少预算,体验却越来越割裂。
更好的做法是,先把终局说清楚,比如:
- 安全终局:任何高危动作(高坠、物体打击、触电、机械伤害)都能在事前或事中被发现并有效阻断;
- 质量终局:关键隐蔽工程都有可追溯的数据记录和AI自动验收建议;
- 进度终局:项目经理能看到“未来两周”的进度风险预测,而不是每天被动对上报表。
有了这样的终局,再去选AI+硬件路径,就会清晰很多:
- 哪些终端必须自建,哪些可以外采;
- 哪些数据必须沉淀在自己的平台;
- 哪些能力可以通过生态伙伴补齐。
2. 然后问:哪条“南坡”可以一年见效、三年变厚?
顾嘉唯这次创业,团队只有40+人,就跑出了一个有说服力的雏形,很大程度靠的是:
- 不求“大而全”,只做“关键路径”;
- 用AI提升团队效率,而不是堆人。
对建筑企业,我觉得可以用一个简单的三问来评估项目:
- 这条路径,12个月内能否在一个标杆项目上看到肉眼可见的价值(节省人力、降低事故、压缩工期)?
- 这条路径,3年内能否形成属于自己的“数据资产”和行业壁垒?
- 这条路径,是否有机会延伸到运营、物业、智慧园区等更长周期场景?
如果三问都能给出正向答案,这才值得重仓做;否则就当成小试点,而不是战略性投入。
五、对建筑企业的三条落地建议
结合灵宇宙的经验和智慧工地的实际环境,我会更推荐建筑企业从以下三点入手,而不是一味追“大模型上工地”。
1. 把“人”当成第一终端:从AI安全员、AI工长做起
顾嘉唯强调,做AI硬件要么离手机很远(端茶倒水的机器人),要么服务的是“没有手机的人群”,比如儿童。
工地上其实非常类似:
- 很多一线工人不会、也不愿意频繁使用复杂App;
- 但他们每天都会接触安全帽、对讲机、工牌、机械设备。
与其做一个“超级平台”,不如先把这些高频触点AI化:
- 带语音助手的安全帽:
- 能根据当前楼层、天气、作业类型,实时播报风险提示;
- 遇到系统识别出的危险行为,优先提醒“当事人+班组长”。
- 带AI助手的工长对讲机:
- 能用自然语言查询进度计划、材料到场、机械状态;
- 能像“灵宇宙小方机”那样,提供“空间感知+知识问答”。
2. 建一支真正懂AI的“小而精”团队
灵宇宙这次创业没有追求人数规模,这和传统建筑企业习惯的“大项目、大团队”思路不太一样。
在AI+智慧工地项目上,我反而更建议:
- 内部建一支 5~15 人的“AI原生”团队,
- 重点掌握三件事:
- 关键数据资产的设计和沉淀;
- 与外部AI厂商、设备厂商的技术对接能力;
- 把现场需求抽象成可复用能力(比如“高处作业识别”“吊装作业监测”)。
不要指望外包公司替你想明白终局,那是企业自己必须握在手里的东西。
3. 提前思考“隐私与责任”的边界
顾嘉唯在谈儿童产品时,非常在意隐私问题——因为这是持续记录、压缩、分析孩子的一天。
工地何尝不是:
- 摄像头在拍人,安全帽在记录轨迹,定位在追踪停留时间;
- 一旦处理不好,很容易引发劳务队伍抵触,甚至合规风险。
真正可持续的做法是:
- 把数据用途、保存周期、访问权限写清楚,并和劳务单位透明沟通;
- 在技术上做好匿名化与脱敏,用“行为标签”替代“个人身份”;
- 在管理上明确“AI是辅助决策,不是唯一证据”,避免“一切归咎AI记录”。
这点看似和技术无关,但从长远看,会决定AI在建筑行业能不能真正“扎根”。
结语:AI 从客厅走向工地,是同一场“具身智能”实验
顾嘉唯在采访里引用了 Alan Kay 的一句话:
“预测未来最好的方式,就是去发明它。”
灵宇宙在做的,是把AI放进家庭、放进客厅,去发明“人机共处的新日常”; 智慧工地要做的,其实是同一件事——把AI放进工地、放进楼宇,去发明“人机协同的新施工方式”。
对中国建筑行业来说,真正的机会不是再多一个“看板系统”,而是抓住这波AI从虚拟走向物理的窗口期:
- 用恰当的南坡路径,从轻量终端和单点场景切入;
- 让工地变成“World as prompt,World as interface”;
- 逐步积累自己的世界模型和数据资产。
未来几年,我们在“AI在中国建筑行业的应用:智慧工地”这个系列里,也会持续跟踪具身智能、AI终端在工地上的真实落地案例。如果你所在的项目已经在尝试用AI做安全、质量或进度管理,也不妨从现在开始问自己:
你的AI系统,还只是一个“更聪明的报表”?
还是已经在把整个工地,当成新的“交互界面”?