AI从屏幕走向工地:从灵宇宙到智慧工地的“南坡路径”

AI在中国建筑行业的应用:智慧工地By 3L3C

AI 正在从屏幕走向工地。借灵宇宙的“南坡路径”,这篇文章拆解AI终端、空间智能和数据闭环,给智慧工地提供一套可落地思路。

智慧工地建筑AI应用具身智能建筑机器人工地数字化转型
Share:

Featured image for AI从屏幕走向工地:从灵宇宙到智慧工地的“南坡路径”

AI 正在“落地”,而不只是“上云”

2024年,全球AI投融资里有一个有意思的数字:超过40%的资金开始流向具身智能、机器人和智能硬件,而不仅仅是算法和云服务。这背后反映的是同一件事——AI 正在从虚拟世界,系统性进入物理世界

对于中国建筑企业来说,这一点尤其关键。过去几年,大家谈“智慧工地”“BIM+AI”,更多还停留在看板、报表、图像识别上,价值有限、落地偏浅。而灵宇宙这类消费级AI硬件公司的实践,其实给智慧工地提供了一条非常值得借鉴的路:

先用可规模铺开的硬件终端,占据物理场景的数据入口,形成“类特斯拉FSD”的南坡路径,再基于真实世界数据迭代AI能力。

这篇文章就借着对灵宇宙创始人顾嘉唯的公开访谈内容,聊聊:AI 如何从“屏幕里的模型”,变成“工地上的同事”,以及建筑企业在规划智慧工地和AI投资时,可以直接拿来用的几条方法论。


一、从“World as prompt”看智慧工地:场景本身就是提示词

顾嘉唯提出一个很有意思的概念:“World as prompt,World as interface”——把世界变成提示词,把世界变成交互界面。

对C端机器人来说,是客厅、儿童房;对建筑行业来说,就是工地、楼宇、园区。

在智慧工地语境下,这句话可以翻译成更直接的三点:

  1. 工地环境本身就是数据输入
    • 塔吊运行状态、脚手架变形、人员走位、材料堆场、扬尘噪声,这些都不该只是一堆“传感器数值”,而是AI理解现场意图和风险的“提示词”。
  2. 工人和管理者的行为是“空间交互”
    • 安全员的巡检路线、工长的停工指令、班组长的排班调整,都是“行为数据”,决定AI该如何辅助决策。
  3. 工地本身要变成交互界面
    • 不是打开一个App看报表,而是走到升降机口,电子屏和语音系统就提醒今天的风速超标、哪些楼层有高危作业;
    • 进入隧道,头盔上的AI助手自动切换到“隧道场景”,叠加风险提示和施工流程。

这和灵宇宙做消费机器人,本质是同一套底层逻辑:

不再把AI只放在电脑和手机里,而是嵌进空间,让“场景=交互界面,数据=提示词”。

智慧工地项目如果还在“做一个App、搞一个平台”这个思路里打转,基本就走偏了。


二、灵宇宙的“南坡路径”,给智慧工地的三点启发

顾嘉唯非常强调一个词:“南坡路径”——类比特斯拉FSD,不是先闭门造出一个“完美机器人”,而是先用可以规模铺开的轻量终端,把真实世界数据闭环起来。

这对建筑行业很有参考价值。

1. 不要一上来就想“全能施工机器人”

很多施工企业的AI设想是:

  • 会砌砖、会焊接、会抹灰、会巡检的“万能机器人”;
  • 一台替代几名工人,ROI一次算清。

现实是,这样的项目要么烂尾,要么常年“试点”。

灵宇宙的做法是:

  • 先从绘本阅读机器人 Luka 做起,深耕一个细分场景;
  • 再到随身AI终端“小方机”,把空间交互、长期陪伴的数据持续积累。

对应到工地,我更认同的顺序是:

  1. 从“单点高频问题”的智能终端切入
    • 比如:塔吊吊装指挥助手、临边防护和洞口监测终端、智慧安全帽/工牌等;
  2. 通过大量铺设,先把数据盘活
    • 把高危动作、违规行为、施工节奏、环境波动这些行为数据沉淀下来;
  3. 再逐步往“具身智能+施工机器人”走
    • 有了真实空间数据,才谈得上让机器人理解楼层、材料、工序之间的关系。

没有南坡路径,直接冲北坡,大概率摔下来。

2. 硬件只是20%,软件和数据才是80%

顾嘉唯提到一句我非常赞同的话:

“从投入度和价值资产看,我们是软件占80%,硬件只占20%,但必须做硬件。”

原因很简单:只有掌握终端,才能掌握场景数据和用户体验。

放到智慧工地:

  • 智慧安全帽、工地摄像头、环境传感器,这些硬件本身不会产生很高毛利;
  • 真正的价值在于:
    • 能否在多工地、多项目之间形成“数据飞轮”;
    • 能否通过模型持续优化安全预警、进度预测、质量识别。

所以,建设方在选型时,别只盯着传感器的品牌和参数,更要问三个问题:

  1. 数据归属和开放程度怎样?
  2. 厂商是否有清晰的AI模型进化路线?
  3. 终端形态未来能不能扩展“具身能力”,比如自动巡检、自动复核?

3. 把“关系算法”引入工地,而不只是推荐算法

在C端,顾嘉唯把新一代AI称为**“关系算法”**:

  • 不再只是“千人千面推荐内容”,
  • 而是“千人千面关系”,Agent 会根据与你共同经历的历史,建立主动的、长期的陪伴和记忆。

搬到智慧工地,其实非常适合做三件事:

  1. 针对个人的安全风险画像
    • 某个工人过去半年有哪些违规记录?习惯在哪些时间段疲劳作业?
    • AI 安全助手可以对不同人给出不同强度和频次的提醒,而不是“一刀切广播”。
  2. 针对班组/总包的施工节奏画像
    • 哪个班组在钢筋绑扎上效率更高?哪个总包在机电安装上质量问题多?
    • 模型可以基于历史行为,给出更贴合实际的进度预估和资源配置方案。
  3. 针对“楼栋/区域”的风险关系图谱
    • 某一层是否经常发生同类问题?是否与材料供应、监理频次相关?

简而言之:

传统智慧工地更多是“事件管理系统”,新一代AI智慧工地应该先变成“关系理解系统”,再长出决策和自动化能力。


三、从家庭到工地:具身智能的数据闭环如何复制?

顾嘉唯判断:

过去 GPT-3 到现在的大模型,主要靠互联网文本数据涌现;下一步的智能跃迁,需要大量来自物理世界的“空间行为数据”。

他做灵宇宙,是为了在家庭场景里采集这类数据;而在建筑行业,这个“物理世界”的黄金矿,就是复杂的施工现场

1. 建筑场景为什么适合做“世界模型”?

对AI来说,工地有几个独特优势:

  • 空间结构清晰:楼层、构件、构配件,天然就是一个三维拓扑结构,非常适合和BIM模型结合;
  • 行为模式相对可预测:钢筋、模板、混凝土、机电安装,有标准工序和规则,不是完全无序的“街景”;
  • 风险和收益高度挂钩:安全事故、工期延误、返工,成本巨大,企业有动力持续投入。

如果能像特斯拉那样,持续从成百上千个工地“采样”:

  • AI 就能从“看图识别安全帽”,升级为“理解这一层的施工状态和潜在风险”;
  • 进一步能在数字孪生或BIM模型中,形成对整个项目的“世界模型”。

2. 如何一步步构建工地“世界模型”?

借鉴灵宇宙+特斯拉FSD的思路,一个可执行的三步走是:

  1. 先解决“视角问题”:让AI看得见

    • 核心是多类型终端:固定摄像头、移动巡检机器人、智慧安全帽、车辆行车记录仪;
    • 目标不是多,而是覆盖关键视角:高处作业、深基坑、临边、大型机械、出入口等。
  2. 再解决“标注问题”:让AI看得懂

    • 初期用传统CV+规则引擎,快速搭一套“基本安全识别”;
    • 随着数据累积,引入多模态大模型,对行为和场景做更高层语义理解,例如“违规攀爬脚手架”“临边防护缺失但未施工”等。
  3. 最后解决“闭环问题”:让AI能影响现实

    • 通过语音广播、电子工牌提醒、塔吊限制、闸机联动等,把AI建议变成现场动作;
    • 长期形成反馈数据:哪些预警被采纳、哪些无效、哪些误报,从而不断优化模型。

这套路径和灵宇宙做儿童陪伴机器人,在逻辑上是同一层:

先铺开终端,采集场景数据;再用数据训练“空间智能”;最后让AI从“看见”走向“能做”。


四、投资视角:AI智慧工地也需要“终局思维”

顾嘉唯反复提到,他是先画好终局,再倒推两条路线图。这个思路,对地产企业、施工总包、城投平台在做AI投资决策时,很有借鉴意义。

1. 先回答:终局想要什么样的现场?

如果没有终局视角,智慧工地往往会变成“堆功能”:

  • 今年上安全帽识别,
  • 明年上劳务实名和门禁,
  • 后年再搞个机械管理平台……

几年花了不少预算,体验却越来越割裂。

更好的做法是,先把终局说清楚,比如:

  • 安全终局:任何高危动作(高坠、物体打击、触电、机械伤害)都能在事前或事中被发现并有效阻断;
  • 质量终局:关键隐蔽工程都有可追溯的数据记录和AI自动验收建议;
  • 进度终局:项目经理能看到“未来两周”的进度风险预测,而不是每天被动对上报表。

有了这样的终局,再去选AI+硬件路径,就会清晰很多:

  • 哪些终端必须自建,哪些可以外采;
  • 哪些数据必须沉淀在自己的平台;
  • 哪些能力可以通过生态伙伴补齐。

2. 然后问:哪条“南坡”可以一年见效、三年变厚?

顾嘉唯这次创业,团队只有40+人,就跑出了一个有说服力的雏形,很大程度靠的是:

  • 不求“大而全”,只做“关键路径”
  • 用AI提升团队效率,而不是堆人。

对建筑企业,我觉得可以用一个简单的三问来评估项目:

  1. 这条路径,12个月内能否在一个标杆项目上看到肉眼可见的价值(节省人力、降低事故、压缩工期)?
  2. 这条路径,3年内能否形成属于自己的“数据资产”和行业壁垒
  3. 这条路径,是否有机会延伸到运营、物业、智慧园区等更长周期场景

如果三问都能给出正向答案,这才值得重仓做;否则就当成小试点,而不是战略性投入。


五、对建筑企业的三条落地建议

结合灵宇宙的经验和智慧工地的实际环境,我会更推荐建筑企业从以下三点入手,而不是一味追“大模型上工地”。

1. 把“人”当成第一终端:从AI安全员、AI工长做起

顾嘉唯强调,做AI硬件要么离手机很远(端茶倒水的机器人),要么服务的是“没有手机的人群”,比如儿童。

工地上其实非常类似:

  • 很多一线工人不会、也不愿意频繁使用复杂App;
  • 但他们每天都会接触安全帽、对讲机、工牌、机械设备。

与其做一个“超级平台”,不如先把这些高频触点AI化

  • 带语音助手的安全帽:
    • 能根据当前楼层、天气、作业类型,实时播报风险提示;
    • 遇到系统识别出的危险行为,优先提醒“当事人+班组长”。
  • 带AI助手的工长对讲机:
    • 能用自然语言查询进度计划、材料到场、机械状态;
    • 能像“灵宇宙小方机”那样,提供“空间感知+知识问答”。

2. 建一支真正懂AI的“小而精”团队

灵宇宙这次创业没有追求人数规模,这和传统建筑企业习惯的“大项目、大团队”思路不太一样。

在AI+智慧工地项目上,我反而更建议:

  • 内部建一支 5~15 人的“AI原生”团队,
  • 重点掌握三件事:
    1. 关键数据资产的设计和沉淀;
    2. 与外部AI厂商、设备厂商的技术对接能力;
    3. 把现场需求抽象成可复用能力(比如“高处作业识别”“吊装作业监测”)。

不要指望外包公司替你想明白终局,那是企业自己必须握在手里的东西。

3. 提前思考“隐私与责任”的边界

顾嘉唯在谈儿童产品时,非常在意隐私问题——因为这是持续记录、压缩、分析孩子的一天。

工地何尝不是:

  • 摄像头在拍人,安全帽在记录轨迹,定位在追踪停留时间;
  • 一旦处理不好,很容易引发劳务队伍抵触,甚至合规风险。

真正可持续的做法是:

  • 数据用途、保存周期、访问权限写清楚,并和劳务单位透明沟通;
  • 在技术上做好匿名化与脱敏,用“行为标签”替代“个人身份”;
  • 在管理上明确“AI是辅助决策,不是唯一证据”,避免“一切归咎AI记录”。

这点看似和技术无关,但从长远看,会决定AI在建筑行业能不能真正“扎根”。


结语:AI 从客厅走向工地,是同一场“具身智能”实验

顾嘉唯在采访里引用了 Alan Kay 的一句话:

“预测未来最好的方式,就是去发明它。”

灵宇宙在做的,是把AI放进家庭、放进客厅,去发明“人机共处的新日常”; 智慧工地要做的,其实是同一件事——把AI放进工地、放进楼宇,去发明“人机协同的新施工方式”。

对中国建筑行业来说,真正的机会不是再多一个“看板系统”,而是抓住这波AI从虚拟走向物理的窗口期

  • 用恰当的南坡路径,从轻量终端和单点场景切入;
  • 让工地变成“World as prompt,World as interface”;
  • 逐步积累自己的世界模型和数据资产。

未来几年,我们在“AI在中国建筑行业的应用:智慧工地”这个系列里,也会持续跟踪具身智能、AI终端在工地上的真实落地案例。如果你所在的项目已经在尝试用AI做安全、质量或进度管理,也不妨从现在开始问自己:

你的AI系统,还只是一个“更聪明的报表”?

还是已经在把整个工地,当成新的“交互界面”?