从AGI到智慧工地:世界模型与自动实验如何重塑建筑业

AI在中国建筑行业的应用:智慧工地By 3L3C

AGI 要先做好世界模型和自动实验,智慧工地也是同一道题。建筑企业如果把工地当“实验室”,让 AI 真正理解并改造现场,才算走上正确的数字化路径。

智慧工地建筑业数字化人工智能世界模型自动化实验BIM应用
Share:

Featured image for 从AGI到智慧工地:世界模型与自动实验如何重塑建筑业

从AGI谈起:建筑业真正缺的不是“一个大模型”

很多建筑企业这两年在谈 AI,基本都绕不过两个问题:

  • “能不能给我做个工地专属的大模型?”
  • “能不能像 ChatGPT 一样,帮我自动管进度、管安全?”

大部分公司把注意力都放在“产品形态”和“模型大小”上,结果是 PoC 做了一堆,真正落地的智慧工地却不多。原因很简单:基础智能没打牢,行业应用自然走不远。

在最新一期 Google DeepMind 播客里,Demis Hassabis 把通往 AGI 的路线压缩成两件事:

世界模型 + 自动实验 = 真正能研究、能动手的 AI

这两件事,说的是 AGI,但对中国建筑业、对智慧工地,其实是同一道题。本文就借 Hassabis 的这次长访谈,聊聊:

  • 世界模型到底解决的是什么问题?
  • 自动化实验为什么是 AI 真正进入物理世界的起点?
  • 这两件事,对智慧工地、对建筑企业上 AI,有什么非常直接的启发?

一、世界模型:让“智慧工地”先真正看懂工地

世界模型的核心,是让 AI 不只是读懂图纸和文本,而是形成对物理世界的“直觉”。

Hassabis 的原话是:

语言模型已经很强,但它们对现实世界的理解是“残缺”的。

同样的问题,今天在大多数智慧工地项目上也很明显:

  • 模型能读懂施工方案,却搞不清现场的塔吊、脚手架、临边防护到底在哪;
  • 能分析安全制度,却分不清“工人趴下”“工人跌落”的细微差异;
  • 能做进度跟踪,却难以准确理解一堵墙在不同施工阶段的空间状态。

原因和 Hassabis 说的一样——只有“语言世界”,没有“物理世界”。

1. 世界模型解决的,是“空间+物理直觉”短板

在 DeepMind 的规划里,世界模型要回答的是这些问题:

  • 这个物体能不能倒?会往哪边倒?
  • 液体会怎么流?光线怎么变?
  • 东西在空间里是如何相对移动的?

映射到建筑场景,就是:

  • 钢筋笼如果绑扎有误,吊装过程中潜在会怎么变形?
  • 脚手架某几处杆件未按规范搭设,在哪种风载下风险最大?
  • 塔吊、车辆、人流在场内如何“抢道”,哪里最容易出现安全冲突?

传统的“智慧工地”更多是规则+识别:

  • 摄像头识别未戴安全帽;
  • 电子围栏识别越界;
  • 进度管理识别“是否完成某道工序”。

这些都还停留在“看到一个画面 / 读到一条记录 —— 匹配一个标签”。缺的是对“过程”和“物理后果”的理解。

2. DeepMind 的世界模型,对建筑业的三个启发

DeepMind 用 Veo、Genie、Sima 等产品在练 AI 的世界模型:

  • 通过视频理解运动、光影、流体;
  • 通过生成可互动游戏世界练空间结构和反馈;
  • 通过虚拟环境中的任务执行,打通“感知-决策-行动”链条。

对建筑行业来说,有几个非常直接的启发:

(1)BIM 只是“几何基础”,不是完整的世界模型

很多企业认为有了 BIM,就等于“数字孪生”,可以直接上 AI。其实:

  • BIM 更多是几何和构件信息;
  • 世界模型要求的是:AI 能预测“如果这里多了一车混凝土,会堵住哪条施工便道”。

智慧工地的世界模型,需要把这些“非几何信息”也喂给 AI:

  • 施工工序逻辑(先干啥、再干啥);
  • 设备能力与约束(塔吊回转角度、吊次频率、禁入区域);
  • 人员行为模式(上下班节奏、高风险作业时段)。

(2)视频 AI 要从“识别瞬间”升级到“理解演化”

当前做得比较多的是:

  • 戴没戴安全帽;
  • 有没有烟火;
  • 是否系安全带。

下一步更有价值的,是:

  • 通过连续画面,判断脚手架搭设过程是否规范;
  • 预测某个作业面,在未来 10 分钟内发生坠落或物体打击的概率;
  • 结合风速、吊重情况,给塔吊司机实时“风险预警评分”。

这背后,依赖的就是更强的世界模型:AI 不是看一帧图,而是“在心里”模拟未来几帧会发生什么。

(3)数字孪生要从“可视化”进化到“可推演”

很多工地已经有了三维可视化平台,但更多是“好看好演示”。如果引入世界模型,目标应该变成:

  • 改变任务排布,系统能实时推演对总工期的影响;
  • 模拟不同材料堆放位置,对塔吊利用率和安全风险的综合影响;
  • 全场景仿真吊装路径,给出冲突最小的方案。

这才是智慧工地真正的“数字世界”:不仅能看,还能推理和预演。


二、自动实验:AI 不只会算,还要“在工地里试”

Hassabis 认为,AGI 的关键不在于“能回答多少问题”,而在于“能做多少次实验”。

DeepMind 现在在英国建设首个全自动化科学实验室:

  • 由 Gemini 负责科学假设、实验设计、数据分析;
  • 由机器人负责材料合成、性能测试;
  • 每天可以自动完成数百组实验,目标直接瞄准电池、超导、半导体这些硬骨头。

这套思路,对建筑行业特别有参考价值,因为建筑本质上就是一个持续实验的行业

  • 每个项目场地不同、气候不同、工期约束不同;
  • 每次总包、分包组合不同,管理文化不同;
  • 既有成熟工法,又有大量“项目级小创新”。

如果把 DeepMind 的“自动实验室”类比到工地,会得到一个非常清晰的方向:

智慧工地的升级路径,不是多装几个摄像头,而是搭起一套“自动化施工实验系统”。

1. 建筑版“自动实验室”长什么样?

可以这样拆解:

(1)数字实验平台:先在模型里做“虚拟试验”

  • 在 BIM + 进度 + 物资 + 人员数据的综合平台里,AI 自动生成多套施工组织方案;
  • 对每套方案进行虚拟仿真:工期、成本、安全风险、资源冲突;
  • 让系统像 DeepMind 的材料实验一样,自动“穷举+筛选”。

(2)现场感知闭环:把每天的工地,当作一次真实实验

  • 对每个班组、每个工序的表现进行量化:效率、质量、返工率、安全事件;
  • 让系统自动分析“哪种排班、哪种工法、哪种布置”表现最好;
  • 把结论沉淀成项目级、公司级的“工法知识库”。

(3)跨项目自进化:让企业的经验“指数级增长”

  • 不同地区、不同类型项目的数据统一上收;
  • AI 自动归纳出“钢结构高层”“市政桥梁”“地铁车站”等场景下的最优策略;
  • 形成可被新项目直接调用的“行业级施工大脑”。

说白了,就是把“项目经理拍脑袋+靠经验试”变成“AI 批量做实验+量化出结论”。

2. 为什么建筑行业比想象中更适合“自动实验”?

DeepMind 选择材料科学做自动实验,有两个理由:

  • 试错次数多;
  • 验证标准清晰。

建筑其实非常类似:

  • 一个总包一年几十上百个项目,本身就是在做大量“自然实验”;
  • 每个工序都有明确的质量、安全、工期指标,可以量化验证。

建筑企业如果愿意稍微做两件事:

  1. 把项目过程数据“干净、及时”地记录下来;
  2. 允许 AI 在虚拟空间里大胆“做试验”,而不是一上来就要求 100% 准确。

智慧工地就不再只是一个监控平台,而会变成真正的“施工实验引擎”。从这个视角看:

未来领先的建筑企业,很可能不是项目上 AI 用得多,而是谁更早把“全自动化施工实验室”建在了自己的数据中台里。


三、世界模型 + 自动实验:智慧工地的“科研闭环”长什么样

在 Hassabis 的设想里,AGI 的关键是形成一个完整的科研闭环:

  1. 自己提出问题;
  2. 自己设计环境 / 实验;
  3. 自己执行、收集数据;
  4. 自己修正假设、进入下一轮。

DeepMind 通过 Genie(生成环境)+ Sima(在环境中行动的智能体),在虚拟世界里已经搭起了这样的循环。自动实验室,则把这套逻辑搬到了物理世界。

对于智慧工地,这个“科研闭环”可以这样翻译:

1. 闭环里的四个角色,建筑版怎么对号入座?

(1)提出问题 —— 项目目标与现场痛点

  • 如何在不增加成本的前提下,把主体结构工期再缩短 10%?
  • 如何在保证安全的前提下,提高夜间施工效率?
  • 如何降低塔吊待机时间和空转比例?

(2)生成环境 —— 数字孪生工地 + 规则约束

  • 把 BIM、施工组织设计、总平面布置图、机械设备台账等整合成“工地模拟器”;
  • 把安全规范、工艺标准、资源约束当作“物理规则”写进去;
  • 让 AI 像 Genie 一样,可以生成不同排布、不同策略的“实验工地”。

(3)执行实验 —— 真实项目 + 虚拟仿真双轨

  • 在虚拟环境中大规模尝试不同施工路径;
  • 在真实项目上试点一两种相对优选的策略;
  • 持续收集实际执行过程中的偏差数据。

(4)总结与迭代 —— 企业级施工知识库

  • AI 自动分析“这套方案在哪些场景表现最好”;
  • 给项目团队“推荐方案+解释理由”;
  • 不断把新项目的数据灌回模型,让下一轮更聪明。

这就是建筑版的“AGI 训练场”:

项目是实验室,工程数据是实验记录,施工大脑是研究员。

2. 从“训练回答者”到“训练研究者”,建筑 AI 也得换个思路

Hassabis 说了一句很重要的话:

我们过去训练的是回答者,现在要开始训练研究者。

很多建筑企业现在做的,是把 AI 当“回答者”:

  • 问它规范条文;
  • 让它写施工方案、写安全交底;
  • 让它帮忙查进度、查质量问题。

这些当然有价值,但价值上限有限。真正能拉开差距的,是把 AI 当“研究者”:

  • 让它自己发现“哪个工序总出问题”;
  • 让它自己提出“可以试试把班组调整成 A+B 模式”;
  • 让它自己在数据里找出“这类项目更适合哪种总平布置”。

这要求企业在三个层面做改变:

  1. 组织层面: 给 AI 一个“试错空间”,不要一上来就只接受 100% 准确、0 容错的建议;
  2. 数据层面: 把工程数据当科研数据,而不是只当“竣工资料”;
  3. 产品层面: 智慧工地系统要从报表工具,进化为“会提问、会诊断、会建议”的研究助手。

四、对中国建筑企业的落地建议:从哪三件小事开始

说回现实,国内大部分建筑企业要照搬 DeepMind 肯定不现实,但思路完全可以借。结合上面的分析,我更建议从三件“小而关键”的事情做起:

1. 先给自己的工地,建一个“简版世界模型”

不要一上来就追求全场景数字孪生,可以先选 1~2 类高频场景:

  • 塔吊作业安全与效率;
  • 模板支撑体系安全;
  • 高支模、深基坑等高风险场景。

做法很务实:

  1. 用 BIM + 现场视频 + 传感器数据,描述这个场景的“空间+物理”要素;
  2. 用小模型先做一些简单预测:如塔吊碰撞风险、支撑变形趋势;
  3. 让项目团队在实际工作中不断修正模型预测,逐步积累“直觉”。

关键是:别把 AI 只当识别工具,要有意识地让它学“因果”和“后果”。

2. 把每个项目,当成一次“可回放的实验”

从现在开始,可以至少做到两件事:

  • 项目过程数据结构化:工序开始/结束时间、参与班组、机械使用、质量问题、安全事件,尽量用结构化字段记录;
  • 每个月让 AI 做一次“复盘报告”:谁的效率高、哪种排班好、哪些工法总出问题。

这种“月度复盘”一开始不需要太信 AI 的结论,重要的是:

  • 让 AI 逐渐理解“好的项目表现”长什么样;
  • 让管理层逐渐习惯“用数据说话”,而不是只听经验故事。

3. 选一个试点项目,真正在现场给 AI 一点“决策权”

AI 只有真正对施工决策产生影响,才算从“工具”晋级到“研究者助手”。可以从低风险决策开始:

  • 由 AI 推荐每周的材料到货节奏,项目经理有权修改,但需要说明理由;
  • 由 AI 给班组排班提出“优先建议”,工长只需做微调;
  • 由 AI 给场内车辆路径“打分”,协助安全员优化交通组织。

只要企业愿意在这些“小决策”上给 AI 一点空间,闭环就会逐渐形成。


结语:AGI 的门口,不在参数里,在工地上

Hassabis 讲的那条 AGI 路线,本质上是一句朴素的话:

真正的智能,一定既能看懂世界,也能改造世界。

对中国建筑业来说,这句话非常接地气——一个真正“聪明”的智慧工地系统,也一定既能读懂工地在发生什么,又能给出可执行、可验证的改进建议。

世界模型,让 AI 在数字空间里真正理解施工现场的物理和空间逻辑;
自动实验,让 AI 在一个个项目中不断试、不断犯小错、不断把经验抽象出来。

如果说 AGI 是 DeepMind 要到达的终点,那对建筑企业来说,“能自己提问、自己试验、自己修正”的智慧工地,就是我们这代人的现实目标。谁先把这两个基础打稳,谁就更有机会在未来十年的行业重构里,占到真正的主动权。

🇨🇳 从AGI到智慧工地:世界模型与自动实验如何重塑建筑业 - China | 3L3C