🇨🇳 从AGI到智慧工地：世界模型与自动实验如何重塑建筑业 - China

AI在中国建筑行业的应用：智慧工地•2025年12月17日•By 3L3C

AGI 要先做好世界模型和自动实验，智慧工地也是同一道题。建筑企业如果把工地当“实验室”，让 AI 真正理解并改造现场，才算走上正确的数字化路径。

智慧工地建筑业数字化人工智能世界模型自动化实验BIM应用

Featured image for 从AGI到智慧工地：世界模型与自动实验如何重塑建筑业

从AGI谈起：建筑业真正缺的不是“一个大模型”

很多建筑企业这两年在谈 AI，基本都绕不过两个问题：

“能不能给我做个工地专属的大模型？”
“能不能像 ChatGPT 一样，帮我自动管进度、管安全？”

大部分公司把注意力都放在“产品形态”和“模型大小”上，结果是 PoC 做了一堆，真正落地的智慧工地却不多。原因很简单：基础智能没打牢，行业应用自然走不远。

在最新一期 Google DeepMind 播客里，Demis Hassabis 把通往 AGI 的路线压缩成两件事：

世界模型 + 自动实验 = 真正能研究、能动手的 AI

这两件事，说的是 AGI，但对中国建筑业、对智慧工地，其实是同一道题。本文就借 Hassabis 的这次长访谈，聊聊：

世界模型到底解决的是什么问题？
自动化实验为什么是 AI 真正进入物理世界的起点？
这两件事，对智慧工地、对建筑企业上 AI，有什么非常直接的启发？

一、世界模型：让“智慧工地”先真正看懂工地

世界模型的核心，是让 AI 不只是读懂图纸和文本，而是形成对物理世界的“直觉”。

Hassabis 的原话是：

语言模型已经很强，但它们对现实世界的理解是“残缺”的。

同样的问题，今天在大多数智慧工地项目上也很明显：

模型能读懂施工方案，却搞不清现场的塔吊、脚手架、临边防护到底在哪；
能分析安全制度，却分不清“工人趴下”“工人跌落”的细微差异；
能做进度跟踪，却难以准确理解一堵墙在不同施工阶段的空间状态。

原因和 Hassabis 说的一样——只有“语言世界”，没有“物理世界”。

1. 世界模型解决的，是“空间+物理直觉”短板

在 DeepMind 的规划里，世界模型要回答的是这些问题：

这个物体能不能倒？会往哪边倒？
液体会怎么流？光线怎么变？
东西在空间里是如何相对移动的？

映射到建筑场景，就是：

钢筋笼如果绑扎有误，吊装过程中潜在会怎么变形？
脚手架某几处杆件未按规范搭设，在哪种风载下风险最大？
塔吊、车辆、人流在场内如何“抢道”，哪里最容易出现安全冲突？

传统的“智慧工地”更多是规则+识别：

摄像头识别未戴安全帽；
电子围栏识别越界；
进度管理识别“是否完成某道工序”。

这些都还停留在“看到一个画面 / 读到一条记录 —— 匹配一个标签”。缺的是对“过程”和“物理后果”的理解。

2. DeepMind 的世界模型，对建筑业的三个启发

DeepMind 用 Veo、Genie、Sima 等产品在练 AI 的世界模型：

通过视频理解运动、光影、流体；
通过生成可互动游戏世界练空间结构和反馈；
通过虚拟环境中的任务执行，打通“感知-决策-行动”链条。

对建筑行业来说，有几个非常直接的启发：

（1）BIM 只是“几何基础”，不是完整的世界模型

很多企业认为有了 BIM，就等于“数字孪生”，可以直接上 AI。其实：

BIM 更多是几何和构件信息；
世界模型要求的是：AI 能预测“如果这里多了一车混凝土，会堵住哪条施工便道”。

智慧工地的世界模型，需要把这些“非几何信息”也喂给 AI：

施工工序逻辑（先干啥、再干啥）；
设备能力与约束（塔吊回转角度、吊次频率、禁入区域）；
人员行为模式（上下班节奏、高风险作业时段）。

（2）视频 AI 要从“识别瞬间”升级到“理解演化”

当前做得比较多的是：

戴没戴安全帽；
有没有烟火；
是否系安全带。

下一步更有价值的，是：

通过连续画面，判断脚手架搭设过程是否规范；
预测某个作业面，在未来 10 分钟内发生坠落或物体打击的概率；
结合风速、吊重情况，给塔吊司机实时“风险预警评分”。

这背后，依赖的就是更强的世界模型：AI 不是看一帧图，而是“在心里”模拟未来几帧会发生什么。

（3）数字孪生要从“可视化”进化到“可推演”

很多工地已经有了三维可视化平台，但更多是“好看好演示”。如果引入世界模型，目标应该变成：

改变任务排布，系统能实时推演对总工期的影响；
模拟不同材料堆放位置，对塔吊利用率和安全风险的综合影响；
全场景仿真吊装路径，给出冲突最小的方案。

这才是智慧工地真正的“数字世界”：不仅能看，还能推理和预演。

二、自动实验：AI 不只会算，还要“在工地里试”

Hassabis 认为，AGI 的关键不在于“能回答多少问题”，而在于“能做多少次实验”。

DeepMind 现在在英国建设首个全自动化科学实验室：

由 Gemini 负责科学假设、实验设计、数据分析；
由机器人负责材料合成、性能测试；
每天可以自动完成数百组实验，目标直接瞄准电池、超导、半导体这些硬骨头。

这套思路，对建筑行业特别有参考价值，因为建筑本质上就是一个持续实验的行业：

每个项目场地不同、气候不同、工期约束不同；
每次总包、分包组合不同，管理文化不同；
既有成熟工法，又有大量“项目级小创新”。

如果把 DeepMind 的“自动实验室”类比到工地，会得到一个非常清晰的方向：

智慧工地的升级路径，不是多装几个摄像头，而是搭起一套“自动化施工实验系统”。

1. 建筑版“自动实验室”长什么样？

可以这样拆解：

（1）数字实验平台：先在模型里做“虚拟试验”

在 BIM + 进度 + 物资 + 人员数据的综合平台里，AI 自动生成多套施工组织方案；
对每套方案进行虚拟仿真：工期、成本、安全风险、资源冲突；
让系统像 DeepMind 的材料实验一样，自动“穷举+筛选”。

（2）现场感知闭环：把每天的工地，当作一次真实实验

对每个班组、每个工序的表现进行量化：效率、质量、返工率、安全事件；
让系统自动分析“哪种排班、哪种工法、哪种布置”表现最好；
把结论沉淀成项目级、公司级的“工法知识库”。

（3）跨项目自进化：让企业的经验“指数级增长”

不同地区、不同类型项目的数据统一上收；
AI 自动归纳出“钢结构高层”“市政桥梁”“地铁车站”等场景下的最优策略；
形成可被新项目直接调用的“行业级施工大脑”。

说白了，就是把“项目经理拍脑袋+靠经验试”变成“AI 批量做实验+量化出结论”。

2. 为什么建筑行业比想象中更适合“自动实验”？

DeepMind 选择材料科学做自动实验，有两个理由：

试错次数多；
验证标准清晰。

建筑其实非常类似：

一个总包一年几十上百个项目，本身就是在做大量“自然实验”；
每个工序都有明确的质量、安全、工期指标，可以量化验证。

建筑企业如果愿意稍微做两件事：

把项目过程数据“干净、及时”地记录下来；
允许 AI 在虚拟空间里大胆“做试验”，而不是一上来就要求 100% 准确。

智慧工地就不再只是一个监控平台，而会变成真正的“施工实验引擎”。从这个视角看：

未来领先的建筑企业，很可能不是项目上 AI 用得多，而是谁更早把“全自动化施工实验室”建在了自己的数据中台里。

三、世界模型 + 自动实验：智慧工地的“科研闭环”长什么样

在 Hassabis 的设想里，AGI 的关键是形成一个完整的科研闭环：

自己提出问题；
自己设计环境 / 实验；
自己执行、收集数据；
自己修正假设、进入下一轮。

DeepMind 通过 Genie（生成环境）+ Sima（在环境中行动的智能体），在虚拟世界里已经搭起了这样的循环。自动实验室，则把这套逻辑搬到了物理世界。

对于智慧工地，这个“科研闭环”可以这样翻译：

1. 闭环里的四个角色，建筑版怎么对号入座？

（1）提出问题 —— 项目目标与现场痛点

如何在不增加成本的前提下，把主体结构工期再缩短 10%？
如何在保证安全的前提下，提高夜间施工效率？
如何降低塔吊待机时间和空转比例？

（2）生成环境 —— 数字孪生工地 + 规则约束

把 BIM、施工组织设计、总平面布置图、机械设备台账等整合成“工地模拟器”；
把安全规范、工艺标准、资源约束当作“物理规则”写进去；
让 AI 像 Genie 一样，可以生成不同排布、不同策略的“实验工地”。

（3）执行实验 —— 真实项目 + 虚拟仿真双轨

在虚拟环境中大规模尝试不同施工路径；
在真实项目上试点一两种相对优选的策略；
持续收集实际执行过程中的偏差数据。

（4）总结与迭代 —— 企业级施工知识库

AI 自动分析“这套方案在哪些场景表现最好”；
给项目团队“推荐方案+解释理由”；
不断把新项目的数据灌回模型，让下一轮更聪明。

这就是建筑版的“AGI 训练场”：

项目是实验室，工程数据是实验记录，施工大脑是研究员。

2. 从“训练回答者”到“训练研究者”，建筑 AI 也得换个思路

Hassabis 说了一句很重要的话：

我们过去训练的是回答者，现在要开始训练研究者。

很多建筑企业现在做的，是把 AI 当“回答者”：

问它规范条文；
让它写施工方案、写安全交底；
让它帮忙查进度、查质量问题。

这些当然有价值，但价值上限有限。真正能拉开差距的，是把 AI 当“研究者”：

让它自己发现“哪个工序总出问题”；
让它自己提出“可以试试把班组调整成 A+B 模式”；
让它自己在数据里找出“这类项目更适合哪种总平布置”。

这要求企业在三个层面做改变：

组织层面： 给 AI 一个“试错空间”，不要一上来就只接受 100% 准确、0 容错的建议；
数据层面： 把工程数据当科研数据，而不是只当“竣工资料”；
产品层面： 智慧工地系统要从报表工具，进化为“会提问、会诊断、会建议”的研究助手。

四、对中国建筑企业的落地建议：从哪三件小事开始

说回现实，国内大部分建筑企业要照搬 DeepMind 肯定不现实，但思路完全可以借。结合上面的分析，我更建议从三件“小而关键”的事情做起：

1. 先给自己的工地，建一个“简版世界模型”

不要一上来就追求全场景数字孪生，可以先选 1~2 类高频场景：

塔吊作业安全与效率；
模板支撑体系安全；
高支模、深基坑等高风险场景。

做法很务实：

用 BIM + 现场视频 + 传感器数据，描述这个场景的“空间+物理”要素；
用小模型先做一些简单预测：如塔吊碰撞风险、支撑变形趋势；
让项目团队在实际工作中不断修正模型预测，逐步积累“直觉”。

关键是：别把 AI 只当识别工具，要有意识地让它学“因果”和“后果”。

2. 把每个项目，当成一次“可回放的实验”

从现在开始，可以至少做到两件事：

项目过程数据结构化：工序开始/结束时间、参与班组、机械使用、质量问题、安全事件，尽量用结构化字段记录；
每个月让 AI 做一次“复盘报告”：谁的效率高、哪种排班好、哪些工法总出问题。

这种“月度复盘”一开始不需要太信 AI 的结论，重要的是：

让 AI 逐渐理解“好的项目表现”长什么样；
让管理层逐渐习惯“用数据说话”，而不是只听经验故事。

3. 选一个试点项目，真正在现场给 AI 一点“决策权”

AI 只有真正对施工决策产生影响，才算从“工具”晋级到“研究者助手”。可以从低风险决策开始：

由 AI 推荐每周的材料到货节奏，项目经理有权修改，但需要说明理由；
由 AI 给班组排班提出“优先建议”，工长只需做微调；
由 AI 给场内车辆路径“打分”，协助安全员优化交通组织。

只要企业愿意在这些“小决策”上给 AI 一点空间，闭环就会逐渐形成。

结语：AGI 的门口，不在参数里，在工地上

Hassabis 讲的那条 AGI 路线，本质上是一句朴素的话：

真正的智能，一定既能看懂世界，也能改造世界。

对中国建筑业来说，这句话非常接地气——一个真正“聪明”的智慧工地系统，也一定既能读懂工地在发生什么，又能给出可执行、可验证的改进建议。

世界模型，让 AI 在数字空间里真正理解施工现场的物理和空间逻辑；
自动实验，让 AI 在一个个项目中不断试、不断犯小错、不断把经验抽象出来。

如果说 AGI 是 DeepMind 要到达的终点，那对建筑企业来说，“能自己提问、自己试验、自己修正”的智慧工地，就是我们这代人的现实目标。谁先把这两个基础打稳，谁就更有机会在未来十年的行业重构里，占到真正的主动权。