AGI 要先做好世界模型和自动实验,智慧工地也是同一道题。建筑企业如果把工地当“实验室”,让 AI 真正理解并改造现场,才算走上正确的数字化路径。

从AGI谈起:建筑业真正缺的不是“一个大模型”
很多建筑企业这两年在谈 AI,基本都绕不过两个问题:
- “能不能给我做个工地专属的大模型?”
- “能不能像 ChatGPT 一样,帮我自动管进度、管安全?”
大部分公司把注意力都放在“产品形态”和“模型大小”上,结果是 PoC 做了一堆,真正落地的智慧工地却不多。原因很简单:基础智能没打牢,行业应用自然走不远。
在最新一期 Google DeepMind 播客里,Demis Hassabis 把通往 AGI 的路线压缩成两件事:
世界模型 + 自动实验 = 真正能研究、能动手的 AI
这两件事,说的是 AGI,但对中国建筑业、对智慧工地,其实是同一道题。本文就借 Hassabis 的这次长访谈,聊聊:
- 世界模型到底解决的是什么问题?
- 自动化实验为什么是 AI 真正进入物理世界的起点?
- 这两件事,对智慧工地、对建筑企业上 AI,有什么非常直接的启发?
一、世界模型:让“智慧工地”先真正看懂工地
世界模型的核心,是让 AI 不只是读懂图纸和文本,而是形成对物理世界的“直觉”。
Hassabis 的原话是:
语言模型已经很强,但它们对现实世界的理解是“残缺”的。
同样的问题,今天在大多数智慧工地项目上也很明显:
- 模型能读懂施工方案,却搞不清现场的塔吊、脚手架、临边防护到底在哪;
- 能分析安全制度,却分不清“工人趴下”“工人跌落”的细微差异;
- 能做进度跟踪,却难以准确理解一堵墙在不同施工阶段的空间状态。
原因和 Hassabis 说的一样——只有“语言世界”,没有“物理世界”。
1. 世界模型解决的,是“空间+物理直觉”短板
在 DeepMind 的规划里,世界模型要回答的是这些问题:
- 这个物体能不能倒?会往哪边倒?
- 液体会怎么流?光线怎么变?
- 东西在空间里是如何相对移动的?
映射到建筑场景,就是:
- 钢筋笼如果绑扎有误,吊装过程中潜在会怎么变形?
- 脚手架某几处杆件未按规范搭设,在哪种风载下风险最大?
- 塔吊、车辆、人流在场内如何“抢道”,哪里最容易出现安全冲突?
传统的“智慧工地”更多是规则+识别:
- 摄像头识别未戴安全帽;
- 电子围栏识别越界;
- 进度管理识别“是否完成某道工序”。
这些都还停留在“看到一个画面 / 读到一条记录 —— 匹配一个标签”。缺的是对“过程”和“物理后果”的理解。
2. DeepMind 的世界模型,对建筑业的三个启发
DeepMind 用 Veo、Genie、Sima 等产品在练 AI 的世界模型:
- 通过视频理解运动、光影、流体;
- 通过生成可互动游戏世界练空间结构和反馈;
- 通过虚拟环境中的任务执行,打通“感知-决策-行动”链条。
对建筑行业来说,有几个非常直接的启发:
(1)BIM 只是“几何基础”,不是完整的世界模型
很多企业认为有了 BIM,就等于“数字孪生”,可以直接上 AI。其实:
- BIM 更多是几何和构件信息;
- 世界模型要求的是:AI 能预测“如果这里多了一车混凝土,会堵住哪条施工便道”。
智慧工地的世界模型,需要把这些“非几何信息”也喂给 AI:
- 施工工序逻辑(先干啥、再干啥);
- 设备能力与约束(塔吊回转角度、吊次频率、禁入区域);
- 人员行为模式(上下班节奏、高风险作业时段)。
(2)视频 AI 要从“识别瞬间”升级到“理解演化”
当前做得比较多的是:
- 戴没戴安全帽;
- 有没有烟火;
- 是否系安全带。
下一步更有价值的,是:
- 通过连续画面,判断脚手架搭设过程是否规范;
- 预测某个作业面,在未来 10 分钟内发生坠落或物体打击的概率;
- 结合风速、吊重情况,给塔吊司机实时“风险预警评分”。
这背后,依赖的就是更强的世界模型:AI 不是看一帧图,而是“在心里”模拟未来几帧会发生什么。
(3)数字孪生要从“可视化”进化到“可推演”
很多工地已经有了三维可视化平台,但更多是“好看好演示”。如果引入世界模型,目标应该变成:
- 改变任务排布,系统能实时推演对总工期的影响;
- 模拟不同材料堆放位置,对塔吊利用率和安全风险的综合影响;
- 全场景仿真吊装路径,给出冲突最小的方案。
这才是智慧工地真正的“数字世界”:不仅能看,还能推理和预演。
二、自动实验:AI 不只会算,还要“在工地里试”
Hassabis 认为,AGI 的关键不在于“能回答多少问题”,而在于“能做多少次实验”。
DeepMind 现在在英国建设首个全自动化科学实验室:
- 由 Gemini 负责科学假设、实验设计、数据分析;
- 由机器人负责材料合成、性能测试;
- 每天可以自动完成数百组实验,目标直接瞄准电池、超导、半导体这些硬骨头。
这套思路,对建筑行业特别有参考价值,因为建筑本质上就是一个持续实验的行业:
- 每个项目场地不同、气候不同、工期约束不同;
- 每次总包、分包组合不同,管理文化不同;
- 既有成熟工法,又有大量“项目级小创新”。
如果把 DeepMind 的“自动实验室”类比到工地,会得到一个非常清晰的方向:
智慧工地的升级路径,不是多装几个摄像头,而是搭起一套“自动化施工实验系统”。
1. 建筑版“自动实验室”长什么样?
可以这样拆解:
(1)数字实验平台:先在模型里做“虚拟试验”
- 在 BIM + 进度 + 物资 + 人员数据的综合平台里,AI 自动生成多套施工组织方案;
- 对每套方案进行虚拟仿真:工期、成本、安全风险、资源冲突;
- 让系统像 DeepMind 的材料实验一样,自动“穷举+筛选”。
(2)现场感知闭环:把每天的工地,当作一次真实实验
- 对每个班组、每个工序的表现进行量化:效率、质量、返工率、安全事件;
- 让系统自动分析“哪种排班、哪种工法、哪种布置”表现最好;
- 把结论沉淀成项目级、公司级的“工法知识库”。
(3)跨项目自进化:让企业的经验“指数级增长”
- 不同地区、不同类型项目的数据统一上收;
- AI 自动归纳出“钢结构高层”“市政桥梁”“地铁车站”等场景下的最优策略;
- 形成可被新项目直接调用的“行业级施工大脑”。
说白了,就是把“项目经理拍脑袋+靠经验试”变成“AI 批量做实验+量化出结论”。
2. 为什么建筑行业比想象中更适合“自动实验”?
DeepMind 选择材料科学做自动实验,有两个理由:
- 试错次数多;
- 验证标准清晰。
建筑其实非常类似:
- 一个总包一年几十上百个项目,本身就是在做大量“自然实验”;
- 每个工序都有明确的质量、安全、工期指标,可以量化验证。
建筑企业如果愿意稍微做两件事:
- 把项目过程数据“干净、及时”地记录下来;
- 允许 AI 在虚拟空间里大胆“做试验”,而不是一上来就要求 100% 准确。
智慧工地就不再只是一个监控平台,而会变成真正的“施工实验引擎”。从这个视角看:
未来领先的建筑企业,很可能不是项目上 AI 用得多,而是谁更早把“全自动化施工实验室”建在了自己的数据中台里。
三、世界模型 + 自动实验:智慧工地的“科研闭环”长什么样
在 Hassabis 的设想里,AGI 的关键是形成一个完整的科研闭环:
- 自己提出问题;
- 自己设计环境 / 实验;
- 自己执行、收集数据;
- 自己修正假设、进入下一轮。
DeepMind 通过 Genie(生成环境)+ Sima(在环境中行动的智能体),在虚拟世界里已经搭起了这样的循环。自动实验室,则把这套逻辑搬到了物理世界。
对于智慧工地,这个“科研闭环”可以这样翻译:
1. 闭环里的四个角色,建筑版怎么对号入座?
(1)提出问题 —— 项目目标与现场痛点
- 如何在不增加成本的前提下,把主体结构工期再缩短 10%?
- 如何在保证安全的前提下,提高夜间施工效率?
- 如何降低塔吊待机时间和空转比例?
(2)生成环境 —— 数字孪生工地 + 规则约束
- 把 BIM、施工组织设计、总平面布置图、机械设备台账等整合成“工地模拟器”;
- 把安全规范、工艺标准、资源约束当作“物理规则”写进去;
- 让 AI 像 Genie 一样,可以生成不同排布、不同策略的“实验工地”。
(3)执行实验 —— 真实项目 + 虚拟仿真双轨
- 在虚拟环境中大规模尝试不同施工路径;
- 在真实项目上试点一两种相对优选的策略;
- 持续收集实际执行过程中的偏差数据。
(4)总结与迭代 —— 企业级施工知识库
- AI 自动分析“这套方案在哪些场景表现最好”;
- 给项目团队“推荐方案+解释理由”;
- 不断把新项目的数据灌回模型,让下一轮更聪明。
这就是建筑版的“AGI 训练场”:
项目是实验室,工程数据是实验记录,施工大脑是研究员。
2. 从“训练回答者”到“训练研究者”,建筑 AI 也得换个思路
Hassabis 说了一句很重要的话:
我们过去训练的是回答者,现在要开始训练研究者。
很多建筑企业现在做的,是把 AI 当“回答者”:
- 问它规范条文;
- 让它写施工方案、写安全交底;
- 让它帮忙查进度、查质量问题。
这些当然有价值,但价值上限有限。真正能拉开差距的,是把 AI 当“研究者”:
- 让它自己发现“哪个工序总出问题”;
- 让它自己提出“可以试试把班组调整成 A+B 模式”;
- 让它自己在数据里找出“这类项目更适合哪种总平布置”。
这要求企业在三个层面做改变:
- 组织层面: 给 AI 一个“试错空间”,不要一上来就只接受 100% 准确、0 容错的建议;
- 数据层面: 把工程数据当科研数据,而不是只当“竣工资料”;
- 产品层面: 智慧工地系统要从报表工具,进化为“会提问、会诊断、会建议”的研究助手。
四、对中国建筑企业的落地建议:从哪三件小事开始
说回现实,国内大部分建筑企业要照搬 DeepMind 肯定不现实,但思路完全可以借。结合上面的分析,我更建议从三件“小而关键”的事情做起:
1. 先给自己的工地,建一个“简版世界模型”
不要一上来就追求全场景数字孪生,可以先选 1~2 类高频场景:
- 塔吊作业安全与效率;
- 模板支撑体系安全;
- 高支模、深基坑等高风险场景。
做法很务实:
- 用 BIM + 现场视频 + 传感器数据,描述这个场景的“空间+物理”要素;
- 用小模型先做一些简单预测:如塔吊碰撞风险、支撑变形趋势;
- 让项目团队在实际工作中不断修正模型预测,逐步积累“直觉”。
关键是:别把 AI 只当识别工具,要有意识地让它学“因果”和“后果”。
2. 把每个项目,当成一次“可回放的实验”
从现在开始,可以至少做到两件事:
- 项目过程数据结构化:工序开始/结束时间、参与班组、机械使用、质量问题、安全事件,尽量用结构化字段记录;
- 每个月让 AI 做一次“复盘报告”:谁的效率高、哪种排班好、哪些工法总出问题。
这种“月度复盘”一开始不需要太信 AI 的结论,重要的是:
- 让 AI 逐渐理解“好的项目表现”长什么样;
- 让管理层逐渐习惯“用数据说话”,而不是只听经验故事。
3. 选一个试点项目,真正在现场给 AI 一点“决策权”
AI 只有真正对施工决策产生影响,才算从“工具”晋级到“研究者助手”。可以从低风险决策开始:
- 由 AI 推荐每周的材料到货节奏,项目经理有权修改,但需要说明理由;
- 由 AI 给班组排班提出“优先建议”,工长只需做微调;
- 由 AI 给场内车辆路径“打分”,协助安全员优化交通组织。
只要企业愿意在这些“小决策”上给 AI 一点空间,闭环就会逐渐形成。
结语:AGI 的门口,不在参数里,在工地上
Hassabis 讲的那条 AGI 路线,本质上是一句朴素的话:
真正的智能,一定既能看懂世界,也能改造世界。
对中国建筑业来说,这句话非常接地气——一个真正“聪明”的智慧工地系统,也一定既能读懂工地在发生什么,又能给出可执行、可验证的改进建议。
世界模型,让 AI 在数字空间里真正理解施工现场的物理和空间逻辑;
自动实验,让 AI 在一个个项目中不断试、不断犯小错、不断把经验抽象出来。
如果说 AGI 是 DeepMind 要到达的终点,那对建筑企业来说,“能自己提问、自己试验、自己修正”的智慧工地,就是我们这代人的现实目标。谁先把这两个基础打稳,谁就更有机会在未来十年的行业重构里,占到真正的主动权。