🇨🇳 LeCun怒怼大模型：给中国智慧工地的一份清醒指南 - China

AI在中国建筑行业的应用：智慧工地•2025年12月16日•By 3L3C

LeCun怒怼大模型是硅谷的风波，却给中国智慧工地提了个醒：建筑AI不能只堆大模型，而要真正理解物理世界、拥抱世界模型。

智慧工地建筑AI大模型世界模型BIM协同施工数字化

Featured image for LeCun怒怼大模型：给中国智慧工地的一份清醒指南

LeCun怒怼大模型，对智慧工地反而是个好消息

65岁、拿过图灵奖的Yann LeCun，距离从Meta正式离职只剩3周，却突然把话说得很绝：

“不停堆大模型，用更多合成数据、更多人做对齐，就能走到AGI？——这条路根本不可能成功。”

这句话在硅谷炸锅，对中国建筑行业其实也是一记警钟。

当“AI+建筑”“智慧工地”写进越来越多招标文件和年度计划时，很多项目的思路还是：

先买个“大模型平台”；
把PPT做得很漂亮；
真正落地到安全、质量、进度管理时，却发现水土不服。

LeCun这次“临走前的警告”，并不只是学术口水战，而是直接戳中了一个关键：**光堆大模型，解决不了物理世界的问题。**而建筑，就是一个典型的“物理世界强相关”行业。

下面我想用三个问题，把这场争论和中国智慧工地捏在一起：

LeCun认为的大模型“死路”，到底在死哪里？
他押注的“世界模型”，对智慧工地意味着什么？
今天做建筑AI应用，怎样才能避开泡沫、抓住真价值？

一、大模型的“集体幻觉”：对建筑企业的真正风险

先把立场说清楚：大模型有用，但如果把它当成“万能钥匙”，就是在给项目埋雷。

LeCun这次批评的核心有三点：

数据效率极差：
- 训一个不错的LLM，要吃掉互联网大约30万亿Token文本；
- 换算成视频，只相当于1.5万小时的视频；
- 一个4岁小孩，醒着看到的视觉信息大概就有1.6万小时。
他的意思很简单：人类通过丰富的物理世界学习；LLM是靠“背书”撑起来的。
只会预测下一个词，不懂世界因果：
- LLM擅长组织语言，做知识检索、写文案没问题；
- 但要做“动作-后果”的推演，比如吊装、临边作业风险评估，就很吃力。
行业被LLM“单一文化”绑架：
- 巨头们害怕掉队，于是都在同一条路上疯狂加码：更大模型、更多算力、更多人做对齐；
- 结果是创新方向越来越单一，谁也不敢认真押宝“另一条路”。

对建筑企业，这三点意味着什么？

1）把大模型当“总包”，项目极容易翻车

现在很多所谓“AI+建筑”方案，本质是：

上一个通用大模型；
接几个简单插件；
就宣称可以“全流程赋能建设项目”。

问题在于：

安全帽识别、违章行为监测、塔吊碰撞预警、深基坑变形监测等，80%是视觉+传感器问题；
通用大模型对这些“连续、高维、噪声大”的数据，其实并不擅长；
一味靠“参数更大”“算力更猛”，对现场误报、漏报问题帮助有限。

这就是LeCun说的：用错误的方法疯狂放大，结果只会放大错误。

2）“看上去很智能”的功能，掩盖了真正的短板

我在和不少施工单位聊时，发现两个常见误区：

以为“有个会聊天的AI助手”，就是数字化完成度很高；
认为“模型越大=越聪明=越适合复杂工程”。

但真正影响项目成败的，是这些看起来“不那么AI”的能力：

传感器布点逻辑做得准不准；
视频分析算法对光照、遮挡、天气扰动的鲁棒性；
质量缺陷识别模型，能不能在不同工地、不同施工队之间迁移；
进度预测软件，能否结合BIM、物料、劳务出工等多源数据。

这些能力，本质上都是**“理解和预测物理世界”**，而不是“生成顺滑的回答”。这正好和LeCun批评的LLM短板对上了。

二、LeCun押注的“世界模型”，其实很适合智慧工地

LeCun为什么放着Meta不干，65岁出来创业？

他的答案很直接：

“真正的智能，来自于能在抽象空间中预测行动后果，并据此规划。”

这就是他口中的**“世界模型”（World Model）**，用一句适合工程人的话讲：

做一个能在“虚拟工地”里不断仿真、试错、优化决策的AI大脑。

1）“世界模型”做的，恰好是工程人最关心的事

LeCun的思路是：

不去逐像素预测下一帧视频，而是在抽象表征空间做预测；
先学会“把世界压缩成有用的状态变量”，再学习“状态如何随动作演变”。

如果你换成建筑语境，可以对应成：

把复杂工地，用BIM+传感器数据，抽象成一组“施工状态向量”；
每一个“动作”（工序安排、机械调度、人员配备），都会推动状态转移；
AI要做的是：给定目标（安全、工期、成本），规划出一条最优的状态演化路径。

这和我们常说的：

施工组织设计；
施工阶段性组织优化；
动态资源配置调整；

在概念上高度一致。

2）为什么说智慧工地比互联网应用更需要“世界模型”？

对比一下：

互联网产品更多是信息交互，正确率99%和99.9%，感知差不多；
工地是物理世界+人身安全，一个小错误就可能是事故。

世界模型的几个特性，和智慧工地是天然匹配的：

多模态、高维、连续数据处理能力强
施工现场的数据非常杂：视频、环境传感器、机械运行数据、RTK定位、BIM模型……
强调预测和规划，而不是只做事后分析
比如：
- “这两天天气+进度+班组排布，安全风险在什么时段最高？”
- “如果今天混凝土晚到2小时，对后面4天的工期和成本影响多大？”

可以在“虚拟工地”中大量试错，减少现场试错成本
用仿真+世界模型，提前把：塔吊布置方案、临时道路规划、材料堆场布局，在虚拟空间里跑上千遍。

这比单纯用LLM做“经验问答”，价值要深一层。

3）JEPA思路，对建筑AI有什么具体启发？

LeCun主推的架构叫 JEPA（联合嵌入预测架构），技术细节可以很深，用一张“施工图纸级”的通俗说法是：

不要求AI记住所有细节，而是强迫它找到对预测最有用的抽象特征；
这些特征要既能压缩复杂现场，又能保持对“下一步会怎样”的预测能力。

对应到智慧工地，可以这么想：

不是让AI死记硬背每一个监控画面；
而是学会“这类钢筋绑扎方式+环境+操作习惯”，未来更容易出质量问题；
不是死记每个设备的全部历史数据，而是抽象出几类“健康状态轨迹”，用于预测故障。

这和我们做BIM+AI的思路，是高度契合的。

三、从“堆模型”到“做场景”：给建筑企业的三条建议

把话说狠一点：

建筑企业要做智慧工地，现在最该防的，不是“技术落后”，而是“被大模型叙事带偏”。

结合LeCun这次的观点，以及目前一线项目的实践，我更推荐三条务实路线。

建议一：优先投资“连接物理世界”的能力

和其砸钱上一个看起来很“通用”的大模型平台，不如把钱花在这几件事上：

高质量数据采集
- 摄像头位置、角度、分辨率要针对场景设计，而不是随便装；
- 物联网传感器选型、布点、维护要有工程逻辑，而不是“只为凑KPI”。
BIM+GIS+物联网的统一数字底座
- 把构件、空间、时间、责任人等统一编码；
- 为未来的世界模型、预测模型打好“数据血缘”。
工程语义建模
LLM可以帮你做标准、制度的语言理解，但更关键的是：
- 把“什么叫危险作业”“什么叫关键工序”结构化；
- 这些语义要能和BIM构件、工序模板、设备状态绑定。

这些能力，才是真正的“长期资产”，不会随着某个大模型迭代而全部报废。

建议二：把大模型当“界面层”，不是“决策大脑”

我自己的经验是：在建筑场景里，最合理的大模型定位，是“对话入口+知识助手”，而不是“终极大脑”。

可以这么搭：

底层：传感器、BIM、进度计划、造价、劳务系统等；
中层：针对安全、质量、进度、设备健康的专业模型（不一定是大模型，很多是传统算法+小模型）；
上层：大模型做：
- 多源数据的自然语言查询；
- 规范条文、历史案例的快速检索与解释；
- 把复杂分析结果，转成项目经理听得懂的话。

这样，大模型发挥了“语言和交互”的优势，而对物理世界的理解和预测，交给更合适的模型承担。这和LeCun说的“LLM更像大脑里的语言区，而不是前额叶世界模型”是同一逻辑。

建议三：押注“开放生态”，而不是单一厂商闭环

LeCun这次另一个强烈观点是：

“真正想做出突破，就要让研究开放，允许发表论文，不然很容易自欺欺人。”

这对建筑行业其实非常贴切。建筑项目是高度协同的：业主、总包、分包、监理、设计院、供应商……

如果你的智慧工地方案：

所有数据被锁在一个平台里；
模型参数、算法能力完全黑盒；
BIM、进度、造价系统互不连通；

那不叫“智慧”，那叫“新一代信息孤岛”。

更健康的方式是：

选型时，把“开放接口”“数据可导出”“算法可替换”当成硬指标；
鼓励和高校、科研院所、细分AI公司做联合项目，允许他们发表论文；
在企业内部，建设一支有能力“拆技术方案、看穿PPT”的小团队，而不是完全外包。

LeCun在Meta做FAIR时，靠开源和开放研究，确实把整个视觉、表示学习领域往前推了一大截。建筑行业要想在AI上真正积累能力，也需要类似的“开放心态”。

四、未来5-10年：智慧工地AI会走哪条路？

LeCun的预测挺实在：

他不认同“AGI”这个概念，但认为类人智能是一个渐进过程；
如果世界模型、规划等方向顺利，5-10年内，我们能看到接近“狗的智能水平”的AI；
真正到“接近人类”的水平，可能要20年甚至更久。

把这条时间线放回中国建筑业，有两个现实判断：

未来5年，智慧工地的AI应用，主要还是“增强人”，不是“替代人”
- 风险识别、质量巡检、进度预警会越来越自动化；
- 但最终决策、复杂协调、责任承担，仍然在项目团队。
越早围绕“世界模型思路”搭建数据和场景，你的长期优势越大
- 今天开始认真建设BIM+物联一体的数字工地；
- 从现在的监控、传感、机械数据中，去抽象“可预测的状态变量”；
- 五年后，当更成熟的世界模型技术出现，你会发现自己数据是“能直接用”的。

用一句话收个尾：

大模型热闹，世界模型安静；建筑行业要挣钱和控风险，往往要选那条“安静但正确”的路。

如果你负责企业的数字化、技术发展，不妨回头问自己三个问题：

我们现在做的“AI+建筑”项目，是在解决物理世界的问题，还是只是在堆技术名词？
现有的数据、BIM和系统，是否已经为未来的世界模型留下了接口？
三年后的智慧工地回头看，今天的投入，还有多少是“保质期很长”的？

能把这三件事想清楚，你就已经比大部分还在“被LLM洗脑”的团队，走得更稳了一步。