LeCun怒怼大模型是硅谷的风波,却给中国智慧工地提了个醒:建筑AI不能只堆大模型,而要真正理解物理世界、拥抱世界模型。

LeCun怒怼大模型,对智慧工地反而是个好消息
65岁、拿过图灵奖的Yann LeCun,距离从Meta正式离职只剩3周,却突然把话说得很绝:
“不停堆大模型,用更多合成数据、更多人做对齐,就能走到AGI?——这条路根本不可能成功。”
这句话在硅谷炸锅,对中国建筑行业其实也是一记警钟。
当“AI+建筑”“智慧工地”写进越来越多招标文件和年度计划时,很多项目的思路还是:
- 先买个“大模型平台”;
- 把PPT做得很漂亮;
- 真正落地到安全、质量、进度管理时,却发现水土不服。
LeCun这次“临走前的警告”,并不只是学术口水战,而是直接戳中了一个关键:**光堆大模型,解决不了物理世界的问题。**而建筑,就是一个典型的“物理世界强相关”行业。
下面我想用三个问题,把这场争论和中国智慧工地捏在一起:
- LeCun认为的大模型“死路”,到底在死哪里?
- 他押注的“世界模型”,对智慧工地意味着什么?
- 今天做建筑AI应用,怎样才能避开泡沫、抓住真价值?
一、大模型的“集体幻觉”:对建筑企业的真正风险
先把立场说清楚:大模型有用,但如果把它当成“万能钥匙”,就是在给项目埋雷。
LeCun这次批评的核心有三点:
-
数据效率极差:
- 训一个不错的LLM,要吃掉互联网大约30万亿Token文本;
- 换算成视频,只相当于1.5万小时的视频;
- 一个4岁小孩,醒着看到的视觉信息大概就有1.6万小时。
他的意思很简单:人类通过丰富的物理世界学习;LLM是靠“背书”撑起来的。
-
只会预测下一个词,不懂世界因果:
- LLM擅长组织语言,做知识检索、写文案没问题;
- 但要做“动作-后果”的推演,比如吊装、临边作业风险评估,就很吃力。
-
行业被LLM“单一文化”绑架:
- 巨头们害怕掉队,于是都在同一条路上疯狂加码:更大模型、更多算力、更多人做对齐;
- 结果是创新方向越来越单一,谁也不敢认真押宝“另一条路”。
对建筑企业,这三点意味着什么?
1)把大模型当“总包”,项目极容易翻车
现在很多所谓“AI+建筑”方案,本质是:
- 上一个通用大模型;
- 接几个简单插件;
- 就宣称可以“全流程赋能建设项目”。
问题在于:
- 安全帽识别、违章行为监测、塔吊碰撞预警、深基坑变形监测等,80%是视觉+传感器问题;
- 通用大模型对这些“连续、高维、噪声大”的数据,其实并不擅长;
- 一味靠“参数更大”“算力更猛”,对现场误报、漏报问题帮助有限。
这就是LeCun说的:用错误的方法疯狂放大,结果只会放大错误。
2)“看上去很智能”的功能,掩盖了真正的短板
我在和不少施工单位聊时,发现两个常见误区:
- 以为“有个会聊天的AI助手”,就是数字化完成度很高;
- 认为“模型越大=越聪明=越适合复杂工程”。
但真正影响项目成败的,是这些看起来“不那么AI”的能力:
- 传感器布点逻辑做得准不准;
- 视频分析算法对光照、遮挡、天气扰动的鲁棒性;
- 质量缺陷识别模型,能不能在不同工地、不同施工队之间迁移;
- 进度预测软件,能否结合BIM、物料、劳务出工等多源数据。
这些能力,本质上都是**“理解和预测物理世界”**,而不是“生成顺滑的回答”。这正好和LeCun批评的LLM短板对上了。
二、LeCun押注的“世界模型”,其实很适合智慧工地
LeCun为什么放着Meta不干,65岁出来创业?
他的答案很直接:
“真正的智能,来自于能在抽象空间中预测行动后果,并据此规划。”
这就是他口中的**“世界模型”(World Model)**,用一句适合工程人的话讲:
做一个能在“虚拟工地”里不断仿真、试错、优化决策的AI大脑。
1)“世界模型”做的,恰好是工程人最关心的事
LeCun的思路是:
- 不去逐像素预测下一帧视频,而是在抽象表征空间做预测;
- 先学会“把世界压缩成有用的状态变量”,再学习“状态如何随动作演变”。
如果你换成建筑语境,可以对应成:
- 把复杂工地,用BIM+传感器数据,抽象成一组“施工状态向量”;
- 每一个“动作”(工序安排、机械调度、人员配备),都会推动状态转移;
- AI要做的是:给定目标(安全、工期、成本),规划出一条最优的状态演化路径。
这和我们常说的:
- 施工组织设计;
- 施工阶段性组织优化;
- 动态资源配置调整;
在概念上高度一致。
2)为什么说智慧工地比互联网应用更需要“世界模型”?
对比一下:
- 互联网产品更多是信息交互,正确率99%和99.9%,感知差不多;
- 工地是物理世界+人身安全,一个小错误就可能是事故。
世界模型的几个特性,和智慧工地是天然匹配的:
-
多模态、高维、连续数据处理能力强
施工现场的数据非常杂:视频、环境传感器、机械运行数据、RTK定位、BIM模型…… -
强调预测和规划,而不是只做事后分析
比如:- “这两天天气+进度+班组排布,安全风险在什么时段最高?”
- “如果今天混凝土晚到2小时,对后面4天的工期和成本影响多大?”
- 可以在“虚拟工地”中大量试错,减少现场试错成本
用仿真+世界模型,提前把:塔吊布置方案、临时道路规划、材料堆场布局,在虚拟空间里跑上千遍。
这比单纯用LLM做“经验问答”,价值要深一层。
3)JEPA思路,对建筑AI有什么具体启发?
LeCun主推的架构叫 JEPA(联合嵌入预测架构),技术细节可以很深,用一张“施工图纸级”的通俗说法是:
- 不要求AI记住所有细节,而是强迫它找到对预测最有用的抽象特征;
- 这些特征要既能压缩复杂现场,又能保持对“下一步会怎样”的预测能力。
对应到智慧工地,可以这么想:
- 不是让AI死记硬背每一个监控画面;
- 而是学会“这类钢筋绑扎方式+环境+操作习惯”,未来更容易出质量问题;
- 不是死记每个设备的全部历史数据,而是抽象出几类“健康状态轨迹”,用于预测故障。
这和我们做BIM+AI的思路,是高度契合的。
三、从“堆模型”到“做场景”:给建筑企业的三条建议
把话说狠一点:
建筑企业要做智慧工地,现在最该防的,不是“技术落后”,而是“被大模型叙事带偏”。
结合LeCun这次的观点,以及目前一线项目的实践,我更推荐三条务实路线。
建议一:优先投资“连接物理世界”的能力
和其砸钱上一个看起来很“通用”的大模型平台,不如把钱花在这几件事上:
-
高质量数据采集
- 摄像头位置、角度、分辨率要针对场景设计,而不是随便装;
- 物联网传感器选型、布点、维护要有工程逻辑,而不是“只为凑KPI”。
-
BIM+GIS+物联网的统一数字底座
- 把构件、空间、时间、责任人等统一编码;
- 为未来的世界模型、预测模型打好“数据血缘”。
-
工程语义建模
LLM可以帮你做标准、制度的语言理解,但更关键的是:- 把“什么叫危险作业”“什么叫关键工序”结构化;
- 这些语义要能和BIM构件、工序模板、设备状态绑定。
这些能力,才是真正的“长期资产”,不会随着某个大模型迭代而全部报废。
建议二:把大模型当“界面层”,不是“决策大脑”
我自己的经验是:在建筑场景里,最合理的大模型定位,是“对话入口+知识助手”,而不是“终极大脑”。
可以这么搭:
- 底层:传感器、BIM、进度计划、造价、劳务系统等;
- 中层:针对安全、质量、进度、设备健康的专业模型(不一定是大模型,很多是传统算法+小模型);
- 上层:大模型做:
- 多源数据的自然语言查询;
- 规范条文、历史案例的快速检索与解释;
- 把复杂分析结果,转成项目经理听得懂的话。
这样,大模型发挥了“语言和交互”的优势,而对物理世界的理解和预测,交给更合适的模型承担。这和LeCun说的“LLM更像大脑里的语言区,而不是前额叶世界模型”是同一逻辑。
建议三:押注“开放生态”,而不是单一厂商闭环
LeCun这次另一个强烈观点是:
“真正想做出突破,就要让研究开放,允许发表论文,不然很容易自欺欺人。”
这对建筑行业其实非常贴切。建筑项目是高度协同的:业主、总包、分包、监理、设计院、供应商……
如果你的智慧工地方案:
- 所有数据被锁在一个平台里;
- 模型参数、算法能力完全黑盒;
- BIM、进度、造价系统互不连通;
那不叫“智慧”,那叫“新一代信息孤岛”。
更健康的方式是:
- 选型时,把“开放接口”“数据可导出”“算法可替换”当成硬指标;
- 鼓励和高校、科研院所、细分AI公司做联合项目,允许他们发表论文;
- 在企业内部,建设一支有能力“拆技术方案、看穿PPT”的小团队,而不是完全外包。
LeCun在Meta做FAIR时,靠开源和开放研究,确实把整个视觉、表示学习领域往前推了一大截。建筑行业要想在AI上真正积累能力,也需要类似的“开放心态”。
四、未来5-10年:智慧工地AI会走哪条路?
LeCun的预测挺实在:
- 他不认同“AGI”这个概念,但认为类人智能是一个渐进过程;
- 如果世界模型、规划等方向顺利,5-10年内,我们能看到接近“狗的智能水平”的AI;
- 真正到“接近人类”的水平,可能要20年甚至更久。
把这条时间线放回中国建筑业,有两个现实判断:
-
未来5年,智慧工地的AI应用,主要还是“增强人”,不是“替代人”
- 风险识别、质量巡检、进度预警会越来越自动化;
- 但最终决策、复杂协调、责任承担,仍然在项目团队。
-
越早围绕“世界模型思路”搭建数据和场景,你的长期优势越大
- 今天开始认真建设BIM+物联一体的数字工地;
- 从现在的监控、传感、机械数据中,去抽象“可预测的状态变量”;
- 五年后,当更成熟的世界模型技术出现,你会发现自己数据是“能直接用”的。
用一句话收个尾:
大模型热闹,世界模型安静;建筑行业要挣钱和控风险,往往要选那条“安静但正确”的路。
如果你负责企业的数字化、技术发展,不妨回头问自己三个问题:
- 我们现在做的“AI+建筑”项目,是在解决物理世界的问题,还是只是在堆技术名词?
- 现有的数据、BIM和系统,是否已经为未来的世界模型留下了接口?
- 三年后的智慧工地回头看,今天的投入,还有多少是“保质期很长”的?
能把这三件事想清楚,你就已经比大部分还在“被LLM洗脑”的团队,走得更稳了一步。