LeCun 说“AGI 是胡扯”,但他的世界模型思路,却给中国智慧工地指了一条更务实的 AI 路线:先实现“狗的智能”,再谈未来。

在过去两年,大模型让无数建筑企业开始考虑“搞个AI项目”。但数据摆在那儿:不少智慧工地试点最后只剩一个“会聊天的机器人”,对安全、进度、质量几乎没有实质影响。
Yann LeCun 的观点很扎心:
“靠堆大语言模型、喂更多合成数据,就想走到超级智能,在我看来完全是胡扯。”
这不是茶水间吐槽,而是图灵奖得主、前 Meta 首席 AI 科学家在 65 岁选择离开大厂、自己创业时,说出的原话。他押注的方向,叫“世界模型(World Model)”。
对做智慧工地的中国建筑企业来说,这番话非常应景:建筑业真正需要的,是能感知现场、预测风险、做出动作的 AI,而不是只会“说得好听”的 AI。
下面这篇文章,会用 LeCun 的思路,帮你重新审视:智慧工地到底该用哪种 AI?“狗的智能”跟工地有什么关系?AGI 这种概念,值不值得建筑企业花时间担心?
1. 语言大模型不是智慧工地的“终点站”
建筑企业现在最常见的 AI 玩法有三种:
- 基于图像识别做安全帽检测、人员闯入告警;
- 基于自然语言做智能客服、智能质检问答;
- 基于规则引擎做进度预警、成本分析。
实话讲,这些都有价值,但都没碰到 LeCun 说的“智能本质”。
LeCun 的判断很直接:
“仅靠文本训练,永远不可能达到人类水平的智能。”
为什么?因为语言模型本质上是“超级复读机”:
- 它记住了海量文本事实和话术;
- 它非常擅长“接下去应该说什么”;
- 但它不直接接触物理世界,也没有身体和动作。
对于智慧工地,这意味着:
- 只会“回答问题”的 AI,帮不了塔吊避让、帮不了临边防护、也盯不住高处坠落;
- 只会“生成报告”的 AI,很难真正优化施工工序,也预测不了明天哪一段脚手架风险最高;
- 只靠喂更多文本、更多图纸,并不能让系统自己“长出”对风力、荷载、拥挤通道这些真实风险的理解。
**建设工程是高度物理化、强空间感的行业。**如果 AI 不理解空间、不理解物体、不理解时间序列上的变化,它就只能停留在“数字好看”的 PPT,而不是能救命、能省钱的系统。
这也是为什么,很多智慧工地项目最终沦为“数据大屏 + 聊天机器人”,真正落地能力有限。
2. 为什么 LeCun 说“先做到狗的智能”比 AGI 更靠谱?
LeCun 有个非常有意思的说法:真正难的是让机器达到“狗的智能”,而不是“人类的智能”。
听上去有点反直觉,但拿工地场景一对比,你就知道他在说什么。
一条狗能做到什么?
- 在复杂环境里自由行走、避开障碍;
- 识别主人、理解简单指令;
- 记住常见路线、对危险声音做出反应。
反观现在绝大多数“智慧工地 AI”:
- 摄像头看到障碍物,往往只能“框出来”、“报个警”,不会自主规划绕行路径;
- 机器人在复杂工地环境里经常“迷路”,对坑洞、湿滑、脚手架这些场景非常脆弱;
- 安防系统对噪声、机械声、喊叫声的理解非常有限,难以真正理解“危险正在发生”。
LeCun 的判断是:
“一旦达到狗的水平,大多数智能的核心要素就齐了,人类和高等灵长类真正新增的关键能力,主要是语言。”
对建筑业来说,这个观点非常实用:
- 你不需要等什么“AGI”降临;
- 也不用纠结“AI 会不会统治世界”;
- 更现实的目标,是把你的智慧工地系统,做成一个有“狗的智能”的工地助手。
能自己看懂施工现场的状态,能记住历史情况,能预测下一步可能发生什么,并做出合理动作——哪怕只是自动减速、自动停机、自动通知值班员。
这比在微信群里再多加一个“会聊天的机器人”,价值大得多。
3. 世界模型:智慧工地真正需要的“第二大脑”
那怎么从“会说话的 AI”走向“有狗的智能的 AI”?LeCun 给出的答案是:世界模型(World Model)。
一句人话版的定义:
世界模型就是让机器在“抽象空间”里,学会理解“世界是怎么变化的”,从而预测自己行动的后果,并据此做规划。
这跟智慧工地有什么关系?关系非常直接。
3.1 传统工地 AI 在“看”和“算”上停住了
现在大部分智慧工地系统,只做到了三件事:
- 看得见:摄像头抓拍;
- 认得出:算法识别出安全帽、反光衣、人员闯入等;
- 算得出:BI 报表展示出工人数量、塔机运行曲线、混凝土浇筑量等。
缺什么?
- 缺“如果现在不停机,5 分钟后会怎么样”的预测;
- 缺“为按期封顶,这一周班组人员和机械最优排布”的规划;
- 缺“看到工人站位不稳,就提前给出危险动作提醒”的实时干预。
3.2 世界模型能多做两步:预测 + 行动
LeCun 认为,智能的核心是两件事:
- 预测自己行为的后果;
- 基于预测做规划(Planning)。
放回智慧工地,你可以这样理解“世界模型工地大脑”会做什么:
-
安全方面:
- 通过历史视频和传感器数据,学会“危险动作”的发生模式;
- 预测“3 分钟后这块区域发生坠落/碰撞的概率”;
- 提前控制塔吊速度、限制某些设备进入危险区域,或主动联动语音广播、戴在工人身上的震动提醒。
-
进度方面:
- 在抽象空间里预测“工序 A 推迟两天,会如何连锁影响后续 5 个工序”;
- 自动给出几套可行调整方案:加班、平行作业、设备调配,让项目经理做决策时更有底。
-
质量方面:
- 通过对浇筑温度、振捣时间、养护环境的连续数据建模,预测哪块混凝土未来更可能出现空鼓裂缝;
- 提前安排复检和补强,而不是等到交付前才被监理“打回来”。
这里面最关键的转变是:
从“对已发生事件做识别” → “对尚未发生的结果做预测与规划”。
这就是世界模型相对单纯识别、分类算法的本质升级。
4. 只会说话的 AI vs 会“理解工地”的 AI
LeCun 对当前硅谷的批评,其实可以直接照进建筑业 AI:
“整个行业都被大语言模型洗脑了,大家都在做同一件事。”
在智慧工地项目上,这种“洗脑”表现为:
- 一开会就讨论“我们要不要做一个工地大模型”;
- 方案 PPT 里只写“AI 算法 + 大屏 + 机器人对话接口”;
- 真正跟施工组织、工序优化、风险控制相关的建模工作,几乎没人愿意花预算做。
问题在于:
- 语言模型擅长的是“对话、总结、润色、解释”;
- 但智慧工地最难的部分在于“感知混乱环境 + 做实时决策”。
LeCun 的路线非常清晰:
- 世界模型处理的是高维、连续、含噪声的数据——典型就是视频、传感器、机械运行曲线,这跟工地现场的数据结构高度一致;
- 预测发生在抽象表征空间,而不是像素和文字上——用更少的信息,保留最关键的“世界结构”,例如“这里有个洞”“这里有一群人”“那边有快速移动的臂架”;
- 在预测的基础上做规划,而不是在句子里玩花活——比如自动规划塔吊行走路线,自动编排混凝土车进场节奏。
智慧工地真正需要的,是这类“理解世界 + 规划行动”的 AI,把语言模型放在辅助交互的位置,而不是当主角。
5. 开放 vs 封闭:建筑企业如何避免被“AI 绑架”?
LeCun 创业时强调一点:真正的研究必须是开放的。如果一家公司 AI 技术全部封闭、不发论文、不交流,内部往往会高估自己的水平、低估外部进展。
这对建筑企业其实是一个很实在的提醒。
现在不少总包、开发商在上智慧工地时,常见几个“坑”:
- 被单一厂商锁死:算法、数据、平台都在对方云上,一旦不续费,所有能力归零;
- 模型完全黑箱:出了问题只能等厂商调参,甲方技术团队无法理解原理,更无可能自己优化;
- 数据不沉淀:工地换一批系统,历史数据就断层,世界模型永远学不出“企业自己的经验”。
结合 LeCun 的观点,我更推荐建筑企业在智慧工地 AI 上坚持三条原则:
- 优先选择开放架构:底层尽量采用主流开源组件和行业标准协议,模型可迁移、数据可导出;
- 自建小规模能力 + 外部合作:关键场景(如安全、进度)至少要有一支内部团队能看懂算法逻辑,哪怕一开始做得粗糙;
- 把“世界模型”视为企业资产,而不是某个项目功能:把历年项目的现场视频、传感器数据、进度计划、质量记录,逐步沉淀成一个跨项目、跨地区的“企业级施工世界模型”。
谁先把这件事做扎实,谁在未来 5~10 年的建筑 AI 竞争里,就会拥有一块真正难以复制的“隐形资产”。
6. 给中国建筑企业的三点落地建议
把 LeCun 的技术争论,翻译成对建筑企业有用的话,我会给出三条很现实的建议:
6.1 KPI 不要只盯“会不会说话”,要盯“会不会预测和行动”
评估一个智慧工地 AI 是否值得投资,至少加上这几个问题:
- 它能不能基于历史数据,预测未来 1~7 天的安全高风险时段?
- 它能不能给出两套以上“工序/资源调整方案”,而不是只报“可能延期”?
- 它能不能自动触发设备动作(减速、停机、改路径),而不仅仅是弹个告警?
如果答案都是“不能”,那大概率只是一个更聪明的展示层,而不是“会思考的工地大脑”。
6.2 数据建设要从“视频 + 传感器时间序列”开始
想做世界模型,最宝贵的不是文本,而是时间序列数据:
- 连续视频(塔吊摄像、升降机、卸料平台、出入口);
- 传感器数据(位移、倾角、风速、混凝土温度、振捣电流、能耗曲线);
- 进度实际完成时间线(真正的开始/完成时间,而不是计划表里的数字)。
对这些数据:
- 做好结构化存储与统一时间轴;
- 把典型事故、典型延期案例做成标注集;
- 逐步尝试基于自监督学习的“世界模型”小样板(比如先只做塔吊作业区)。
6.3 别被“AGI 焦虑”带节奏,优先解决眼前可落地的问题
LeCun 对“AGI 灭世论”非常不客气:
“通用智能的概念本身就是站不住脚的,现实世界复杂度远不是把世界 token 化就能解决的。”
对建筑企业来说,更现实的威胁不是“AI 统治世界”,而是:
- 你投入了一大笔钱,换回来一个“看起来很先进、实际上没人用”的系统;
- 或者,被一家封闭厂商绑死,把自己的数据主权和技术路线拱手交出去。
把注意力从“AGI 是否危险”转向“我们今年能不能先让塔吊少一次碰撞、少一次高处坠落”,更有意义,也更负责任。
结语:智慧工地真正的升级,是让系统“长眼睛和大脑”
如果用一句话概括 LeCun 对当前 AI 路线的态度,那就是:
“光会说话的 AI,不算智能;能预测世界并规划行动的 AI,才是真正的智能。”
对中国建筑业的智慧工地实践,这句话非常有参考价值。未来几年,谁能率先:
- 让工地 AI 从“监控取证”升级到“预测预防”;
- 让机器人和设备从“遥控玩具”升级到“有狗的智能的现场助手”;
- 让企业的数据从“分散孤岛”升级到“可学习的施工世界模型”;
谁就能在安全、工期、成本和用工效率上,拉开一个真正难追的差距。
这也是我们做“AI 在中国建筑行业的应用:智慧工地”这个系列最想强调的一点:别再满足于会说话的 AI,把注意力转向会“理解工地”的 AI。
现在最现实的问题,不是“AGI 什么时候到来”,而是——
你打算从哪个工地、哪个场景,开始培养你自己的“世界模型”?