LeCun怒怼大模型:给中国智慧工地的一份清醒指南

AI在中国建筑行业的应用:智慧工地By 3L3C

LeCun怒怼大模型是硅谷的风波,却给中国智慧工地提了个醒:建筑AI不能只堆大模型,而要真正理解物理世界、拥抱世界模型。

智慧工地建筑AI大模型世界模型BIM协同施工数字化
Share:

Featured image for LeCun怒怼大模型:给中国智慧工地的一份清醒指南

LeCun怒怼大模型,对智慧工地反而是个好消息

65岁、拿过图灵奖的Yann LeCun,距离从Meta正式离职只剩3周,却突然把话说得很绝:

“不停堆大模型,用更多合成数据、更多人做对齐,就能走到AGI?——这条路根本不可能成功。”

这句话在硅谷炸锅,对中国建筑行业其实也是一记警钟。

当“AI+建筑”“智慧工地”写进越来越多招标文件和年度计划时,很多项目的思路还是:

  • 先买个“大模型平台”;
  • 把PPT做得很漂亮;
  • 真正落地到安全、质量、进度管理时,却发现水土不服。

LeCun这次“临走前的警告”,并不只是学术口水战,而是直接戳中了一个关键:**光堆大模型,解决不了物理世界的问题。**而建筑,就是一个典型的“物理世界强相关”行业。

下面我想用三个问题,把这场争论和中国智慧工地捏在一起:

  1. LeCun认为的大模型“死路”,到底在死哪里?
  2. 他押注的“世界模型”,对智慧工地意味着什么?
  3. 今天做建筑AI应用,怎样才能避开泡沫、抓住真价值?

一、大模型的“集体幻觉”:对建筑企业的真正风险

先把立场说清楚:大模型有用,但如果把它当成“万能钥匙”,就是在给项目埋雷。

LeCun这次批评的核心有三点:

  1. 数据效率极差

    • 训一个不错的LLM,要吃掉互联网大约30万亿Token文本;
    • 换算成视频,只相当于1.5万小时的视频;
    • 一个4岁小孩,醒着看到的视觉信息大概就有1.6万小时。

    他的意思很简单:人类通过丰富的物理世界学习;LLM是靠“背书”撑起来的。

  2. 只会预测下一个词,不懂世界因果

    • LLM擅长组织语言,做知识检索、写文案没问题;
    • 但要做“动作-后果”的推演,比如吊装、临边作业风险评估,就很吃力。
  3. 行业被LLM“单一文化”绑架

    • 巨头们害怕掉队,于是都在同一条路上疯狂加码:更大模型、更多算力、更多人做对齐;
    • 结果是创新方向越来越单一,谁也不敢认真押宝“另一条路”。

对建筑企业,这三点意味着什么?

1)把大模型当“总包”,项目极容易翻车

现在很多所谓“AI+建筑”方案,本质是:

  • 上一个通用大模型;
  • 接几个简单插件;
  • 就宣称可以“全流程赋能建设项目”。

问题在于:

  • 安全帽识别、违章行为监测、塔吊碰撞预警、深基坑变形监测等,80%是视觉+传感器问题;
  • 通用大模型对这些“连续、高维、噪声大”的数据,其实并不擅长;
  • 一味靠“参数更大”“算力更猛”,对现场误报、漏报问题帮助有限。

这就是LeCun说的:用错误的方法疯狂放大,结果只会放大错误。

2)“看上去很智能”的功能,掩盖了真正的短板

我在和不少施工单位聊时,发现两个常见误区:

  • 以为“有个会聊天的AI助手”,就是数字化完成度很高;
  • 认为“模型越大=越聪明=越适合复杂工程”。

但真正影响项目成败的,是这些看起来“不那么AI”的能力:

  • 传感器布点逻辑做得准不准;
  • 视频分析算法对光照、遮挡、天气扰动的鲁棒性;
  • 质量缺陷识别模型,能不能在不同工地、不同施工队之间迁移;
  • 进度预测软件,能否结合BIM、物料、劳务出工等多源数据。

这些能力,本质上都是**“理解和预测物理世界”**,而不是“生成顺滑的回答”。这正好和LeCun批评的LLM短板对上了。


二、LeCun押注的“世界模型”,其实很适合智慧工地

LeCun为什么放着Meta不干,65岁出来创业?

他的答案很直接:

“真正的智能,来自于能在抽象空间中预测行动后果,并据此规划。”

这就是他口中的**“世界模型”(World Model)**,用一句适合工程人的话讲:

做一个能在“虚拟工地”里不断仿真、试错、优化决策的AI大脑。

1)“世界模型”做的,恰好是工程人最关心的事

LeCun的思路是:

  • 不去逐像素预测下一帧视频,而是在抽象表征空间做预测;
  • 先学会“把世界压缩成有用的状态变量”,再学习“状态如何随动作演变”。

如果你换成建筑语境,可以对应成:

  • 把复杂工地,用BIM+传感器数据,抽象成一组“施工状态向量”;
  • 每一个“动作”(工序安排、机械调度、人员配备),都会推动状态转移;
  • AI要做的是:给定目标(安全、工期、成本),规划出一条最优的状态演化路径

这和我们常说的:

  • 施工组织设计;
  • 施工阶段性组织优化;
  • 动态资源配置调整;

在概念上高度一致。

2)为什么说智慧工地比互联网应用更需要“世界模型”?

对比一下:

  • 互联网产品更多是信息交互,正确率99%和99.9%,感知差不多;
  • 工地是物理世界+人身安全,一个小错误就可能是事故。

世界模型的几个特性,和智慧工地是天然匹配的:

  1. 多模态、高维、连续数据处理能力强
    施工现场的数据非常杂:视频、环境传感器、机械运行数据、RTK定位、BIM模型……

  2. 强调预测和规划,而不是只做事后分析
    比如:

    • “这两天天气+进度+班组排布,安全风险在什么时段最高?”
    • “如果今天混凝土晚到2小时,对后面4天的工期和成本影响多大?”
  1. 可以在“虚拟工地”中大量试错,减少现场试错成本
    用仿真+世界模型,提前把:塔吊布置方案、临时道路规划、材料堆场布局,在虚拟空间里跑上千遍。

这比单纯用LLM做“经验问答”,价值要深一层。

3)JEPA思路,对建筑AI有什么具体启发?

LeCun主推的架构叫 JEPA(联合嵌入预测架构),技术细节可以很深,用一张“施工图纸级”的通俗说法是:

  • 不要求AI记住所有细节,而是强迫它找到对预测最有用的抽象特征
  • 这些特征要既能压缩复杂现场,又能保持对“下一步会怎样”的预测能力。

对应到智慧工地,可以这么想:

  • 不是让AI死记硬背每一个监控画面;
  • 而是学会“这类钢筋绑扎方式+环境+操作习惯”,未来更容易出质量问题;
  • 不是死记每个设备的全部历史数据,而是抽象出几类“健康状态轨迹”,用于预测故障。

这和我们做BIM+AI的思路,是高度契合的。


三、从“堆模型”到“做场景”:给建筑企业的三条建议

把话说狠一点:

建筑企业要做智慧工地,现在最该防的,不是“技术落后”,而是“被大模型叙事带偏”。

结合LeCun这次的观点,以及目前一线项目的实践,我更推荐三条务实路线。

建议一:优先投资“连接物理世界”的能力

和其砸钱上一个看起来很“通用”的大模型平台,不如把钱花在这几件事上:

  1. 高质量数据采集

    • 摄像头位置、角度、分辨率要针对场景设计,而不是随便装;
    • 物联网传感器选型、布点、维护要有工程逻辑,而不是“只为凑KPI”。
  2. BIM+GIS+物联网的统一数字底座

    • 把构件、空间、时间、责任人等统一编码;
    • 为未来的世界模型、预测模型打好“数据血缘”。
  3. 工程语义建模
    LLM可以帮你做标准、制度的语言理解,但更关键的是:

    • 把“什么叫危险作业”“什么叫关键工序”结构化;
    • 这些语义要能和BIM构件、工序模板、设备状态绑定。

这些能力,才是真正的“长期资产”,不会随着某个大模型迭代而全部报废。

建议二:把大模型当“界面层”,不是“决策大脑”

我自己的经验是:在建筑场景里,最合理的大模型定位,是“对话入口+知识助手”,而不是“终极大脑”。

可以这么搭:

  • 底层:传感器、BIM、进度计划、造价、劳务系统等;
  • 中层:针对安全、质量、进度、设备健康的专业模型(不一定是大模型,很多是传统算法+小模型);
  • 上层:大模型做:
    • 多源数据的自然语言查询;
    • 规范条文、历史案例的快速检索与解释;
    • 把复杂分析结果,转成项目经理听得懂的话。

这样,大模型发挥了“语言和交互”的优势,而对物理世界的理解和预测,交给更合适的模型承担。这和LeCun说的“LLM更像大脑里的语言区,而不是前额叶世界模型”是同一逻辑。

建议三:押注“开放生态”,而不是单一厂商闭环

LeCun这次另一个强烈观点是:

“真正想做出突破,就要让研究开放,允许发表论文,不然很容易自欺欺人。”

这对建筑行业其实非常贴切。建筑项目是高度协同的:业主、总包、分包、监理、设计院、供应商……

如果你的智慧工地方案:

  • 所有数据被锁在一个平台里;
  • 模型参数、算法能力完全黑盒;
  • BIM、进度、造价系统互不连通;

那不叫“智慧”,那叫“新一代信息孤岛”。

更健康的方式是:

  • 选型时,把“开放接口”“数据可导出”“算法可替换”当成硬指标;
  • 鼓励和高校、科研院所、细分AI公司做联合项目,允许他们发表论文;
  • 在企业内部,建设一支有能力“拆技术方案、看穿PPT”的小团队,而不是完全外包。

LeCun在Meta做FAIR时,靠开源和开放研究,确实把整个视觉、表示学习领域往前推了一大截。建筑行业要想在AI上真正积累能力,也需要类似的“开放心态”。


四、未来5-10年:智慧工地AI会走哪条路?

LeCun的预测挺实在:

  • 他不认同“AGI”这个概念,但认为类人智能是一个渐进过程
  • 如果世界模型、规划等方向顺利,5-10年内,我们能看到接近“狗的智能水平”的AI;
  • 真正到“接近人类”的水平,可能要20年甚至更久。

把这条时间线放回中国建筑业,有两个现实判断:

  1. 未来5年,智慧工地的AI应用,主要还是“增强人”,不是“替代人”

    • 风险识别、质量巡检、进度预警会越来越自动化;
    • 但最终决策、复杂协调、责任承担,仍然在项目团队。
  2. 越早围绕“世界模型思路”搭建数据和场景,你的长期优势越大

    • 今天开始认真建设BIM+物联一体的数字工地;
    • 从现在的监控、传感、机械数据中,去抽象“可预测的状态变量”;
    • 五年后,当更成熟的世界模型技术出现,你会发现自己数据是“能直接用”的。

用一句话收个尾:

大模型热闹,世界模型安静;建筑行业要挣钱和控风险,往往要选那条“安静但正确”的路。

如果你负责企业的数字化、技术发展,不妨回头问自己三个问题:

  1. 我们现在做的“AI+建筑”项目,是在解决物理世界的问题,还是只是在堆技术名词?
  2. 现有的数据、BIM和系统,是否已经为未来的世界模型留下了接口?
  3. 三年后的智慧工地回头看,今天的投入,还有多少是“保质期很长”的?

能把这三件事想清楚,你就已经比大部分还在“被LLM洗脑”的团队,走得更稳了一步。