大模型+小模型:智慧工地AI产品化的新路线

AI在中国建筑行业的应用:智慧工地By 3L3C

智慧工地要的不是炫技式AI,而是能规模复制、简单好用的产品。用“算法定义硬件”和大模型+小模型,让建筑工地AI真正落地。

智慧工地建筑行业AIAIoT大模型边缘计算算法平台
Share:

Featured image for 大模型+小模型:智慧工地AI产品化的新路线

智慧工地要的不是“酷技术”,而是能落地的AI

浙江一处地铁工地,项目部去年做了个统计:安全员人均每天要看近8小时监控视频,却依然难以避免高处未系安全带、明火作业违规等问题。监控越装越多,人反而“看不过来”。

这正是很多中国建筑企业在推进智慧工地时遇到的真实困境——AI听起来很强,但真正要落地到工地一线,就变得又贵又慢、改一版成本极高。

这里面,一个被严重低估的关键,是AI产品怎么做。同样一套算法,做成“实验室Demo”和做成“工地能跑三年”的工程产品,完全是两件事。

本文借助旷视提出的“算法定义硬件”和魔方 B4T 系列的实践思路,结合“大模型+小模型”最新趋势,聊清楚一件事:

建筑企业要搞智慧工地,如何用标准化硬件 + 开放算法平台,把复杂的AI,变成简单、好用、能规模铺开的现场工具?


一、智慧工地为什么离不开“算法定义硬件”?

要让AI在建筑工地真正跑起来,算法、硬件、场景这三件事必须绑在一起考虑

1. 工地方的典型难题:场景多、改动频繁、很难复用

建筑工地是碎片化场景的典型代表:

  • 安全帽佩戴、反光衣识别、人员闯入危险区、塔吊碰撞预警
  • 高处坠落检测、洞口临边防护巡检、明火/烟雾识别
  • 卸料平台超载、车辆出入管理、泥浆车冲洗是否合规

这些需求有三个共同特点:

  1. 场景差异极大
    • 房建、市政、轨交、水利,不同专业差异巨大
    • 白天夜晚、灰尘、雨雾、逆光,视频质量差异大
  2. 设备不统一
    • 甲方已有的摄像机型号复杂,清晰度、焦距、安装位置都不同
    • 新增设备预算有限,还要兼顾和原有平台对接
  3. 需求频繁变
    • 安监站检查新要求,甲方临时指标,项目部管理重点随工程阶段变化

用传统方式做AI落地,往往是:

“一个场景一套算法,一套算法一堆适配和集成工作。”

结果就是:每个项目都像在“手工打造”一套智慧工地系统,成本高、周期长,很难推广到集团层面。

2. “算法定义硬件”的核心逻辑

旷视这几年沉淀出的一个判断很适合拿到智慧工地场景里:

AI要规模落地,不能从“先有硬件再找算法”,而是要先想清楚算法和场景,再去定义需要什么硬件

具体怎么理解?

  • 以算法能力为核心,设计少数几类标准化硬件
    • 通用 AI 摄像机(AI IPC)
    • 边缘计算盒子
    • 带屏幕的面板机(适合门禁、实名制)
  • 这些硬件被设计成**“算法可插拔的统一载体”**:
    • 一个边缘盒子,上面同时跑安全帽识别、明火识别、人员闯入算法
    • 根据工地需求,按需开通或关闭算法,不用换硬件

对建筑企业的直接好处:

  1. 选品变简单
    • 集团只需定几个“标配硬件型号”,各项目按需采购
    • 不用每次都和集成商重新讨论“这次摄像机买哪家”
  2. 部署变标准
    • 算法统一部署在边缘盒子或AI摄像机上,施工总包、机电分包都能按标准施工
  3. 后期运维可控
    • 算法升级、切换,不动线缆、不换摄像机,只在平台切换模型

一句话:硬件不再是“一次性+定制品”,而是变成可复用的AI载体,这才有可能在一个集团上百个项目里“铺开智慧工地”。


二、好的智慧工地AI产品,标准只有两个字:简单

很多智慧工地项目失败,不是因为AI精度不够,而是用起来太复杂

我见过不少项目部门里,安全员对着“智慧工地大屏”直摇头:

  • 告警太多,分不出优先级
  • 算法误报多,大家渐渐不信任
  • 算法配置太复杂,现场没人会调

旷视对“好AI产品”的定义,其实非常适合用来审视智慧工地方案。

1. 对甲方:选型要“闭着眼睛也敢买”

To B 产品的第一件事,是让决策变简单

对建筑企业来说,一个能“闭着眼睛选”的智慧工地AI产品,大致有这些特征:

  • 型号少而精
    • 比如集团统一规范:塔吊防碰撞用 A 型边缘盒 + B 型摄像机组合
    • 出入口管理用另一套标准组合
  • 价格结构透明
    • 算法按点位 / 算法包收费清晰,不搞“黑盒打包价”
  • 和现有平台能打通
    • 能对接现有的项目管理平台、BIM 平台、安全管理系统

这背后,就是“算法定义硬件”的产品策略——提高每一个硬件型号的“吨位”和适用范围

2. 对施工单位:交付要“轻”,最好像装空调

一个智慧工地AI方案,要想真正铺开,交付必须尽量“像装设备,而不是搞项目”。

什么叫“轻交付”?可以对标几个场景:

  • 摄像机安装完,自动完成场景自检和算法加载,工程人员只做基础布线
  • 用手机或平板,扫描设备二维码,快速完成:
    • 项目绑定
    • 算法启用
    • 简单阈值配置
  • 算法模型在后台统一管理和升级,不需要现场工程师一台台调试

这正是“标准硬件+开放算法平台”的优势:

复杂的模型训练、部署、兼容性适配,都被收拢到平台侧,对现场只暴露极简配置界面。

3. 对一线安全员:操作要“傻瓜化”,只关心结果

真正决定AI能不能长期用起来的人,是安全员、工长这些一线角色。

对他们来说,好用的智慧工地AI就是三件事

  1. 告警简单直观:
    • 直接告诉他:哪路摄像机,在几点几分,出现了什么违规行为
  2. 误报率可接受:
    • 不是“天天看假告警”,而是一响就要有人去看
  3. 告警结果能和考核、整改挂钩:
    • 告警记录自动形成整改闭环,纳入班组考核

这正是旷视强调的——“把简单递给用户,把复杂留给自己”。在智慧工地场景里,就是:

  • 用户只看到:哪个工人违规、是否已整改
  • 看不到、也不需要看到:背后到底是大模型、小模型,还是做了多少轮训练和蒸馏

三、大模型+小模型:智慧工地AI的新工程范式

从 2023 年开始,大模型成了AI圈的高频词。但站在建筑企业角度,最关键的问题只有一个:

大模型,能不能真正帮我把工地管理做得更精细、更省人?

答案是:要和“小模型”配合,才真正有用。

1. 大模型:做“通才大脑”,不是直接上工地

大模型的长处,是通识能力和泛化能力强

  • 可以理解自然语言需求:
    • “我想监控钢筋加工棚里是否有人不戴安全帽,又在抽烟。”
  • 可以快速产出算法原型:
    • 自动生成模型结构、训练脚本、评估方案

但它有两个短板,导致很难直接部署在工地摄像机上

  1. 模型体量太大,算力和能耗都不适合边缘侧
  2. 对细分行业知识不够深入,需要场景精调

所以,更现实的做法是:

把大模型放在云端或中心侧,做“算法工厂”和“研发加速器”。

比如旷视升级后的 AIS 算法训练平台,就开始尝试:

  • 用行业大模型做预训练,理解“安全帽”“反光衣”“临边防护”等基础概念
  • 再用小样本,针对某个具体场景做精调,比如“夜间雨天的桥梁工地钢筋绑扎区域”

2. 小模型:跑在摄像机和边缘盒子上的“工地专才”

真正跑在工地设备上的,绝大部分情况是小模型。

原因很直白:

  • 边缘盒子、AI 摄像机的算力有限
  • 工地现场需要实时响应、离线也能跑

大模型要想进入工地,需要经过一系列“瘦身”:

  • 模型蒸馏:保留大模型学到的关键信息,压缩成体量更小的模型
  • 量化和剪枝:减少计算量,让模型适应边缘芯片
  • 针对具体作业场景做适配,比如:
    • 针对高噪点环境(灰尘、水雾)优化算法鲁棒性
    • 针对复杂遮挡(钢管、模板)优化检测逻辑

最终的形态是:

云端有“懂行业的大模型”,边缘上跑“针对每个具体工地、具体部位精调的小模型”。

对建筑企业而言,这种“大小模型组合拳”带来三件实实在在的好处:

  1. 开发效率大幅提高
    • 过去做一个新场景算法,从采集数据到上线要几个月
    • 有大模型预训练 + 小样本精调后,可能几天就能出可用版本
  2. 成本更可控
    • 不需要为每个工地、每个新需求,从0开始做算法项目
    • 把“算法开发”变成“基于平台的配置和训练服务”
  3. 算法生命周期可运营
    • 随着工地阶段变化(基础、主体、装修),按需启停、切换模型
    • 集团层面可以沉淀出“行业最佳实践模型库”

四、从“项目试点”到“集团能力”:智慧工地AI如何做成体系

AI在建筑业的真正价值,不在于某一个“炫酷项目演示”,而在于整个集团形成可复制、可扩展的数字化能力

结合“算法定义硬件”和“大模型+小模型”的思路,一个相对可行的路线,大致可以拆成四步:

1. 先定标准,再做试点

  • 集团层面牵头,先定义:
    • 标准硬件清单(摄像机、边缘盒子、网络要求)
    • 优先AI场景列表(安全、质量、进度优先级)
  • 选 2-3 个代表性项目做试点:
    • 市政 + 房建 + 轨交,覆盖不同工种和环境

2. 用平台而不是项目制做算法

  • 选择具备开放算法平台能力的合作伙伴:
    • 支持零代码 / 低代码算法训练
    • 能结合自有行业大模型做精调
  • 把企业自有数据(历史视频、事故案例)逐步沉淀到平台:
    • 匿名化处理,保护隐私
    • 建立企业级的“工地视觉样本库”

3. 打通业务闭环:从“看见问题”到“解决问题”

AI识别只是第一步,更关键的是业务闭环:

  • 告警要能自动推送到:
    • 班组长、安全员的手机或微信小程序
  • 整改要能在系统中闭环:
    • 拍照上传整改结果
    • 与考核挂钩,生成统计报表
  • 与BIM、进度计划联动:
    • 通过AI识别施工进度,自动比对计划与实际

4. 持续运营算法资产

当项目越来越多,算法不再是“一次性买断”,而是长期运营的企业资产

  • 定期评估各算法在不同项目的效果:
    • 哪些场景误报高,需要模型优化
    • 哪些算法使用率低,考虑合并或下线
  • 把表现好的模型固化成:
    • 《集团智慧工地算法白名单》
    • 《分场景应用指南》(适用工种、摄像机安装规范、告警策略)

这也是为什么,我认为“AI产品化能力”对建筑企业的价值,不亚于单个算法精度提升5%


五、下一步:让AI成为工地的“基础设施”,而不是“锦上添花”

回到开头那个安全员看屏幕看到眼花的例子。

如果把“算法定义硬件、大模型+小模型、开放算法平台”这些能力真正用起来,几年之后,智慧工地可能会是另一幅景象:

  • 项目启动时,机电总包按集团标准清单布设AI摄像机和边缘盒
  • 项目在平台上选择本项目适用的算法组合:
    • 重点危险源监测、安全行为识别、环境监测、机械设备管理
  • 安全员手机里是一个统一的工地AI助手:
    • 实时推送关键告警
    • 自动生成日报、周报和月度分析
  • 集团层面可以实时看到:
    • 各项目安全风险分布
    • 不同区域、不同分包的风险对比数据

这不是“多了一块好看的大屏”,而是安全管理、质量管理、进度管理都建立在“视频即数据、算法即规则”的基础设施之上

我个人判断,在未来 3-5 年,中国建筑企业在智慧工地上的分化,会明显拉开——

  • 一部分企业停留在“采购几套AI系统”的阶段
  • 另一部分企业,会把“算法定义硬件+大模型+小模型+平台”组合起来,当成集团级能力建设

如果你在设计或负责企业的智慧工地规划,现在是个合适的时间点,认真思考:

你要买的是一堆“功能清单”,还是要构建一条面向未来十年的AI产品化能力


结语

智慧工地不是多装几台摄像机、多接几个算法接口,而是在真实工程环境里,扎扎实实把AI做成一个简单、可靠、可复制的产品。

“算法定义硬件”为建筑行业提供了一个可行路径:用少量标准化硬件,承载不断丰富的小模型;而大模型则在背后,帮助我们更快、更便宜地生产这些小模型。

这条路不轻松,但一旦走通,AI在工地上的角色,就会从“展示项目”真正变成“生产力基础设施”。如果你希望企业的智慧工地不止停留在试点层面,可以从现在开始,审视自己的硬件标准、算法平台和组织能力,看看哪些地方,已经具备接入这一新范式的条件。

🇨🇳 大模型+小模型:智慧工地AI产品化的新路线 - China | 3L3C