从机器人数据工厂到智慧工地:AI重塑中国建筑业的底层能力

AI在中国建筑行业的应用:智慧工地By 3L3C

诺亦腾机器人两年营收暴涨 40 倍,靠的不是多卖了多少设备,而是先把“数据公司”这件事做明白。建筑业的智慧工地,同样需要从设备思维升级为数据思维,才能真正让 AI 落地。

智慧工地建筑行业AI具身智能机器人数据建筑业数字化转型工地安全BIM与AI
Share:

Featured image for 从机器人数据工厂到智慧工地:AI重塑中国建筑业的底层能力

机器人数据爆发,让建筑业看清一件事

2024 年,诺亦腾在机器人相关业务上的营收两年暴涨近 40 倍。这不是一个简单的“热点赛道”故事,而是一个信号:谁先把数据这件事做对,谁就有资格谈 AI 能力。

戴若犁把诺亦腾机器人业务单独拆出来,做一家“机器人的数据公司”,而不是“设备公司”。这一步,其实给了建筑行业一个很直接的参考:

智慧工地要的不是“买几套 AI 摄像头”,而是要一整套“面向未来 AI 模型的数据能力”。

这篇文章,我会先拆解诺亦腾机器人是怎么把“动作捕捉 + 具身智能”做成一个高增长的 To B 数据业务,再对照中国建筑行业的实际情况,给出一套更务实的 智慧工地数据策略

  • 为什么“设备思维”会拖慢建筑企业的数字化
  • 具身智能的数据方法论,如何迁移到智慧工地
  • 建筑企业做 AI 时,组织、商业模式该怎么设计
  • 2026 年之前,建筑企业适合做哪三类数据建设

如果你现在负责建筑企业的信息化、智慧工地、数字化转型,这篇可以当作一份“绕坑指南”。


一、诺亦腾的选择:先把“数据”这件事做清楚

诺亦腾机器人的本质,是一家“数据公司”,不是机器人硬件公司。

戴若犁讲得很直接:

卖设备、卖项目,只是“交个朋友”,真正的交易界面是“数据本身”。

1.1 从个位数营收到 40 倍增长:拐点来自“数据需求形态”

过去十几年,诺亦腾的动作捕捉设备主要服务:

  • 影视特效
  • VR 互动
  • 医疗康复

这些行业的数据,通常是按“秒”计费的,小而精;而从 2023 年下半年开始,机器人公司对数据的需求突然变成:

  • 单位:小时、万条、百万条
  • 需求量级:十万小时、百万小时

这背后本质上是一个认知差异:

  • 影视行业:一次性项目,少量高精数据
  • 机器人行业:模型训练,持续性、规模化数据

建筑行业现在普遍还停留在“影视模式”:

做一期智慧工地项目,装一批摄像头,搞一套平台,交付一次就结束。

而具身智能和诺亦腾走的是“机器人模式”:

围绕模型持续训练,按年、按月积累数据资产,越积越值钱。

建筑企业如果还把智慧工地当成“一次性工程项目”,其实已经输在起跑线上。

1.2 数据公司与设备公司的根本差别

在诺亦腾机器人的逻辑里:

  • 设备:只是采数据的工具,可以自己投 Capex
  • 服务:只是帮客户把前端链路打通
  • 真正的产品:可复用、可跨客户的数据集与数据能力

套到建筑业就是:

  • 摄像头、传感器、边缘网关,不应该是收入终点
  • 真正的资产,是可以跨项目、跨工地、跨区域复用的:
    • 安全行为数据集
    • 施工工序过程数据集
    • 机械设备运行与故障数据集

大多数建筑企业现在做数字化,容易踩的坑就是:

把“买设备、上平台”当成目标,而不是把“形成自身的数据能力”当成目标。


二、具身智能的数据方法论,对智慧工地的启发

戴若犁反复强调一件事:

真机数据很重要,但不能跨本体;真正能跨本体、可规模化使用的是“真实的人类行为数据”。

这句话如果放到建筑场景里,非常有参考价值。

2.1 真机数据 vs 真实数据:建筑版翻译

在机器人领域:

  • 真机数据:直接在具体机器人本体上采集的遥操作、强化学习数据
  • 真实数据:人类佩戴动捕设备、传感器采集的自然操作数据

为什么真机数据不能跨本体?

因为:每一台机器人在传感器布置、驱动特性、关节比例上都不同,数据迁移损失巨大。

建筑里很像:

  • 某一个品牌塔吊的传感数据
  • 某一型号挖机的动作曲线
  • 某个工地的特殊施工工艺

这些数据在单项目优化上很好用,但跨公司、跨项目时效果骤降。

相反,如果你抓的是:

  • 工人绑扎钢筋的动作流程
  • 架子工搭设与拆除脚手架的安全动作
  • 现场指挥、协同的语音与行为模式

这些更像“人类行为真实数据”,可以跨项目、跨区域迁移使用,对行业级 AI 模型价值更大。

2.2 仿生视角:先想“人怎么干活”,再想“AI怎么学”

戴若犁在规划机器人数据时,没有先问“客户要什么”,而是先问:

人在完成一个任务时,需要哪些输入模态?

例如:端起一杯咖啡到喝下去:

  • 视觉:定位杯子、判断距离
  • 姿态:手臂的轨迹、身体平衡
  • 触觉:握持力度,杯子是否打滑
  • 力觉:重量变化、碰撞反馈

建筑企业在做智慧工地时,常见的错误是:

先罗列一堆“功能需求”,比如:实名制、安全帽识别、危险区域告警……

更有效的做法是:

先从“人执行任务”的视角拆解数据需求。 例如:

  • 场景:高支模搭设

    • 人眼:如何判断支撑是否牢固?
    • 动作:什么是“标准姿态”,什么是“危险姿态”?
    • 声音:现场沟通中,什么样的语气、用词预示风险升级?
  • 场景:塔吊协同吊装

    • 指挥手势、口令的规范数据
    • 司机视角的视频与操作轨迹
    • 风速、载荷、吊点等传感信息

你会发现,一旦采用“仿生视角”,智慧工地不再是堆摄像头,而是一套多模态数据设计工程

  • 视频(单目 / 双目)
  • 行为姿态
  • 语音与环境声
  • 结构应力、位移、振动
  • 机械运行状态

2.3 数据金字塔:建筑行业版应该怎么搭

在 GAIR 上,戴若犁会讲“具身智能数据金字塔”,大致包括:

  1. 遥操作数据(Tele-op)
  2. 多样化人本数据(Human-centric)
  3. 互联网数据
  4. 合成仿真数据

如果把它迁移到建筑行业,可以做一个“智慧工地数据金字塔”:

  1. 现场真实行为数据(Human-centric)

    • 工人作业过程的多模态记录
    • 班组长、安全员的巡检行为
  2. 设备与环境运行数据(类似 Tele-op + 传感)

    • 塔吊、升降机、挖机的操作与状态
    • 环境监测:噪声、扬尘、温度、风速
  1. 工程文档与设计数据(行业互联网数据)

    • BIM 模型、施工组织设计
    • 技术交底、质量标准、验收记录
  2. 仿真与生成数据(Synthetic)

    • 基于真实数据做场景仿真:
      • 高坠、坍塌、碰撞等危险场景
      • 工序错序、资源冲突的模拟

关键点是:

仿真、世界模型的数据作用,是对真实数据的“增广和补全”,而不可能直接取代真实工地数据。

对建筑企业来说,如果你现在连第 1 层和第 2 层的数据都没体系化采集,就谈“大模型 + 世界模型解决智慧工地”,只能算 PPT 阶段。


三、To B 数据业务:对建筑企业数字化组织的三点建议

诺亦腾机器人的业务,本质是一个 高壁垒、强交付、重运营的 To B 数据服务。这对建筑企业做智慧工地,有几条非常直接的启示。

3.1 把“项目部 + 信息化部”升维成“数据事业部”

诺亦腾做法是:

  • 单独拆出机器人数据公司
  • 独立融资、独立团队、独立目标

建筑企业在组织上可以做一个简化版:

  • 在集团层面设立 “智慧工地与数据中心”,而不是简单的信息化科
  • 职责从“买系统、运维平台”,升级为:
    • 设计公司级数据标准与标签体系
    • 规划工地多模态采集方案
    • 负责跨项目的数据沉淀与复用

只要还是“项目部各搞一套系统”,你永远只能得到一堆孤岛平台,而不是可训练的行业数据资产。

3.2 不要把自己做成“弱势外包商”

传统自动驾驶和大模型的数据公司,在甲方面前经常只是“人力外包”:

  • 甲方掌握车队和原始数据
  • 乙方做标注和简单处理

戴若犁现在刻意绕开这种模式,原因很现实:

这种模式的溢价空间有限,难以形成自己的核心能力。

建筑企业如果完全把数据生产外包给第三方:

  • 供应商掌握采集规范与标签体系
  • 模型训练过程你看不见,长期被绑定

更好的做法是:

  • 硬件采购可以外包
  • 算法可以合作
  • 但数据标准、标签体系、关键样本库要掌握在自己手里

你可以像戴若犁说的那样,让供应商“交个朋友”,帮你把链路打通,但别把数据主权也交出去

3.3 明确目标:不是为了“上 AI”,而是为了“解题”

戴若犁说:“做大不是目标,解决行业问题才是目标。”

对建筑企业而言,你的智慧工地数据业务,永远要围绕几个非常具体的“KPI 问题”来设计:

  • 重大安全事故发生率
  • 质量通病发生率
  • 工期偏差、返工比例
  • 机械停机率与维修成本

然后再反推:

  • 为了降低脚手架坍塌风险,我们需要哪些模态的数据?
  • 为了减少混凝土蜂窝麻面,需要覆盖哪些工序的影像与传感?

不是为了“有 AI 可用”,而是为了“这几个数字每年能看见实打实的变化”。


四、建筑企业现在可以做的三件“数据正事”

结合诺亦腾机器人的经验,以及当前中国建筑业的现实约束,2026 年前,建筑企业在智慧工地上可以务实地做三件事。

4.1 从一个工种、一个危险源场景,做出“标杆级数据集”

不要一上来就想“全场景覆盖”。

可以选:

  • 高处作业(坠落风险最大)
  • 起重吊装(协同复杂)
  • 深基坑施工(土方、支护、降水)

以“高处作业”为例:

  1. 明确目标:三年内减少 30% 高处作业事故
  2. 设计数据模态:
    • 俯视 + 仰视双目视频
    • 人体骨骼点姿态
    • 安全带、安全帽佩戴状态
    • 作业区域边界、洞口遮护状态
  3. 形成数据集:
    • 正常作业样本
    • 违规操作样本
    • 隐患状态样本

一旦有了一个行业级的高质量数据集,你就有资格谈:

  • 安全行为识别模型
  • 风险预测与预警
  • 智慧工地在集团内的规模复制

这和诺亦腾从“大量人类动作数据”入手,再服务不同机器人本体,是一脉相承的。

4.2 建一条“小而精”的数据工厂试验线

诺亦腾的数据工厂不是简单的“多装几台动捕设备”,而是一整套:

  • 采集
  • 校准
  • 预标注
  • 维度增广
  • 模态补全

建筑企业可以先在一个示范工地,搭一个“小而精”的智慧工地数据工厂:

  • 固定拍摄点 + 可移动摄像头
  • 现场作业佩戴式终端(如安全帽摄像头、腰间 IMU)
  • 与 BIM、进度计划打通

目标不是一下子覆盖所有场景,而是:

先把“从采集到可训练数据”的完整链路打通,跑通流程,形成标准。

4.3 预留与世界模型、仿真平台对接的“接口”

未来 2–3 年,世界模型和仿真平台在建筑领域肯定会加速落地:

  • 施工方案在虚拟工地里先跑一遍
  • 安全风险在仿真环境中推演
  • AI 助理在“数字孪生工地”里学习规则

但正如戴若犁所说:

世界模型更多负责“规则”,真实数据承载“大量人类先验”。

所以与其现在就纠结选哪家仿真平台,不如先在数据侧做几件事:

  • 所有视频数据保留空间位置信息(机位、角度、标定)
  • 所有事件数据(安全、质量)与时间、空间、工序强绑定
  • 给未来的仿真 / 世界模型,留出高精度、可回放的真实样本库

这样,当你真正上马世界模型或行业大模型时,不是从零开始,而是带着成体系的“工地记忆”进入下一阶段


结语:智慧工地,真正的竞争在“数据层”

诺亦腾机器人这两年在具身智能上的爆发,说白了就一句话:

把“设备公司思维”升级成“数据公司思维”,然后踩在 AI 浪潮正中间。

中国建筑行业的 AI 应用、智慧工地建设,现在其实也走到了一个类似的关口:

  • 继续停留在“装设备、上平台、做示范工地”,效果会越来越边际递减
  • 提前布局“数据金字塔 + 小型数据工厂 + 明确业务指标”,未来三到五年会拉开一整个量级的差距

如果你现在负责企业的智慧工地、数字化或者信息化工作,可以先问自己三个问题:

  1. 我们企业真正可用于训练 AI 的自有数据集,有多少?
  2. 有没有哪个场景,已经形成了可跨项目复用的高质量数据?
  3. 明年我们是不是可以只盯住一个安全或质量场景,把它做到“行业最懂数据的那一家”?

答案不需要今天就完美,但方向必须今天就校正。

建筑业的 AI 争夺战,表面上比的是谁的算法好、平台炫,底层比的其实是:谁敢先把“智慧工地的数据能力”当成一门真正的长期生意来做。

🇨🇳 从机器人数据工厂到智慧工地:AI重塑中国建筑业的底层能力 - China | 3L3C