诺亦腾机器人两年营收暴涨 40 倍,靠的不是多卖了多少设备,而是先把“数据公司”这件事做明白。建筑业的智慧工地,同样需要从设备思维升级为数据思维,才能真正让 AI 落地。

机器人数据爆发,让建筑业看清一件事
2024 年,诺亦腾在机器人相关业务上的营收两年暴涨近 40 倍。这不是一个简单的“热点赛道”故事,而是一个信号:谁先把数据这件事做对,谁就有资格谈 AI 能力。
戴若犁把诺亦腾机器人业务单独拆出来,做一家“机器人的数据公司”,而不是“设备公司”。这一步,其实给了建筑行业一个很直接的参考:
智慧工地要的不是“买几套 AI 摄像头”,而是要一整套“面向未来 AI 模型的数据能力”。
这篇文章,我会先拆解诺亦腾机器人是怎么把“动作捕捉 + 具身智能”做成一个高增长的 To B 数据业务,再对照中国建筑行业的实际情况,给出一套更务实的 智慧工地数据策略:
- 为什么“设备思维”会拖慢建筑企业的数字化
- 具身智能的数据方法论,如何迁移到智慧工地
- 建筑企业做 AI 时,组织、商业模式该怎么设计
- 2026 年之前,建筑企业适合做哪三类数据建设
如果你现在负责建筑企业的信息化、智慧工地、数字化转型,这篇可以当作一份“绕坑指南”。
一、诺亦腾的选择:先把“数据”这件事做清楚
诺亦腾机器人的本质,是一家“数据公司”,不是机器人硬件公司。
戴若犁讲得很直接:
卖设备、卖项目,只是“交个朋友”,真正的交易界面是“数据本身”。
1.1 从个位数营收到 40 倍增长:拐点来自“数据需求形态”
过去十几年,诺亦腾的动作捕捉设备主要服务:
- 影视特效
- VR 互动
- 医疗康复
这些行业的数据,通常是按“秒”计费的,小而精;而从 2023 年下半年开始,机器人公司对数据的需求突然变成:
- 单位:小时、万条、百万条
- 需求量级:十万小时、百万小时
这背后本质上是一个认知差异:
- 影视行业:一次性项目,少量高精数据
- 机器人行业:模型训练,持续性、规模化数据
建筑行业现在普遍还停留在“影视模式”:
做一期智慧工地项目,装一批摄像头,搞一套平台,交付一次就结束。
而具身智能和诺亦腾走的是“机器人模式”:
围绕模型持续训练,按年、按月积累数据资产,越积越值钱。
建筑企业如果还把智慧工地当成“一次性工程项目”,其实已经输在起跑线上。
1.2 数据公司与设备公司的根本差别
在诺亦腾机器人的逻辑里:
- 设备:只是采数据的工具,可以自己投 Capex
- 服务:只是帮客户把前端链路打通
- 真正的产品:可复用、可跨客户的数据集与数据能力
套到建筑业就是:
- 摄像头、传感器、边缘网关,不应该是收入终点
- 真正的资产,是可以跨项目、跨工地、跨区域复用的:
- 安全行为数据集
- 施工工序过程数据集
- 机械设备运行与故障数据集
大多数建筑企业现在做数字化,容易踩的坑就是:
把“买设备、上平台”当成目标,而不是把“形成自身的数据能力”当成目标。
二、具身智能的数据方法论,对智慧工地的启发
戴若犁反复强调一件事:
真机数据很重要,但不能跨本体;真正能跨本体、可规模化使用的是“真实的人类行为数据”。
这句话如果放到建筑场景里,非常有参考价值。
2.1 真机数据 vs 真实数据:建筑版翻译
在机器人领域:
- 真机数据:直接在具体机器人本体上采集的遥操作、强化学习数据
- 真实数据:人类佩戴动捕设备、传感器采集的自然操作数据
为什么真机数据不能跨本体?
因为:每一台机器人在传感器布置、驱动特性、关节比例上都不同,数据迁移损失巨大。
建筑里很像:
- 某一个品牌塔吊的传感数据
- 某一型号挖机的动作曲线
- 某个工地的特殊施工工艺
这些数据在单项目优化上很好用,但跨公司、跨项目时效果骤降。
相反,如果你抓的是:
- 工人绑扎钢筋的动作流程
- 架子工搭设与拆除脚手架的安全动作
- 现场指挥、协同的语音与行为模式
这些更像“人类行为真实数据”,可以跨项目、跨区域迁移使用,对行业级 AI 模型价值更大。
2.2 仿生视角:先想“人怎么干活”,再想“AI怎么学”
戴若犁在规划机器人数据时,没有先问“客户要什么”,而是先问:
人在完成一个任务时,需要哪些输入模态?
例如:端起一杯咖啡到喝下去:
- 视觉:定位杯子、判断距离
- 姿态:手臂的轨迹、身体平衡
- 触觉:握持力度,杯子是否打滑
- 力觉:重量变化、碰撞反馈
建筑企业在做智慧工地时,常见的错误是:
先罗列一堆“功能需求”,比如:实名制、安全帽识别、危险区域告警……
更有效的做法是:
先从“人执行任务”的视角拆解数据需求。 例如:
-
场景:高支模搭设
- 人眼:如何判断支撑是否牢固?
- 动作:什么是“标准姿态”,什么是“危险姿态”?
- 声音:现场沟通中,什么样的语气、用词预示风险升级?
-
场景:塔吊协同吊装
- 指挥手势、口令的规范数据
- 司机视角的视频与操作轨迹
- 风速、载荷、吊点等传感信息
你会发现,一旦采用“仿生视角”,智慧工地不再是堆摄像头,而是一套多模态数据设计工程:
- 视频(单目 / 双目)
- 行为姿态
- 语音与环境声
- 结构应力、位移、振动
- 机械运行状态
2.3 数据金字塔:建筑行业版应该怎么搭
在 GAIR 上,戴若犁会讲“具身智能数据金字塔”,大致包括:
- 遥操作数据(Tele-op)
- 多样化人本数据(Human-centric)
- 互联网数据
- 合成仿真数据
如果把它迁移到建筑行业,可以做一个“智慧工地数据金字塔”:
-
现场真实行为数据(Human-centric)
- 工人作业过程的多模态记录
- 班组长、安全员的巡检行为
-
设备与环境运行数据(类似 Tele-op + 传感)
- 塔吊、升降机、挖机的操作与状态
- 环境监测:噪声、扬尘、温度、风速
-
工程文档与设计数据(行业互联网数据)
- BIM 模型、施工组织设计
- 技术交底、质量标准、验收记录
-
仿真与生成数据(Synthetic)
- 基于真实数据做场景仿真:
- 高坠、坍塌、碰撞等危险场景
- 工序错序、资源冲突的模拟
- 基于真实数据做场景仿真:
关键点是:
仿真、世界模型的数据作用,是对真实数据的“增广和补全”,而不可能直接取代真实工地数据。
对建筑企业来说,如果你现在连第 1 层和第 2 层的数据都没体系化采集,就谈“大模型 + 世界模型解决智慧工地”,只能算 PPT 阶段。
三、To B 数据业务:对建筑企业数字化组织的三点建议
诺亦腾机器人的业务,本质是一个 高壁垒、强交付、重运营的 To B 数据服务。这对建筑企业做智慧工地,有几条非常直接的启示。
3.1 把“项目部 + 信息化部”升维成“数据事业部”
诺亦腾做法是:
- 单独拆出机器人数据公司
- 独立融资、独立团队、独立目标
建筑企业在组织上可以做一个简化版:
- 在集团层面设立 “智慧工地与数据中心”,而不是简单的信息化科
- 职责从“买系统、运维平台”,升级为:
- 设计公司级数据标准与标签体系
- 规划工地多模态采集方案
- 负责跨项目的数据沉淀与复用
只要还是“项目部各搞一套系统”,你永远只能得到一堆孤岛平台,而不是可训练的行业数据资产。
3.2 不要把自己做成“弱势外包商”
传统自动驾驶和大模型的数据公司,在甲方面前经常只是“人力外包”:
- 甲方掌握车队和原始数据
- 乙方做标注和简单处理
戴若犁现在刻意绕开这种模式,原因很现实:
这种模式的溢价空间有限,难以形成自己的核心能力。
建筑企业如果完全把数据生产外包给第三方:
- 供应商掌握采集规范与标签体系
- 模型训练过程你看不见,长期被绑定
更好的做法是:
- 硬件采购可以外包
- 算法可以合作
- 但数据标准、标签体系、关键样本库要掌握在自己手里
你可以像戴若犁说的那样,让供应商“交个朋友”,帮你把链路打通,但别把数据主权也交出去。
3.3 明确目标:不是为了“上 AI”,而是为了“解题”
戴若犁说:“做大不是目标,解决行业问题才是目标。”
对建筑企业而言,你的智慧工地数据业务,永远要围绕几个非常具体的“KPI 问题”来设计:
- 重大安全事故发生率
- 质量通病发生率
- 工期偏差、返工比例
- 机械停机率与维修成本
然后再反推:
- 为了降低脚手架坍塌风险,我们需要哪些模态的数据?
- 为了减少混凝土蜂窝麻面,需要覆盖哪些工序的影像与传感?
不是为了“有 AI 可用”,而是为了“这几个数字每年能看见实打实的变化”。
四、建筑企业现在可以做的三件“数据正事”
结合诺亦腾机器人的经验,以及当前中国建筑业的现实约束,2026 年前,建筑企业在智慧工地上可以务实地做三件事。
4.1 从一个工种、一个危险源场景,做出“标杆级数据集”
不要一上来就想“全场景覆盖”。
可以选:
- 高处作业(坠落风险最大)
- 起重吊装(协同复杂)
- 深基坑施工(土方、支护、降水)
以“高处作业”为例:
- 明确目标:三年内减少 30% 高处作业事故
- 设计数据模态:
- 俯视 + 仰视双目视频
- 人体骨骼点姿态
- 安全带、安全帽佩戴状态
- 作业区域边界、洞口遮护状态
- 形成数据集:
- 正常作业样本
- 违规操作样本
- 隐患状态样本
一旦有了一个行业级的高质量数据集,你就有资格谈:
- 安全行为识别模型
- 风险预测与预警
- 智慧工地在集团内的规模复制
这和诺亦腾从“大量人类动作数据”入手,再服务不同机器人本体,是一脉相承的。
4.2 建一条“小而精”的数据工厂试验线
诺亦腾的数据工厂不是简单的“多装几台动捕设备”,而是一整套:
- 采集
- 校准
- 预标注
- 维度增广
- 模态补全
建筑企业可以先在一个示范工地,搭一个“小而精”的智慧工地数据工厂:
- 固定拍摄点 + 可移动摄像头
- 现场作业佩戴式终端(如安全帽摄像头、腰间 IMU)
- 与 BIM、进度计划打通
目标不是一下子覆盖所有场景,而是:
先把“从采集到可训练数据”的完整链路打通,跑通流程,形成标准。
4.3 预留与世界模型、仿真平台对接的“接口”
未来 2–3 年,世界模型和仿真平台在建筑领域肯定会加速落地:
- 施工方案在虚拟工地里先跑一遍
- 安全风险在仿真环境中推演
- AI 助理在“数字孪生工地”里学习规则
但正如戴若犁所说:
世界模型更多负责“规则”,真实数据承载“大量人类先验”。
所以与其现在就纠结选哪家仿真平台,不如先在数据侧做几件事:
- 所有视频数据保留空间位置信息(机位、角度、标定)
- 所有事件数据(安全、质量)与时间、空间、工序强绑定
- 给未来的仿真 / 世界模型,留出高精度、可回放的真实样本库
这样,当你真正上马世界模型或行业大模型时,不是从零开始,而是带着成体系的“工地记忆”进入下一阶段。
结语:智慧工地,真正的竞争在“数据层”
诺亦腾机器人这两年在具身智能上的爆发,说白了就一句话:
把“设备公司思维”升级成“数据公司思维”,然后踩在 AI 浪潮正中间。
中国建筑行业的 AI 应用、智慧工地建设,现在其实也走到了一个类似的关口:
- 继续停留在“装设备、上平台、做示范工地”,效果会越来越边际递减
- 提前布局“数据金字塔 + 小型数据工厂 + 明确业务指标”,未来三到五年会拉开一整个量级的差距
如果你现在负责企业的智慧工地、数字化或者信息化工作,可以先问自己三个问题:
- 我们企业真正可用于训练 AI 的自有数据集,有多少?
- 有没有哪个场景,已经形成了可跨项目复用的高质量数据?
- 明年我们是不是可以只盯住一个安全或质量场景,把它做到“行业最懂数据的那一家”?
答案不需要今天就完美,但方向必须今天就校正。
建筑业的 AI 争夺战,表面上比的是谁的算法好、平台炫,底层比的其实是:谁敢先把“智慧工地的数据能力”当成一门真正的长期生意来做。