机器人行业已经证明:不解决数据问题,AI 就很难真正落地。建筑业的智慧工地也是如此。本文用具身智能的教训,拆解智慧工地的真实难题与应对之道。

在具身智能赛道,过去两年融资总额已经冲到数百亿元,但一线投资人给出的结论却很冷静:“机器人的核心问题还是数据。”
这句话,放到中国建筑行业的“智慧工地”上,同样扎心。很多建筑企业已经上了AI安全帽识别、塔吊防碰撞、BIM协同平台,但项目经理的真实感受往往是:系统演示很好看,真正落地却总“用不起来”。
原因并不神秘——AI不是没用,而是数据底子没打好。机器人行业今天踩到的坑,很可能就是施工现场AI应用明后年要面对的现实。
这篇文章借英诺天使基金执行董事、石麻笔记主理人王建明在 GAIR 2025 的观点,从机器人具身智能的数据困局出发,对照建筑行业的智慧工地实践,讲清三个问题:
- 为什么说“数据”才是AI在建筑行业落地的真正拦路虎?
- 机器人行业解决数据问题的几条路径,对智慧工地有什么借鉴?
- 建筑企业、技术团队、创业者现在可以具体做什么,而不是继续“概念对概念”?
一、机器人与建筑:两个行业在AI上的惊人相似
先把结论说在前面:机器人行业这波具身智能热潮,和建筑业的智慧工地,有高度相似的技术–商业路径。
1. 资本热、技术酷,落地却“看得见摸不着”
王建明从 2017 年就开始看机器人项目,见证了具身智能从“小圈子研究”变成“资本宠儿”:
2024 年上半年,具身智能行业一级市场融资约 75 亿元;到 2025 年前七个月,这个数字已经超过 300 亿元。
钱下去了,技术论文刷屏了,机器人的“酷炫视频”越来越多,但她的判断非常直接:
“如果说演出、展示算落地,那是有的;但从解决真实生活问题来看,现在的具身智能还谈不上落地。”
对比一下建筑行业:
- 安监 AI 识别:展厅 Demo 能识别十几种违规,工地上摄像头脏了、角度不对、网络不稳,误报一堆,没几个月就被现场“边缘化”。
- BIM+AI 进度管理:业主汇报 PPT 里效果很华丽,真正施工管理还是回到微信群、Excel、电话沟通。
现象一样:演示效果远远领先于真实价值。
2. 技术范式相似:从“规则控制”走向“数据驱动”
传统机器人靠工程师写规则;建筑现场的传统信息化,也靠人手工配置规则(质量评分标准、进度节点、风险阈值)。
具身智能要做的是:
- 让机器人从人类示范数据、人类操作数据中学习动作和策略;
- 不再是“if-else”写死,而是“看数据长本事”。
智慧工地真正想做的,其实也一样:
- 让AI从过往项目的质量缺陷、工期延误、事故案例里,总结出风险规律;
- 不再只依赖单个总工的经验,而是项目群的“数据经验”。
机器人行业正在经历的范式转变,本质是从“工程师拍脑袋”转向“数据说话”;建筑行业如果真想让智慧工地落到生产力上,也迟早要经历这一步。
3. 核心矛盾也一样:算法不缺,数据难得
王建明的判断非常明确:
“机器人的数据问题如果不被解决的话,具身行业用现在的范式不一定做得通。”
对应到建筑:
- 模型算法供应商很多,卷精度、卷速度、卷算力;
- 真正能持续拿到结构化施工数据、质量数据、安全行为数据的企业却很少;
- 大部分“智慧工地平台”,本质还是“信息展示系统+若干 AI 小模型”,缺少完整的数据闭环。
机器人行业已经看得很清楚——不先解决数据,谈不上真正的智能。 建筑行业如果还停留在“换一套算法、升级一版模型就能起飞”的幻想里,只是延迟面对同样的问题。
二、机器人行业的数据困局,对智慧工地的三点提醒
王建明在对话里,其实已经把“数据这道坎”拆得很细。把这些经验映射到建筑行业,能得到三条非常实用的提醒。
1. 只盯“本体采集”,数据量和质量都不够
在自动驾驶和早期具身智能里,一个典型思路是:
- 把车或者机器人大规模布到路上/场景中;
- 依靠本体 + 遥操作采集行为数据;
- 再用模仿学习、强化学习去训练模型。
王建明的观察:
“现在大家发现这个方式采集数据的量、效率,包括质量,都是有问题的。”
建筑工地现在最常见的采集方式,也很类似:
- 靠摄像头全天拍,安全帽、反光衣、烟头、明火一网打尽;
- 靠塔机、升降机传感器自动上传运行数据;
- 靠扫描仪、无人机去做现场实景和 BIM 对比。
看上去数据“很多”,但现实是:
- 样本不均衡:真正关键的“重大隐患”“质量通病”样本极少,大量是没用的正常情况;
- 标注成本高:一个合格的质量缺陷样本,要工程师判定责任部位、工艺、规范条款,远比“安全帽识别”复杂;
- 语义割裂:视频里的工人、BIM 里的构件、进度计划里的WBS,是三套世界,很难自动对齐。
只依赖“把设备丢到工地上自动录”,智慧工地同样会遇到:数据一大堆,但真能用的不多。
2. 有数据≠有价值,中间缺一层“数据产品”
王建明提到,如果创业公司只是收集一些容易采的机器人数据,价值有限;
真正有价值的数据公司,至少要做到:
- 采集难度高(门槛);
- 能把数据加工、抽象为可用的特征;
- 往往还要深入到算法、模型层,形成一体化“数据产品”。
这点对建筑AI特别关键。很多智慧工地项目现在停留在:
“我们帮你把摄像头接上云平台,数据都在这儿了,你以后可以用 AI。”
但对项目经理来说,真正需要的是:
- “本标段高发的质量问题 Top 10 是什么?”
- “当前工期相对于同类型项目偏慢多少?慢在什么工序?”
- “哪些劳务队安全事故率更高?为什么?”
这中间隔着一层非常厚的“数据产品层”:
- 把图像、文本、BIM、进度、造价等数据做统一编码和对齐;
- 形成可复用的“构件–工序–质量–安全”多维标签;
- 针对具体角色(项目经理、安全总监、总工)提供不同的视角和指标。
没有这一层,再多数据也只是“存储成本”。 机器人行业已经在用“人类数据(Human Data)+算法”的一体化产品思路做突破,智慧工地也需要类似的角色——
不是“卖设备的公司”,而是“理解施工业务的数据公司”。
3. 中国长期缺乏“数据公司”,建筑业反而是机会窗口
王建明点出一个很尖锐的事实:
“在自动驾驶和大语言模型行业,中国没有培养出来相应的数据公司,可能是因为大厂太强了。”
但在机器人具身智能赛道,她认为中游一定会长出数据公司,因为行业的卡点已经清晰地暴露在“数据”上。
这对建筑业是个重要信号:
- 互联网、大模型时代,数据公司空间被大厂挤压;
- 但在垂直行业,尤其是工程建筑这类强线下、强地域、强项目制的行业,巨头并没有天然优势;
- 谁能真正啃下“施工数据”的难题,谁就有机会在未来 5–10 年成为行业基础设施。
从时间窗口上看,现在也很像具身智能的 2023 年:
- 概念已经被充分教育(智慧工地写进政策、招标文件);
- 真正有质量的数据资产还很分散;
- 行业内还没有压倒性玩家。
机器人世界里的“数据创业窗口”,正在建筑行业再现一次。
三、从世界模型到人类数据:几条可借鉴的数据路径
机器人领域解决数据问题,大致有三条路线,可以对应到建筑 AI 的具体实践。
1. 世界模型:从“现场一次性”到“虚实结合”
世界模型的抽象定义:
基于当前的观察,引入影响因素,去预测下一步的状态。可以是视频下一帧,也可以是机器人下一步动作。
在具身智能里,世界模型被期待用来:
- 在虚拟环境中大规模生成机器人交互数据;
- 让机器人先在“脑子里的世界”练,再到真实世界执行。
对智慧工地的启发是:别把所有数据采集和试错都压在真实工地上。
可以做的事情包括:
- 用 BIM+GIS+现场扫描,构建高精度“数字工地”;
- 在数字工地中,模拟不同施工方案下的工期、成本、风险;
- 让AI在虚拟环境中大量尝试任务分配、路径规划、吊装计划,而不是全在现场试。
这相当于给施工管理也建立一个“世界模型”雏形,让数据生成能力不完全依赖现场罕见事件。
2. 人类数据(Human Data):把师傅经验变成可学习样本
王建明非常看重“Human Data”这条路:
利用人类操作的轨迹、姿态、视角等,作为训练机器人的高价值数据,去弥合人和机器人之间的鸿沟。
对应到工地,有几个非常现实的落点:
- 用可穿戴设备 + 视频,记录工长、老师傅处理复杂工序的全过程;
- 用语音转写 + NLP,结构化沉淀项目例会、协调会的决策逻辑;
- 用移动端小程序,让现场工程师快速标记“这里是典型错误/隐患/优质做法”。
重点不是多高端的算法,而是:
- 让真正有经验的人的决策、操作、判断,被记录成结构化数据;
- 形成能训练模型的“施工 Human Data”,而不是只拍一堆监控视频。
机器人行业已经证明:相比大规模无差别采集,人类高质量示范数据往往更有价值。建筑 AI 也应该把资源优先投到这块,而不是只靠“多装几个摄像头”。
3. 软硬一体:别指望只买软件就有智慧工地
在机器人上,王建明对“软硬解耦”的态度很坚决:
“我不那么相信只需要做机器人的系统和软件……真正把机器人做好的一定是同时具备硬件、系统、软件、算法能力的公司。”
施工现场其实也是一个巨大的“机器人系统”:
- 摄像头、传感器、升降机、塔吊、混凝土搅拌设备,是“硬件本体”;
- BIM、进度管理系统、质量安全平台,是“系统层”;
- 各种识别模型、预测算法,是“软件和算法层”。
如果这几层之间缺乏理解和协同:
- 施工电梯司机为了省事拔掉传感器,安全监测模型再强也白搭;
- 摄像头安装位置不考虑施工工序,AI 识别再准也只能看到“脚和腰”;
- BIM 模型与实际施工不一致,后续所有基于 BIM 的进度、质量分析都是伪命题。
对建筑企业来说,一个现实决策是:
在关键项目上,优先选择能做“软硬一体方案”的团队,而不是简单采购“AI 模型”或“单一平台”。
这会稍微贵一些,但只有打通从设备到模型的完整链路,数据才能真正形成闭环,AI 才有施展空间。
四、给建筑行业的三类角色,各自一条建议
结合王建明对具身智能创业者的建议,我们可以给智慧工地生态里的三类关键角色,各提一条更落地的路。
1. 对建筑企业管理层:现在就开始“数据资产化”工程
不要等“某个完美平台”出现才动手,而是从 2025-2026 年就开始:
- 明确哪些数据是公司未来 5–10 年的核心资产(质量、进度、成本、风险);
- 制定跨项目、跨区域的统一数据标准和编码体系;
- 在重点项目上,试点“人类数据”采集和结构化沉淀;
- 在采购智慧工地时,强制要求供应商开放数据接口、交付可用数据,而不是只交一个“系统”。
一句话:少买一点炫酷功能,多投资一点长期可用的数据资产。
2. 对技术团队与解决方案商:从“功能导向”转向“数据导向”
今天很多智慧工地方案仍然是功能清单式:
- 支持 xx 类违规识别
- 支持 xx 指标看板
- 支持 xx 报表导出
建议换个思路,把产品路线完全从“数据价值”倒推:
- 这个场景里,哪几类数据,将来最有可能训练出真正有价值的模型?
- 为了拿到这几类数据,我们在硬件部署、采集流程、标注工具上应该做什么优化?
- 哪些数据可以通过世界模型/仿真生成,哪些必须靠真实人类示范?
当你能用一张图画清楚“从现场行为 -> 数据 -> 模型 -> 现场决策”的完整链路,你的方案就已经比 80% 的竞争对手更有未来。
3. 对想入局的创业者与年轻工程师:先学会“看问题”,再着急做产品
王建明给年轻创业者的建议很朴素:
“不着急。先在大的创业公司里,积累资源、观察 1 号位如何做决策,再等到你真正找到想解决的问题。”
放在建筑行业也是一样:
- 如果你还没有真正待过几个重资产项目,没感受过工期压力和质量索赔的痛,很难定义一个足够“狠”的问题;
- 最好的学习场,是有真实项目、有真金白银压力的总包或头部解决方案商;
- 多花两三年做“问题收集”和“数据嗅觉训练”,比草率做一个“又一个安全帽识别”要有价值得多。
真正好的智慧工地创业项目,往往不是因为技术多花哨,而是选对了行业的“数据卡点”。
结语:智慧工地的下一程,一定是“数据的战争”
机器人行业已经用真金白银证明了一件事:
算法可以买、算力可以租,只有高价值的数据难以复制。
建筑业的智慧工地,现在还停留在“应用堆栈之争”——谁的功能多、谁的界面炫、谁接入的设备多。但未来 3–5 年,赛道会慢慢变成:
- 谁手里有跨项目、跨区域的高质量施工数据;
- 谁真正把“师傅经验”沉淀成了可学习的 Human Data;
- 谁能用世界模型、仿真等方式,让数据生产不再完全依赖单个现场。
如果你现在就从“数据”的视角重新审视智慧工地,而不是被各种概念牵着走,那么无论你是建筑企业管理者、技术负责人,还是创业者,都有机会在下一轮行业洗牌中站在更有利的位置。
这几年,机器人行业已经帮我们趟出了一批坑。建筑行业要不要少踩几次,取决于你今天如何看待自己工地上的每一条数据。