AI 正在离开屏幕,走进家庭和工地。借灵宇宙的家庭机器人实践,看看智慧工地如何用“World as prompt”思路重构安全、进度和质量管理。

从“端茶倒水”到“巡检工地”:AI 正在离开屏幕
2023-2025 两年里,有一个趋势越来越明显:AI 不再只待在电脑和手机里,而是开始“长出手脚”,进入家庭、工厂和工地。
顾嘉唯在谈到灵宇宙时,用了一个很有意思的说法:“World as prompt,World as interface——把世界变成提示词,把世界变成交互界面。” 这句话,放在智慧工地上同样适用:
- 家里,AI 通过摄像头、麦克风理解环境,做出动作反馈孩子、陪伴家庭;
- 工地,AI 通过摄像头、传感器、BIM 数据理解现场,做出决策辅助管理、安全、质量和进度。
这篇文章,我会借灵宇宙和顾嘉唯的实践,拆解家庭消费级 AI 机器人的逻辑,看看它们能给中国“智慧工地”、建筑数字化转型什么具体启发。
一、AI 正在“落地”:虚拟世界走向物理世界
顾嘉唯反复强调的一点是:上一代大模型成长于线上文本,这一代要走向物理空间和真实世界数据。
1.1 从 GPT-3 到空间智能
过去的大模型(例如 GPT-3 这一代):
- 主要“吃”的是互联网文本;
- 善于对话、写作、知识问答;
- 但对真实空间、物体、动作的理解很弱。
顾嘉唯想做的是:
基于空间的行为与动作关系,构建“空间交互大模型”。
通俗讲:
- 不只让 AI 懂“语言”,还要懂“环境”和“动作”;
- 不只在屏幕对话,还要在现实中移动、观察、执行任务。
1.2 为什么这件事对建筑行业也很关键?
建筑行业的许多痛点,本质上就是“物理世界的复杂性”:
- 工地环境动态混乱,材料、人员、机械不断变化;
- 安全风险高度依赖空间认知(高空作业、洞口临边、吊装作业等);
- 质量问题往往藏在构件、结构、隐蔽工程中,需要多源数据判断。
如果 AI 只会看图纸、看文档,很难真正解决这些问题。要做智慧工地,就必须让 AI 像机器人一样“看得见、走得动、记得住”。
灵宇宙从家庭机器人走出了一条路径:先做消费级 AI 硬件,铺量采集真实世界的数据,再往更复杂的具身智能发展。这条路,对智慧工地非常有参考价值。
二、消费级 AI 机器人,给智慧工地的三条关键启示
灵宇宙现在做的“小方机”等家庭 AI 终端,看起来离建筑很远,但底层的技术与商业逻辑,却和智慧工地高度相通。
2.1 启示一:先铺硬件,才能有真实世界数据闭环
顾嘉唯提出了一条“特斯拉 FSD 的南坡路径”:
- 特斯拉不是先在实验室里造完“完美自动驾驶”,而是先铺车、装传感器;
- 车在路上跑,真实驾驶数据不断回流,算法越跑越好,形成闭环。
灵宇宙的做法类似:
- 先把家庭 AI 终端铺到足够多的家庭中;
- 用摄像头、麦克风等传感器采集真实的家庭场景交互数据;
- 用这些数据训练“空间交互大模型”,为未来的家用机器人打基础。
智慧工地可以参考:
- 不要一上来就奢望“全场景智能施工”,可以先从单点硬件铺设开始;
- 比如先把AI 摄像头、安全帽终端、智能巡检机器人放到更多标段;
- 把安全事件、工人行为、设备运行、进度偏差等数据长期沉淀下来。
只有这样,后面的:
- 智能安全监控;
- 施工进度预测;
- 质量问题预警;
才会从“PPT 能力”变成“数据驱动的真实能力”。
2.2 启示二:从“推荐算法”走向“关系算法”——工地 Agent 的可能性
顾嘉唯把大模型时代的变化,概括成两个词:
- 字节跳动时代是推荐算法:内容和人通过推荐函数连接;
- 现在是关系算法:一个长期和你互动的智能体,更懂你、更主动。
在家庭场景里,这意味着:
- 小方机会记住孩子的学习习惯、兴趣、节奏;
- 主动提醒、主动陪伴,而不只是被动回答问题。
如果把这个思路迁移到智慧工地,就会出现一个很有意思的画面:
每个项目部,都有一个“懂你的工地 AI Agent”。
这个 Agent:
- 长期记住这个工地的进度节奏、班组习惯、质量风险点;
- 知道某个总包喜欢哪种报表风格、哪种风险容忍度;
- 能根据过去数据,主动提醒项目经理:“今天这批混凝土天气偏冷,注意养护”和“这批钢筋班组以往返工率高,旁站要加强”。
这就是把“关系算法”从家庭搬到工地:
- 从千人一面的标准报表,变成千项目千面的工地智能助手。
2.3 启示三:陪伴一代人长大,等于积累一代人的全周期数据
顾嘉唯有一个优势:
- 他在前一家公司做过儿童阅读机器人 Luka;
- 当年的小用户,如今长成了 Alpha 世代(10 后),正好承接到灵宇宙小方机;
- 一代人的学习习惯与行为数据,形成了长期积累。
建筑行业也有类似的时间维度:
- 一个大型房建或基础设施项目周期 2-5 年,甚至更长;
- 同一个总包、分包,会在不同城市、不同项目反复出现;
- 如果 AI 能跨项目“记住”这些企业的施工习惯与风险特征,就能越做越准。
这对“智慧工地平台型公司”的启发是:
- 不要只做单项目的一次性工具;
- 要把数据和模型设计成可以跨项目、跨工地迁移学习的结构;
- 最终服务的是“这家施工企业的长期数字化能力”,而不是某一个工地。
三、World as prompt:当世界本身成为提示词
“World as prompt”这句话,如果只理解成“多模态输入”有点可惜。它更深的一层意思,是:
让物理世界本身,变成 AI 的“输入语言”。
3.1 家庭里的 World as prompt
在灵宇宙的小方机上:
- 孩子走近、抬手、小声说话,这些都是“提示词”;
- 房间光线变化、背景噪声、书本打开的内容,也是“提示词”;
- AI 不再只等你“打字提问”,而是主动感知这些信号,做出合理响应。
这对模型提出了三个要求:
- 实时多模态感知:摄像头、语音、动作、环境噪声;
- 空间理解:物体位置、遮挡、运动轨迹;
- 安全可控:在儿童场景下特别关注隐私与误判风险。
3.2 在智慧工地上,“世界提示词”长什么样?
换到智慧工地场景:“提示词”变成了:
- 塔吊运行轨迹数据;
- 工人进入危险区域的轨迹;
- 高支模结构的形变数据;
- 与 BIM 模型对比后,构件安装偏差;
- 施工日志、旁站记录、质量抽检结果。
如果把“World as prompt”的思路用在工地:
- 摄像头监测到有工人未戴安全帽靠近洞口,是一个“危险提示词”;
- 进度计划与现场实际偏差超过阈值,是一个“工期风险提示词”;
- 混凝土浇筑时的温度湿度异常,是一个“质量隐患提示词”。
智慧工地的关键,不是装多少摄像头,而是让 AI 真正“听懂”这些提示词。
这意味着:
- 要把视觉识别、IoT 传感、BIM 协同整合进一个统一的“世界模型”;
- 让模型在时间维度连续追踪,而不是只做“静态截图分析”;
- 把零散告警合并成“对项目经理讲得通的人话”。
四、从产品到商业:家庭机器人路径能给工地什么参考?
顾嘉唯很坦诚:灵宇宙这家公司,“麻雀虽小,五脏俱全”。融资 2 亿元 Pre-A,团队 40 多人,却要同时攻关:
- 多模态大模型实时交互;
- AI 硬件形态与体验;
- 国内外市场的新品类教育。
这背后有不少对建筑 AI 创业者也适用的经验。
4.1 不追求“人多”,追求“AI Native 团队”
他现在不再给自己设“几百人规模”的目标,而更在意:
- 团队是否能把 AI 真正用到研发、运营和服务流程里;
- 一个关键人才是否能“多用”,通过 AI 工具放大产出;
- 把有限的人,用到模型、数据、场景理解这些“不可替代位点”上。
对于做智慧工地解决方案的团队,这点很重要:
- 不一定要从一开始就堆大团队、大项目、大集成;
- 但必须有懂施工现场、又懂算法与产品的“复合型人才”;
- 让 AI 工具去做重复性建模、报告生成,让人专注于场景和决策。
4.2 “重体验”的新品类,必须有线下场景
顾嘉唯提到 Apple Vision Pro,强调:
- 新品类要靠“体验”教育市场;
- 需要线下体验店、专营店承接发布能力。
智慧工地的 AI 产品一样:
- 不是一段视频、一份 PPT 就能说服项目经理;
- 需要在真实工地搭一个样板区,让项目部手摸、眼看、真用上一周;
- 从首次使用体验,到日常操作流程、报表输出,真正嵌进施工管理节奏。
很多建筑企业现在做数字化,只停留在“线上演示很好看”;
真正有价值的智慧工地,是项目经理自己会主动说:“下个标段还要把这一套一起带上。”
这背后,逻辑和灵宇宙的家庭场景一样:新品类一定是重体验。
4.3 隐私与风险,不是“做完再补一刀”的事
在儿童场景中,顾嘉唯对“隐私和数据安全”的担忧非常直接:
- 设备可能持续采集家庭语音、视频;
- 会记录孩子一天中的各种行为,并通过大模型压缩与重构;
- 必须非常慎重地处理存储、安全和使用边界。
智慧工地上,数据敏感程度不低:
- 人脸信息、考勤、行为轨迹;
- 项目成本、进度延误、质量问题记录;
- 有些还涉及大型基础设施的结构安全。
如果一开始就不把“数据安全与合规”设计进产品架构:
- 后面很难通过“再加一层加密、再补一份协议”真正补齐;
- 也很容易在招投标或集团级采购阶段被卡住。
灵宇宙在家庭端选了最敏感的用户群——孩子,反而倒逼他们把隐私和安全做得更深。这一点,对打算在建筑央企、国企体系深耕的 AI 公司来说,非常值得参考。
五、具身智能的终局想象:当机器人同时出现在家和工地
顾嘉唯的终局画面,其实很简单:
养老、育儿,有机器人在旁边帮一把,把重复劳动从人身上挪走,让人把时间花在真正有温度的事上。
如果把这个愿景平移到建筑业,会是另一幅图:
- 高危、高强度、重复性的施工任务,逐步由机器人接手;
- 人更多在做决策、协同、创意与管理;
- AI 成为连接 BIM 模型与真实工地的一座桥,让“图纸上的世界”和“脚下的世界”更加同步。
这里我个人有一个判断:
- 家用机器人,是具身智能在低风险环境的“训练场”;
- 工地机器人,则是具身智能在高风险、高复杂环境的“战场”。
消费级的成功,会极大反哺工业级应用:
- 空间理解、多模态交互、安全防护、隐私保护等技术,都可以迁移;
- 数据闭环、硬件部署、用户教育的经验,也可以迁移;
- 最终,让“AI 走出屏幕”不只是一个概念,而是在家和工地同步发生的现实。
结语:智慧工地,不只是“装上 AI”,而是“学会和 AI 一起干活”
顾嘉唯引用 Alan Kay 的一句话:
“预测未来最好的方式,就是去发明它。”
对中国建筑行业来说,道理是一样的:
- 智慧工地不会自然长出来;
- 需要一批愿意在真实项目里试错、迭代的团队;
- 从小范围 AI 摄像头到全场景具身智能,一步一步往前走。
如果你在建筑企业负责数字化、智慧工地,建议从三件事开始思考:
- 先选一两个场景,敢于大规模铺设硬件,形成数据闭环;
- 把“关系算法”的思路引入项目管理,让 AI 成为长期陪伴的工地 Agent;
- 在隐私、安全和合规上,按“最严场景”来设计,而不是“能过就行”。
家庭机器人正在给我们展示一条现实路径:AI 如何从虚拟世界走向物理世界。接下来,轮到智慧工地,把这条路在建筑行业再走一遍。