腾讯大模型组织升级与姚顺雨加盟,释放出AI Infra与评测体系优先的信号。本文拆解其对电商推荐、动态定价与智能仓配的落地价值。

腾讯大模型架构升级:AI Infra如何支撑电商推荐、定价与仓配
2025-12-18,腾讯内部宣布大模型研发组织架构调整:新设 AI Infra部、AI Data部、数据计算平台部,并明确 姚顺雨加盟,担任“CEO/总裁办公室”首席AI科学家,向刘炽平汇报,同时兼任AI Infra部与大语言模型部负责人。这类“研究+工程+平台”三位一体的组织动作,外行看热闹,电商和新零售从业者应该看门道:大模型竞争正在从“谁的模型更大”转向“谁能把模型稳定、低成本地跑在真实业务里”。
我更愿意把这次调整理解为一个清晰信号:腾讯在把“大模型能力”从实验室推到“可规模化的产业基础设施”。而电商与新零售恰恰是最吃“基础设施”的行业——推荐要快、定价要准、库存要稳、履约要省,任何一次模型波动、延迟抖动、数据口径不统一,都会直接反映到转化率、退款率与履约成本上。
作为“人工智能在科研与创新平台”系列的一篇文章,这次我们不只聊人事与组织图,而是把它拆成电商人真正关心的三件事:AI Infra能带来什么确定性、AI Data如何决定效果上限、Agent思路为什么会改变零售运营方式。
组织架构的变化,真正指向“可交付的大模型工程能力”
核心结论:把AI Infra与AI Data、数据计算平台拆开,是在为大模型“长期可用、可控成本、可评估迭代”铺路。 这比单纯追模型参数更接近电商业务的真实需求。
从腾讯披露的信息看:
- AI Infra部:面向大模型训练与推理平台能力建设,聚焦分布式训练、高性能推理服务等。它解决的是“模型跑得稳不稳、快不快、贵不贵”。
- AI Data部:负责大模型数据与评测体系建设。它解决的是“喂什么数据、怎么证明提升是真的”。
- 数据计算平台部:偏大数据与机器学习的数据智能融合平台。它解决的是“数据口径一致、特征生产效率、在线/离线协同”。
对电商与新零售而言,这三块分别对应三条生命线:
- 推理延迟(影响搜索、推荐、客服的实时体验)
- 评测口径(影响“改了到底有没有用”,避免线上事故)
- 数据流水线(影响多渠道、多门店、多系统下的统一运营)
很多公司上大模型,最先翻车的不是模型“不会说话”,而是:高峰期推理排队、A/B口径不一致、数据回流慢、成本不可控,最终被业务团队判定为“华而不实”。腾讯此轮组织升级,本质是在把这些工程难题前置解决。
为什么“AI Infra”对电商最关键?
一句话:电商不是演示场,它是高并发、强约束、低容错的系统工程。
双12刚过去、年货节临近(2025-12下旬到2026-01是零售波峰),推荐、广告、客服、风控会同时拉满。此时大模型能力如果不能稳定输出,就会出现典型连锁反应:
- 推荐延迟增加 → 首屏加载变慢 → 跳出率上升
- 智能客服响应不稳 → 人工接管增多 → 服务成本飙升
- 促销定价与库存联动失真 → 缺货与超卖增加 → 投诉上升
所以,AI Infra不是“后台技术”,它直接决定新零售的用户体验曲线和利润曲线。
姚顺雨的“Agent方法论”,对新零售意味着什么
核心结论:如果把大模型当“聊天工具”,收益有限;把大模型当“能在系统里做事的Agent”,零售运营会出现结构性变化。
姚顺雨在Agent方向的代表性工作(如ReAct、Tree of Thoughts、SWE-bench、SWE-agent)有一个共同点:强调“推理+行动”与“评估体系”。这和零售的真实难题高度一致:零售不是生成一段文本,而是在约束条件下做一连串决策,并对结果负责。
把这个思路翻译成零售语言,可以变成三条可落地的判断:
- Agent要能“调用工具”只是入门,关键是能在变化环境里泛化。
- 真正难的是简单任务的可靠性。 例如:改地址、拆单、退换货解释、发票补开——这些高频小事最影响满意度。
- 评估要前置。 没有可复现的评测与回放机制,任何“效果提升”都经不起大促压力测试。
一个具体场景:从“推荐模型”到“选品-定价-补货联动Agent”
传统做法是各团队各自优化:推荐看CTR、定价看毛利、仓配看履约。结果很常见:
- 推荐把爆品推爆 → 仓库来不及补 → 缺货导致转化掉头
- 动态降价拉动销量 → 但把低毛利订单放大 → 经营承压
Agent式做法更像“编排系统”:
- Agent读取实时库存、到货周期、毛利底线、促销规则
- 生成候选动作:调整推荐曝光、局部调价、触发调拨或补货
- 通过评测与模拟(回放历史大促、按城市/门店切片)筛选动作
- 在线小流量灰度,触发阈值回滚
要做到这一步,背后依赖的不是一句提示词,而是AI Infra的高性能推理、AI Data的评测体系、以及数据计算平台的统一数据底座。
大模型研发升级,如何落到“推荐、动态定价、智能仓储”三件事上
核心结论:电商新零售的AI价值,往往不是“做一个新功能”,而是把老链路重新做成“可学习、可迭代、可评估”的闭环系统。
1)个性化推荐:从“相关性”走向“意图与约束”
推荐系统正在从“猜你喜欢”升级为“在约束下给你最合适”。约束包括:库存、时效、价格敏感度、退货倾向、会员权益、区域合规等。
大模型能补足的,是对“意图”的理解与对“复杂上下文”的融合,但前提是:
- 推理延迟可控(否则首屏体验崩)
- 特征与标签生产体系稳定(否则线上线下口径打架)
- 评测覆盖大促与长尾用户(否则只对小样本“显著提升”)
这正是AI Infra+AI Data组合拳的价值。
2)动态定价:不是“随便改价”,而是可解释的利润控制
动态定价在国内电商经常被误解成“跟竞品就行”。真实难点是:价格动作必须可解释、可追责、可回放。
一套成熟的AI定价体系至少包含:
- 需求弹性估计(按品类/渠道/城市分层)
- 竞品价格监测与噪声过滤
- 毛利/补贴/库存约束的硬边界
- 动作评测:GMV、毛利、退货率、客服压力的联合指标
没有AI Data的评测体系和数据计算平台的一致口径,定价模型很容易“线上赢指标、线下亏现金”。
3)智能仓储与履约:大模型更适合做“决策解释与异常处理”
仓配优化很多是运筹学与预测模型的天下,但大模型的机会在两类:
- 异常处理:爆仓、天气延误、临时封控、供应商迟到等非结构化事件
- 人机协同:给仓内班组长、城市调度一个“为什么这样调拨”的解释
当AI Infra提供稳定推理服务时,大模型可以在仓配系统中做“解释层+编排层”,把传统算法的输出变成可操作的现场指令,并把执行反馈回流为评测数据。
“AI下半场”:评估先行,才配谈规模化落地
核心结论:零售AI最值得投的不是“更会说话”,而是“更可测、更可控、更可复用”。
姚顺雨提出过“AI下半场”的典型观点:从“训练>评估”走向“评估>训练”。放到电商,就是:
- 先定义清楚什么叫“更好”(不仅是CTR,还要看退款率、履约成本、复购等)
- 再决定训练什么模型、接入哪些数据
我见过不少团队在推荐或客服上做大模型,最大的分水岭不是预算,而是有没有把评估做成工程化能力。你需要的不是一次性对比,而是一整套机制:
- 离线回放:用历史会话、订单链路做自动回放评测
- 在线灰度:小流量、多城市分层,设置回滚阈值
- 事故复盘:把“失败样本”结构化入库,变成下次训练/对齐的数据
当组织里有专门的AI Data与Infra团队时,这套机制更容易形成平台能力,而不是散落在各业务线“各做一套”。
给电商与新零售团队的3个行动建议(现在就能做)
核心结论:先补“平台与评估”,再谈“模型与应用”,落地会快很多。
-
把AI能力按“链路”而不是“功能”规划
- 别只做“智能客服/智能推荐”单点。
- 直接画出从触达→转化→履约→售后→复购的闭环,明确每一步的可观测指标与数据回流。
-
先做一套“可复用评测集”,覆盖大促与长尾
- 客服:退换货、发票、改地址、延迟赔付等高频场景。
- 推荐:新客冷启动、低库存、跨品类搭配、价格敏感人群。
- 定价:促销叠加、区域价差、竞品噪声。
-
为大模型推理设置“成本上限”和“延迟红线”
- 把推理成本当成经营指标管理。
- 明确“哪个链路必须实时、哪个可以异步”,避免用昂贵实时推理去做低价值任务。
一句话原则:能省的算力就省,把预算留给“必须实时、必须可靠”的关键链路。
结尾:腾讯这次提速,零售行业该跟上的不是热度,而是方法
腾讯通过新设AI Infra、AI Data与数据计算平台,并引入姚顺雨这样的Agent方向研究者,把“研究能力、工程能力、平台能力”绑到同一条交付链路上。对电商与新零售来说,这释放的信号很明确:下一阶段的胜负手在基础设施与评估体系,而不是单点应用的炫技。
如果你正在规划2026年的增长与降本,我建议把大模型项目从“做一个功能”升级为“做一套可评估、可扩展的智能运营平台”。推荐、定价、仓配、客服并不是四个项目,而是同一条数据闭环上的四个节点。
真正值得思考的问题是:当大模型变成企业的“通用决策层”,你的组织、数据与流程,准备好接住它了吗?