腾讯任命首席AI科学家并升级AI Infra,标志大模型从“会聊天”走向“能做事”。本文拆解对电商与新零售的影响与90天落地清单。

腾讯任命首席AI科学家:电商与新零售的AI Infra竞赛加速
2025-12-17 的一则人事与架构调整,让不少做电商和新零售的人瞬间警觉:腾讯正式任命姚顺雨为「CEO/总裁办公室」首席 AI 科学家,并同时负责大语言模型与 AI Infra。更关键的是,腾讯同步新设 AI Infra 部、AI Data 部、数据计算平台部,把“大模型”从研发项目升级成公司级工程体系。
我一直觉得,大模型竞争真正的分水岭不在“谁先发一个更会聊天的模型”,而在“谁能把模型稳定、低成本、可控地跑进业务系统”。对电商与新零售来说,这意味着:更懂用户的个性化推荐、更能闭环的智能体客服、更及时的需求预测、更精准的库存与履约,以及更敏捷的动态定价。
这篇文章会把这条新闻放到“人工智能在科研与创新平台”的系列语境里聊清楚:顶级 AI 人才 + AI Infra(训练/推理/数据/评测)体系化升级,为什么会直接改变电商与新零售的竞争方式;以及企业应该怎么跟进,才能把 AI 变成可复制的增长能力,而不是一堆 Demo。
这次调整的核心:腾讯把“大模型”当成基础设施来建
结论先讲清:腾讯这次不是“换个负责人”,而是把大模型研发从算法团队的自驱,升级为平台化、工程化的组织能力。
从公开信息看,腾讯新设三块关键能力:
- AI Infra 部:负责大模型训练与推理平台能力建设,聚焦分布式训练、高性能推理服务等。
- AI Data 部:负责大模型数据与评测体系建设。
- 数据计算平台部:负责大数据与机器学习的数据智能融合平台建设。
对电商从业者来说,这几个词可以翻译成人话:
- 训练更像“科研平台”:数据管线、实验管理、评测基准、版本可追溯,决定了迭代速度。
- 推理更像“业务平台”:峰值 QPS、延迟、成本、稳定性与灰度发布,决定了能不能大规模上线。
- 数据更像“燃料与质检”:数据治理 + 评测体系,决定了模型是否可控、是否真能提升转化。
一句话:电商大模型的胜负手,越来越像“平台工程 + 数据科学”,而不只是“多写几篇论文”。
姚顺雨的“智能体路线”,为什么特别适合电商落地?
先给一个明确判断:电商与新零售最需要的不是会聊天的模型,而是能完成任务的智能体(Agent)。
姚顺雨在智能体与复杂推理上的代表性工作(如 ToT 思维树、ReAct 推理-行动框架、模块化智能体架构等)本质上都指向一件事:让模型在不确定环境里“想清楚—去执行—再验证—再调整”。这和电商业务高度同构。
智能体在电商的三类高价值任务
1)面向消费者:从“回答问题”升级为“解决问题”
传统智能客服更像 FAQ 检索:答得快,但难闭环。智能体客服则可以把多个系统串起来做事,比如:
- 识别用户意图(退换货/催发货/改地址/凑单)
- 调用订单、物流、库存、优惠券等工具接口
- 在合规边界内自动执行或引导用户确认
这类能力的商业价值往往体现在三个指标:
- **一次性解决率(FCR)**更高
- 人工转接率更低
- 投诉率与纠纷率下降
2)面向运营:从“报表分析”升级为“可执行的经营建议”
运营每天都在做多变量决策:投放、定价、促销、库存、内容、渠道。智能体可以把“分析—假设—试验—复盘”变成半自动流程,特别适合双12后到春节前这段时间:
- 节后需求回落、退货与换货波动
- 春节备货窗口短、错配成本高
- 内容与直播节奏需要更快试错
3)面向供应链与门店:从“预测”走向“动态协同”
新零售的难点不是预测,而是“预测后怎么动”:调拨、补货、排班、陈列、履约路径。智能体能把预测结果变成可执行的动作序列,并在异常(天气、突发热卖、物流延迟)出现时做策略修正。
为什么必须配套 AI Infra?
智能体不是一个模型就完事了,它至少需要:
- 工具调用(Tool Use)与权限控制
- 多轮任务规划与记忆管理
- 可观测性(日志、轨迹、失败原因)
- 在线评测与回归测试(避免一改模型就“翻车”)
所以,“首席AI科学家 + 负责 AI Infra + 负责大模型团队” 这种组合,意义在于把研究、工程和落地的断层补上。
AI Infra升级对电商的直接影响:算力、成本、速度、可控性
对电商与新零售企业来说,AI Infra不是“技术部的豪华配置”,而是四个非常现实的经营变量。
1)推理成本决定“你能让谁用、用多频、用多深”
大促期间,客服、导购、搜索、推荐都会迎来峰值。推理平台能力(例如高性能推理服务、资源调度、模型量化/蒸馏、缓存策略)会直接决定:
- 能不能全量覆盖核心流量
- 能不能在低客单价场景(例如日百、外卖、到家)也跑得起
- 能不能把智能体从“少量试点”推到“全域运营”
一句很现实的话:推理贵,智能体就只能当样板间;推理便宜,智能体才会变成水电煤。
2)数据与评测体系决定“模型是否可信、可迭代”
电商模型最怕两件事:
- 指标上涨但体验变差(例如推荐更“上头”但退货变多)
- 上线后出现合规风险(虚假承诺、诱导、价格误导等)
因此,AI Data 与评测体系必须把“业务指标 + 体验指标 + 风控指标”绑在一起。可落地的做法包括:
- 建立电商领域评测集:搜索意图理解、导购对话、售后流程、促销规则理解
- 建立智能体轨迹评测:任务完成率、工具调用正确率、异常处理成功率
- 建立上线回归机制:每次模型/提示词/工具变更,都跑一遍关键用例
这类工作看似不性感,但它决定了大模型能不能在业务里长期活下去。
3)平台化决定研发速度:从“单点突破”到“规模复制”
电商企业常见的AI困境是:某个团队做出一个不错的应用,但难以复制到其他品类、其他渠道、其他城市门店。
平台化的价值在于把可复用的东西沉淀下来:
- 统一的特征与数据管线
- 统一的训练/微调/评测工具
- 统一的模型发布、灰度与回滚
- 统一的权限与审计
这也是“科研与创新平台”系列反复强调的点:AI竞争的本质正在从“点状创新”转向“平台化创新效率”。
竞争格局怎么变:腾讯、阿里、京东在争什么?
先给结论:大家争的不是“谁的模型参数更大”,而是谁能把大模型变成电商全链路的操作系统。
腾讯的强项:连接与场景密度
腾讯的优势在于高频触点与生态连接:社交、内容、支付、小程序、企业服务等。对电商来说,这意味着智能体可以更自然地嵌入“种草—咨询—交易—履约—复购”的链路里。
当腾讯把 AI Infra 和大模型组织升级后,它更像在为“多业务同时用同一套AI能力”铺路。
阿里的强项:电商数据与交易闭环
阿里长期在交易、供给、搜索推荐、广告系统上积累了复杂工程体系。它的优势是电商链路深、数据厚、业务闭环强。应对策略大概率会更强调:
- 垂直场景模型与行业评测标准
- 供应链与履约端的智能化协同
- 对商家侧(经营、投放、客服)的AI工具矩阵
京东的强项:供应链与履约确定性
京东的核心壁垒在供应链、仓配与服务标准化。对它来说,AI Infra的价值会更集中在:
- 需求预测与库存优化
- 仓内拣选、波次、路径规划与异常处置
- 履约时效承诺的动态定价与补贴策略
我的看法是:腾讯如果要在电商与新零售上打穿,必须把“智能体 + 推理平台 + 数据评测”做成可规模化输出的能力,才能把生态连接优势变成交易与服务优势。
电商与新零售团队怎么跟进:一套可执行的落地清单
如果你在品牌、平台、零售连锁或服务商,接下来 90 天可以按这个顺序推进。我更推荐“从可控的高频场景开始”,别一上来就想重做全站。
1)先选一个“闭环任务”,而不是做聊天机器人
优先级从高到低建议:
- 售后自助(查询、改址、退换货、补发)
- 导购转化(搭配、选型、优惠计算、库存/到货承诺)
- 运营助手(活动配置校验、素材生成、复盘归因)
标准是:能调用工具、能衡量结果、能降低人工成本或提升转化。
2)把“评测”当成上线门槛
上线前就要定义清楚:
- 成功率:任务完成率 ≥ 多少
- 风险率:违规话术/错误承诺 ≤ 多少
- 成本:单次会话/单任务推理成本 ≤ 多少
- 体验:平均响应延迟 ≤ 多少毫秒
评测不过,就别灰度。电商业务的口碑成本很贵。
3)用平台思维建设AI能力:三层架构最稳
- 数据层:统一用户、商品、订单、库存、价格、活动规则的数据定义
- 模型层:通用大模型 + 电商领域微调/对齐 + 小模型(分类、召回、风控)协同
- 应用层:智能体编排(工具/流程/权限)+ 监控告警 + A/B 实验
你会发现,这套逻辑和“科研与创新平台”建设如出一辙:数据治理、实验可复现、评测可对比、发布可回滚。
经营是结果,平台是能力。能力不平台化,结果就只能靠人顶。
结尾:真正的分水岭,是把AI变成“企业内部的科研与生产平台”
姚顺雨出任腾讯首席 AI 科学家,并同时牵头大语言模型与 AI Infra,释放的信号很明确:大模型的下一阶段竞争,拼的是组织与平台工程能力。 这对电商与新零售尤其致命,因为你的业务天然是高并发、强链路、重体验、重合规。
如果你正在规划 2026 年的增长路径,我的建议是:别只盯着“要不要上大模型”,而要回答更具体的问题——你准备把哪些核心经营动作交给智能体?你是否有推理成本、数据评测、发布回滚这套平台能力来托底?
下一次行业大促的赢家,往往不是喊口号最响的,而是把 AI 当作“科研与创新平台”长期建设、并能稳定跑进交易链路的人。你更想成为哪一种?