人工智能在科研与创新平台•2025年12月19日•By 3L3C

腾讯任命首席AI科学家并升级AI Infra，标志大模型从“会聊天”走向“能做事”。本文拆解对电商与新零售的影响与90天落地清单。

腾讯AI大语言模型AI基础设施智能体电商增长新零售数据评测

Featured image for 腾讯任命首席AI科学家：电商与新零售的AI Infra竞赛加速

腾讯任命首席AI科学家：电商与新零售的AI Infra竞赛加速

2025-12-17 的一则人事与架构调整，让不少做电商和新零售的人瞬间警觉：腾讯正式任命姚顺雨为「CEO/总裁办公室」首席 AI 科学家，并同时负责大语言模型与 AI Infra。更关键的是，腾讯同步新设 AI Infra 部、AI Data 部、数据计算平台部，把“大模型”从研发项目升级成公司级工程体系。

我一直觉得，大模型竞争真正的分水岭不在“谁先发一个更会聊天的模型”，而在“谁能把模型稳定、低成本、可控地跑进业务系统”。对电商与新零售来说，这意味着：更懂用户的个性化推荐、更能闭环的智能体客服、更及时的需求预测、更精准的库存与履约，以及更敏捷的动态定价。

这篇文章会把这条新闻放到“人工智能在科研与创新平台”的系列语境里聊清楚：顶级 AI 人才 + AI Infra（训练/推理/数据/评测）体系化升级，为什么会直接改变电商与新零售的竞争方式；以及企业应该怎么跟进，才能把 AI 变成可复制的增长能力，而不是一堆 Demo。

这次调整的核心：腾讯把“大模型”当成基础设施来建

结论先讲清：腾讯这次不是“换个负责人”，而是把大模型研发从算法团队的自驱，升级为平台化、工程化的组织能力。

从公开信息看，腾讯新设三块关键能力：

AI Infra 部：负责大模型训练与推理平台能力建设，聚焦分布式训练、高性能推理服务等。
AI Data 部：负责大模型数据与评测体系建设。
数据计算平台部：负责大数据与机器学习的数据智能融合平台建设。

对电商从业者来说，这几个词可以翻译成人话：

训练更像“科研平台”：数据管线、实验管理、评测基准、版本可追溯，决定了迭代速度。
推理更像“业务平台”：峰值 QPS、延迟、成本、稳定性与灰度发布，决定了能不能大规模上线。
数据更像“燃料与质检”：数据治理 + 评测体系，决定了模型是否可控、是否真能提升转化。

一句话：电商大模型的胜负手，越来越像“平台工程 + 数据科学”，而不只是“多写几篇论文”。

姚顺雨的“智能体路线”，为什么特别适合电商落地？

先给一个明确判断：电商与新零售最需要的不是会聊天的模型，而是能完成任务的智能体（Agent）。

姚顺雨在智能体与复杂推理上的代表性工作（如 ToT 思维树、ReAct 推理-行动框架、模块化智能体架构等）本质上都指向一件事：让模型在不确定环境里“想清楚—去执行—再验证—再调整”。这和电商业务高度同构。

智能体在电商的三类高价值任务

1）面向消费者：从“回答问题”升级为“解决问题”

传统智能客服更像 FAQ 检索：答得快，但难闭环。智能体客服则可以把多个系统串起来做事，比如：

识别用户意图（退换货/催发货/改地址/凑单）
调用订单、物流、库存、优惠券等工具接口
在合规边界内自动执行或引导用户确认

这类能力的商业价值往往体现在三个指标：

**一次性解决率（FCR）**更高
人工转接率更低
投诉率与纠纷率下降

2）面向运营：从“报表分析”升级为“可执行的经营建议”

运营每天都在做多变量决策：投放、定价、促销、库存、内容、渠道。智能体可以把“分析—假设—试验—复盘”变成半自动流程，特别适合双12后到春节前这段时间：

节后需求回落、退货与换货波动
春节备货窗口短、错配成本高
内容与直播节奏需要更快试错

3）面向供应链与门店：从“预测”走向“动态协同”

新零售的难点不是预测，而是“预测后怎么动”：调拨、补货、排班、陈列、履约路径。智能体能把预测结果变成可执行的动作序列，并在异常（天气、突发热卖、物流延迟）出现时做策略修正。

为什么必须配套 AI Infra？

智能体不是一个模型就完事了，它至少需要：

工具调用（Tool Use）与权限控制
多轮任务规划与记忆管理
可观测性（日志、轨迹、失败原因）
在线评测与回归测试（避免一改模型就“翻车”）

所以，“首席AI科学家 + 负责 AI Infra + 负责大模型团队” 这种组合，意义在于把研究、工程和落地的断层补上。

AI Infra升级对电商的直接影响：算力、成本、速度、可控性

对电商与新零售企业来说，AI Infra不是“技术部的豪华配置”，而是四个非常现实的经营变量。

1）推理成本决定“你能让谁用、用多频、用多深”

大促期间，客服、导购、搜索、推荐都会迎来峰值。推理平台能力（例如高性能推理服务、资源调度、模型量化/蒸馏、缓存策略）会直接决定：

能不能全量覆盖核心流量
能不能在低客单价场景（例如日百、外卖、到家）也跑得起
能不能把智能体从“少量试点”推到“全域运营”

一句很现实的话：推理贵，智能体就只能当样板间；推理便宜，智能体才会变成水电煤。

2）数据与评测体系决定“模型是否可信、可迭代”

电商模型最怕两件事：

指标上涨但体验变差（例如推荐更“上头”但退货变多）
上线后出现合规风险（虚假承诺、诱导、价格误导等）

因此，AI Data 与评测体系必须把“业务指标 + 体验指标 + 风控指标”绑在一起。可落地的做法包括：

建立电商领域评测集：搜索意图理解、导购对话、售后流程、促销规则理解
建立智能体轨迹评测：任务完成率、工具调用正确率、异常处理成功率
建立上线回归机制：每次模型/提示词/工具变更，都跑一遍关键用例

这类工作看似不性感，但它决定了大模型能不能在业务里长期活下去。

3）平台化决定研发速度：从“单点突破”到“规模复制”

电商企业常见的AI困境是：某个团队做出一个不错的应用，但难以复制到其他品类、其他渠道、其他城市门店。

平台化的价值在于把可复用的东西沉淀下来：

统一的特征与数据管线
统一的训练/微调/评测工具
统一的模型发布、灰度与回滚
统一的权限与审计

这也是“科研与创新平台”系列反复强调的点：AI竞争的本质正在从“点状创新”转向“平台化创新效率”。

竞争格局怎么变：腾讯、阿里、京东在争什么？

先给结论：大家争的不是“谁的模型参数更大”，而是谁能把大模型变成电商全链路的操作系统。

腾讯的强项：连接与场景密度

腾讯的优势在于高频触点与生态连接：社交、内容、支付、小程序、企业服务等。对电商来说，这意味着智能体可以更自然地嵌入“种草—咨询—交易—履约—复购”的链路里。

当腾讯把 AI Infra 和大模型组织升级后，它更像在为“多业务同时用同一套AI能力”铺路。

阿里的强项：电商数据与交易闭环

阿里长期在交易、供给、搜索推荐、广告系统上积累了复杂工程体系。它的优势是电商链路深、数据厚、业务闭环强。应对策略大概率会更强调：

垂直场景模型与行业评测标准
供应链与履约端的智能化协同
对商家侧（经营、投放、客服）的AI工具矩阵

京东的强项：供应链与履约确定性

京东的核心壁垒在供应链、仓配与服务标准化。对它来说，AI Infra的价值会更集中在：

需求预测与库存优化
仓内拣选、波次、路径规划与异常处置
履约时效承诺的动态定价与补贴策略

我的看法是：腾讯如果要在电商与新零售上打穿，必须把“智能体 + 推理平台 + 数据评测”做成可规模化输出的能力，才能把生态连接优势变成交易与服务优势。

电商与新零售团队怎么跟进：一套可执行的落地清单

如果你在品牌、平台、零售连锁或服务商，接下来 90 天可以按这个顺序推进。我更推荐“从可控的高频场景开始”，别一上来就想重做全站。

1）先选一个“闭环任务”，而不是做聊天机器人

优先级从高到低建议：

售后自助（查询、改址、退换货、补发）
导购转化（搭配、选型、优惠计算、库存/到货承诺）
运营助手（活动配置校验、素材生成、复盘归因）

标准是：能调用工具、能衡量结果、能降低人工成本或提升转化。

2）把“评测”当成上线门槛

上线前就要定义清楚：

成功率：任务完成率 ≥ 多少
风险率：违规话术/错误承诺 ≤ 多少
成本：单次会话/单任务推理成本 ≤ 多少
体验：平均响应延迟 ≤ 多少毫秒

评测不过，就别灰度。电商业务的口碑成本很贵。

3）用平台思维建设AI能力：三层架构最稳

数据层：统一用户、商品、订单、库存、价格、活动规则的数据定义
模型层：通用大模型 + 电商领域微调/对齐 + 小模型（分类、召回、风控）协同
应用层：智能体编排（工具/流程/权限）+ 监控告警 + A/B 实验

你会发现，这套逻辑和“科研与创新平台”建设如出一辙：数据治理、实验可复现、评测可对比、发布可回滚。

经营是结果，平台是能力。能力不平台化，结果就只能靠人顶。

结尾：真正的分水岭，是把AI变成“企业内部的科研与生产平台”

姚顺雨出任腾讯首席 AI 科学家，并同时牵头大语言模型与 AI Infra，释放的信号很明确：大模型的下一阶段竞争，拼的是组织与平台工程能力。 这对电商与新零售尤其致命，因为你的业务天然是高并发、强链路、重体验、重合规。

如果你正在规划 2026 年的增长路径，我的建议是：别只盯着“要不要上大模型”，而要回答更具体的问题——你准备把哪些核心经营动作交给智能体？你是否有推理成本、数据评测、发布回滚这套平台能力来托底？

下一次行业大促的赢家，往往不是喊口号最响的，而是把 AI 当作“科研与创新平台”长期建设、并能稳定跑进交易链路的人。你更想成为哪一种？