腾讯任命首席AI科学家:电商与新零售的AI Infra竞赛加速

人工智能在科研与创新平台By 3L3C

腾讯任命首席AI科学家并升级AI Infra,标志大模型从“会聊天”走向“能做事”。本文拆解对电商与新零售的影响与90天落地清单。

腾讯AI大语言模型AI基础设施智能体电商增长新零售数据评测
Share:

Featured image for 腾讯任命首席AI科学家:电商与新零售的AI Infra竞赛加速

腾讯任命首席AI科学家:电商与新零售的AI Infra竞赛加速

2025-12-17 的一则人事与架构调整,让不少做电商和新零售的人瞬间警觉:腾讯正式任命姚顺雨为「CEO/总裁办公室」首席 AI 科学家,并同时负责大语言模型与 AI Infra。更关键的是,腾讯同步新设 AI Infra 部、AI Data 部、数据计算平台部,把“大模型”从研发项目升级成公司级工程体系。

我一直觉得,大模型竞争真正的分水岭不在“谁先发一个更会聊天的模型”,而在“谁能把模型稳定、低成本、可控地跑进业务系统”。对电商与新零售来说,这意味着:更懂用户的个性化推荐、更能闭环的智能体客服、更及时的需求预测、更精准的库存与履约,以及更敏捷的动态定价。

这篇文章会把这条新闻放到“人工智能在科研与创新平台”的系列语境里聊清楚:顶级 AI 人才 + AI Infra(训练/推理/数据/评测)体系化升级,为什么会直接改变电商与新零售的竞争方式;以及企业应该怎么跟进,才能把 AI 变成可复制的增长能力,而不是一堆 Demo。

这次调整的核心:腾讯把“大模型”当成基础设施来建

结论先讲清:腾讯这次不是“换个负责人”,而是把大模型研发从算法团队的自驱,升级为平台化、工程化的组织能力

从公开信息看,腾讯新设三块关键能力:

  • AI Infra 部:负责大模型训练与推理平台能力建设,聚焦分布式训练、高性能推理服务等。
  • AI Data 部:负责大模型数据与评测体系建设。
  • 数据计算平台部:负责大数据与机器学习的数据智能融合平台建设。

对电商从业者来说,这几个词可以翻译成人话:

  1. 训练更像“科研平台”:数据管线、实验管理、评测基准、版本可追溯,决定了迭代速度。
  2. 推理更像“业务平台”:峰值 QPS、延迟、成本、稳定性与灰度发布,决定了能不能大规模上线。
  3. 数据更像“燃料与质检”:数据治理 + 评测体系,决定了模型是否可控、是否真能提升转化。

一句话:电商大模型的胜负手,越来越像“平台工程 + 数据科学”,而不只是“多写几篇论文”。

姚顺雨的“智能体路线”,为什么特别适合电商落地?

先给一个明确判断:电商与新零售最需要的不是会聊天的模型,而是能完成任务的智能体(Agent)。

姚顺雨在智能体与复杂推理上的代表性工作(如 ToT 思维树、ReAct 推理-行动框架、模块化智能体架构等)本质上都指向一件事:让模型在不确定环境里“想清楚—去执行—再验证—再调整”。这和电商业务高度同构。

智能体在电商的三类高价值任务

1)面向消费者:从“回答问题”升级为“解决问题”

传统智能客服更像 FAQ 检索:答得快,但难闭环。智能体客服则可以把多个系统串起来做事,比如:

  • 识别用户意图(退换货/催发货/改地址/凑单)
  • 调用订单、物流、库存、优惠券等工具接口
  • 在合规边界内自动执行或引导用户确认

这类能力的商业价值往往体现在三个指标:

  • **一次性解决率(FCR)**更高
  • 人工转接率更低
  • 投诉率与纠纷率下降

2)面向运营:从“报表分析”升级为“可执行的经营建议”

运营每天都在做多变量决策:投放、定价、促销、库存、内容、渠道。智能体可以把“分析—假设—试验—复盘”变成半自动流程,特别适合双12后到春节前这段时间:

  • 节后需求回落、退货与换货波动
  • 春节备货窗口短、错配成本高
  • 内容与直播节奏需要更快试错

3)面向供应链与门店:从“预测”走向“动态协同”

新零售的难点不是预测,而是“预测后怎么动”:调拨、补货、排班、陈列、履约路径。智能体能把预测结果变成可执行的动作序列,并在异常(天气、突发热卖、物流延迟)出现时做策略修正。

为什么必须配套 AI Infra?

智能体不是一个模型就完事了,它至少需要:

  • 工具调用(Tool Use)与权限控制
  • 多轮任务规划与记忆管理
  • 可观测性(日志、轨迹、失败原因)
  • 在线评测与回归测试(避免一改模型就“翻车”)

所以,“首席AI科学家 + 负责 AI Infra + 负责大模型团队” 这种组合,意义在于把研究、工程和落地的断层补上。

AI Infra升级对电商的直接影响:算力、成本、速度、可控性

对电商与新零售企业来说,AI Infra不是“技术部的豪华配置”,而是四个非常现实的经营变量。

1)推理成本决定“你能让谁用、用多频、用多深”

大促期间,客服、导购、搜索、推荐都会迎来峰值。推理平台能力(例如高性能推理服务、资源调度、模型量化/蒸馏、缓存策略)会直接决定:

  • 能不能全量覆盖核心流量
  • 能不能在低客单价场景(例如日百、外卖、到家)也跑得起
  • 能不能把智能体从“少量试点”推到“全域运营”

一句很现实的话:推理贵,智能体就只能当样板间;推理便宜,智能体才会变成水电煤。

2)数据与评测体系决定“模型是否可信、可迭代”

电商模型最怕两件事:

  • 指标上涨但体验变差(例如推荐更“上头”但退货变多)
  • 上线后出现合规风险(虚假承诺、诱导、价格误导等)

因此,AI Data 与评测体系必须把“业务指标 + 体验指标 + 风控指标”绑在一起。可落地的做法包括:

  • 建立电商领域评测集:搜索意图理解、导购对话、售后流程、促销规则理解
  • 建立智能体轨迹评测:任务完成率、工具调用正确率、异常处理成功率
  • 建立上线回归机制:每次模型/提示词/工具变更,都跑一遍关键用例

这类工作看似不性感,但它决定了大模型能不能在业务里长期活下去。

3)平台化决定研发速度:从“单点突破”到“规模复制”

电商企业常见的AI困境是:某个团队做出一个不错的应用,但难以复制到其他品类、其他渠道、其他城市门店。

平台化的价值在于把可复用的东西沉淀下来:

  • 统一的特征与数据管线
  • 统一的训练/微调/评测工具
  • 统一的模型发布、灰度与回滚
  • 统一的权限与审计

这也是“科研与创新平台”系列反复强调的点:AI竞争的本质正在从“点状创新”转向“平台化创新效率”。

竞争格局怎么变:腾讯、阿里、京东在争什么?

先给结论:大家争的不是“谁的模型参数更大”,而是谁能把大模型变成电商全链路的操作系统

腾讯的强项:连接与场景密度

腾讯的优势在于高频触点与生态连接:社交、内容、支付、小程序、企业服务等。对电商来说,这意味着智能体可以更自然地嵌入“种草—咨询—交易—履约—复购”的链路里。

当腾讯把 AI Infra 和大模型组织升级后,它更像在为“多业务同时用同一套AI能力”铺路。

阿里的强项:电商数据与交易闭环

阿里长期在交易、供给、搜索推荐、广告系统上积累了复杂工程体系。它的优势是电商链路深、数据厚、业务闭环强。应对策略大概率会更强调:

  • 垂直场景模型与行业评测标准
  • 供应链与履约端的智能化协同
  • 对商家侧(经营、投放、客服)的AI工具矩阵

京东的强项:供应链与履约确定性

京东的核心壁垒在供应链、仓配与服务标准化。对它来说,AI Infra的价值会更集中在:

  • 需求预测与库存优化
  • 仓内拣选、波次、路径规划与异常处置
  • 履约时效承诺的动态定价与补贴策略

我的看法是:腾讯如果要在电商与新零售上打穿,必须把“智能体 + 推理平台 + 数据评测”做成可规模化输出的能力,才能把生态连接优势变成交易与服务优势。

电商与新零售团队怎么跟进:一套可执行的落地清单

如果你在品牌、平台、零售连锁或服务商,接下来 90 天可以按这个顺序推进。我更推荐“从可控的高频场景开始”,别一上来就想重做全站。

1)先选一个“闭环任务”,而不是做聊天机器人

优先级从高到低建议:

  1. 售后自助(查询、改址、退换货、补发)
  2. 导购转化(搭配、选型、优惠计算、库存/到货承诺)
  3. 运营助手(活动配置校验、素材生成、复盘归因)

标准是:能调用工具、能衡量结果、能降低人工成本或提升转化。

2)把“评测”当成上线门槛

上线前就要定义清楚:

  • 成功率:任务完成率 ≥ 多少
  • 风险率:违规话术/错误承诺 ≤ 多少
  • 成本:单次会话/单任务推理成本 ≤ 多少
  • 体验:平均响应延迟 ≤ 多少毫秒

评测不过,就别灰度。电商业务的口碑成本很贵。

3)用平台思维建设AI能力:三层架构最稳

  • 数据层:统一用户、商品、订单、库存、价格、活动规则的数据定义
  • 模型层:通用大模型 + 电商领域微调/对齐 + 小模型(分类、召回、风控)协同
  • 应用层:智能体编排(工具/流程/权限)+ 监控告警 + A/B 实验

你会发现,这套逻辑和“科研与创新平台”建设如出一辙:数据治理、实验可复现、评测可对比、发布可回滚。

经营是结果,平台是能力。能力不平台化,结果就只能靠人顶。

结尾:真正的分水岭,是把AI变成“企业内部的科研与生产平台”

姚顺雨出任腾讯首席 AI 科学家,并同时牵头大语言模型与 AI Infra,释放的信号很明确:大模型的下一阶段竞争,拼的是组织与平台工程能力。 这对电商与新零售尤其致命,因为你的业务天然是高并发、强链路、重体验、重合规。

如果你正在规划 2026 年的增长路径,我的建议是:别只盯着“要不要上大模型”,而要回答更具体的问题——你准备把哪些核心经营动作交给智能体?你是否有推理成本、数据评测、发布回滚这套平台能力来托底?

下一次行业大促的赢家,往往不是喊口号最响的,而是把 AI 当作“科研与创新平台”长期建设、并能稳定跑进交易链路的人。你更想成为哪一种?