从 New Relic NOVA 案例拆解:如何用 AI 虚拟助手把知识检索与任务执行自动化,小企业也能复用同样架构。

AI虚拟助手自动化工作流:小企业照着做
工程团队把时间花在“找答案”上,是最隐蔽也最昂贵的浪费之一。New Relic 在构建内部 AI 助手 NOVA 之前,工程师为了查分散在多个系统里的文档、规范、历史决策记录,一次内部查询可能要耗上一天。他们上线 NOVA 后,组织范围的知识检索时间实现了95% 的下降,并且每天处理 1,000+ 次查询。
我之所以觉得这个案例对小企业更重要,是因为你们更缺时间,也更难“靠堆人”解决问题。很多团队在引入 AI 时只做了一个聊天入口,结果变成“更快地胡说”。New Relic 的做法更务实:把 AI 助手当成一个可观测、可评估、可控的自动化工作流系统。这正好对应我们「AI 语音助手与自动化工作流」的核心:让知识与任务的流转更像机器人系统的“感知-决策-执行”,而不是单次问答。
这篇文章把 NOVA 的关键设计拆解成小企业能复用的路线:你不需要同样的预算,也能用同样的思路搭出一个“企业级心智”的 AI 助手,支持语音入口、自动化工单、权限申请、客户信息查询等实际工作。
先把误区踩平:AI 助手不是“更聪明的搜索框”
**答案先说:如果你的 AI 助手只会检索文档,它很快会被团队弃用。**人们需要的是“把事情办完”,而不仅是“给我一段看起来像答案的文字”。
New Relic 一开始的痛点是文档碎片化,但 NOVA 后来变成“生产力引擎”,原因是它同时处理两类需求:
- 知识型问题:规范在哪、为什么这么做、某段代码怎么用。
- 交易型任务:权限申请、密码重置、限额调整、跨系统查询与汇总。
这点和机器人产业的演进很像:服务机器人不只要“看得懂”,还得能“动手做”。企业里的 AI 助手也一样——把它理解成一个带工具的智能体(agent),才能形成可持续的效率提升。
小企业对应场景(更常见,也更刚需)
你不一定有“权限管理与限额调整”,但你一定有这些:
- 销售/客服问答:最新报价、库存、交付周期、退款规则。
- 运营流程:发票申请、合同模板、供应商资料、FAQ 更新。
- 研发协作:上线 checklist、代码规范、故障复盘、值班手册。
- 跨系统找信息:Slack/飞书聊天记录 + 网盘文档 + CRM + 工单系统。
把这些聚合到一个助手里,才是真正的“自动化工作流”。
一套可复用的架构:分类路由 + RAG + 行动代理
**答案先说:NOVA 的核心不是某个模型,而是“先判断意图,再选择路径”。**他们用一个中心代理(Central Agent)做分类与编排,把请求路由到不同子代理:
- RAG(检索增强生成)路径:从知识库检索证据,再生成回答。
- 第三方系统行动代理:对 Jira、Salesforce、Slack 等执行查询或写入。
- 内部行动代理:执行组织特定流程(权限、限额等)。
- 兜底策略:无法判断或低置信度时,询问澄清或引导人工。
这个结构对小企业特别友好,因为它能把复杂度关在“可替换的模块”里:先用一个知识助手起步,后续再逐步加行动能力。
把它翻译成“50 人团队也能落地”的版本
你可以用同样的三层思路:
- 入口层(多渠道):Slack/飞书、Web、移动端;如果你做语音助手,可以加电话/会议室设备/客服耳麦。
- 编排层(意图识别):
- 先做 6–10 个高频意图分类(如“查制度/查客户/建工单/发通知/生成邮件”)。
- 规定每个意图对应的工具与数据权限。
- 能力层(工具与知识):
- RAG:知识库(网盘、Wiki、产品手册、合同模板)。
- 工具:CRM 查询、工单创建、日历安排、ERP 库存查询。
一句话概括:别让模型“想办法”,让系统“有办法”。
让知识“更好找”:RAG 的四个细节决定成败
**答案先说:RAG 做不好,不是模型不行,而是文档没被“机器可读地整理”。**NOVA 的做法值得抄作业,尤其是下面四点。
1) 分块策略:层级分块比“固定长度切块”更稳
他们在 Amazon Bedrock Knowledge Bases 里使用了层级分块(hierarchical chunking)。对小企业来说,这意味着:
- 不要把 PDF/Word 直接丢进去就结束。
- 先按“章节-小节-条款”结构切分,让检索更像“翻目录”。
2) 上下文补强:给每块内容加关键词与背景
NOVA 用自定义函数在入库时做context enrichment,对代码类内容尤其有用。小企业也能用同样方法处理:
- 给合同条款加“适用场景/例外情况/关联流程”。
- 给客服话术加“适用客户类型/触发条件/升级路径”。
3) 元数据:时间、作者、版本信息能显著减少争议
检索到旧制度是最常见的翻车原因之一。NOVA 把标题、作者、创建/修改时间作为元数据加入。你至少要做到:
- 显示“来源文档 + 最后更新时间”。
- 对过期内容做降权或标记。
4) 针对不同数据源做定制处理
GitHub、Slack、Wiki 文档的结构完全不同。NOVA 会为代码仓库做定制处理以保留结构。你的团队也应该区分:
- 工单:按字段(客户、问题类型、解决步骤)抽取。
- 聊天记录:按线程、参与者、时间窗口聚合。
- 文档:按标题层级切分。
经验之谈:RAG 的胜负在“入库时的加工”,不在“生成时的提示词”。
把自动化做成“可审计的机器人流程”:安全、评估与可观测
**答案先说:企业级 AI 助手能用起来,靠的是管控与反馈闭环。**NOVA 从早期就把风险当成产品需求来做,而不是上线后补锅。
安全:先做 PII 检测与脱敏,再谈全员开放
NOVA 识别并屏蔽 PII,避免敏感信息被模型“顺嘴说出来”。小企业至少要设三道闸:
- 数据源权限:助手只检索它有权访问的空间/文件夹。
- 响应过滤:命中手机号、身份证、银行卡、住址等直接脱敏。
- 高风险动作二次确认:例如“修改客户合同状态”“删除工单”。
如果你的目标是AI 语音助手,这点更关键:语音更适合快速执行,也更容易误触发。强制确认(口令/确认句)能降低事故率。
评估:用“LLM-as-a-judge”建立可量化标准
NOVA 用三项指标评估系统质量:
- 答案准确度(1–5 分)
- 上下文相关度(1–5 分)
- 端到端延迟(跟踪整个链路)
并且把交互延迟目标控制在 20 秒以内,否则用户会直接回到老办法。
小企业不需要从第一天就全自动评测,但必须尽早定义:
- 你要达到多少准确率才允许执行“写入型动作”?(我建议写入型动作至少要高于纯问答)
- 多少秒以上算“慢到不可用”?(一般 10–20 秒是心理阈值区间)
可观测:给 AI 助手装上“传感器”
NOVA 用 Slack 反应(表情反馈)收集满意度,再把数据送去分析。这个思路非常像机器人系统:没有传感器就没法迭代控制策略。
你可以用更轻量的方式起步:
- 每次回答末尾提供“有用/没用”按钮
- 记录:命中的数据源、检索片段、生成模型、耗时、失败原因
- 每周复盘 Top 20 失败问题,优先修复
3 个你可以立刻落地的“小企业自动化”模板
**答案先说:先选最赚钱或最省时间的流程,不要从“全公司知识库”开始。**我见过很多团队把项目做成“信息大杂烩”,最后没人用。
模板 1:销售/客服语音助手(查价、查库存、查政策)
- 入口:电话或客服工作台语音
- RAG:价格表、政策、FAQ、交付规则
- 行动代理:CRM 查询客户等级、ERP 查询库存
- 防错:涉及报价输出必须带版本与生效日期,重要报价要求人工确认后发送
模板 2:工程团队“值班机器人”(故障处理自动化)
- 入口:Slack/飞书 + 语音转文字
- RAG:Runbook、复盘报告、监控说明
- 行动代理:创建工单、拉群、查询发布记录、生成故障时间线
- 指标:把 MTTR(平均修复时长)按月对比,别只看“大家说好用”
模板 3:权限/流程申请机器人(最容易出 ROI)
- 入口:聊天窗口一句话
- 行动代理:创建审批单、补齐必要字段、通知负责人
- 防错:所有写入动作保留审计日志;审批链路可回放
如果你来自机器人产业(服务机器人、工业机器人、人机协作),这三类模板也很熟悉:感知(收集上下文)—规划(选择流程)—执行(调用工具)—反馈(观测与改进)。企业内的“数字机器人”同样需要这条闭环。
选型与成本:别迷信“大模型”,先把路由与数据做对
**答案先说:模型可以换,架构和数据做错了换不回来。**NOVA 使用 Amazon Nova Lite/Pro 来平衡质量、成本与延迟,并保持能在不同模型间切换。
对小企业,我的建议更直接:
- 先定义延迟预算(例如 15 秒内返回)。
- 高频简单问题用轻量模型,复杂推理或长文总结再升级。
- 如果你的知识库更新频繁,把钱优先花在连接器、清洗、元数据与评估上。
你会发现“准确率上不去”的真实原因,往往是:
- 文档版本混乱
- 权限边界不清
- 没有失败样本集
- 没有把问题分类,所有问题都走同一条链路
你下一步该怎么做(真落地的那种)
New Relic 用 8 周把 NOVA 做到可用,并在全公司规模跑起来。小企业当然不必对标这个体量,但可以对标他们的节奏:先用、再评估、再扩展。
建议你用两周做一个最小可用版本(MVP):
- 选一个部门(客服或工程都行),确定 30 个高频问题。
- 建一个小而干净的知识库:只放“权威版本”的 20–50 份文档。
- 做意图分类:至少区分“问答”和“要执行动作”。
- 加反馈按钮与日志,建立每周复盘机制。
当助手开始稳定回答、并能可靠执行 1–2 个动作流程时,再扩到第二个部门。你的目标不是做“全能 AI”,而是做一套能不断生长的自动化工作流机器人系统。
如果你准备把入口升级为AI 语音助手,可以想想:当员工在仓库、车间、门店或客户现场时,能用一句话完成查询与提交,效率提升会更明显。真正的问题是——你会把语音助手当成“语音聊天”,还是当成“能执行的机器人流程”?