---
source_url: https://mp.weixin.qq.com/s/EezA0kT_hQCXze9LEOeuqg
title: "面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？"
source: "大淘宝技术"
ingested: 2026-06-01
sha256: 3ec35f9aef271974af12412a717e0e451719fa232e23bfe7c43ae0d45d01f7e1
---

# 面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？

**作者：** 久游，淘天集团-营销&交易技术团队
**发布日期：** 2026年6月1日

## 摘要

2025年成为AI智能体(Agentic AI)元年，传统工程架构面临与AI"不确定性"的冲突。AI Friendly架构通过三范式实现演进：1)确定性→概率性，将输出收敛至安全区间；2)结构化→语义化，基于意图而非格式响应；3)静态→动态，从规则转向规划。核心能力包括Multi-Agent系统、Context Engineering(上下文工程)、AI Friendly API及AI可观测体系。实际应用中，AI审核准确率达95.7%，AI答疑系统CogentAI问题解决准确率超98%，为业务带来80%以上效率提升。

## 内容

25年伊始，智源研究院提出了《十大AI技术趋势》，2025年成为AI智能体（Agentic AI）的元年，更通用、更自主、深入工作与生活场景的智能体成为各行各业争相追逐的目标。

站在新年，回望AI应用的发展历程，随着一些大模型明星产品的出现，可以清晰的感知到行业对于AI应用形态的理解也已经越发深入：

- 从Chatbot、Copilot到AI Agent，AI从提供建议，跨度到可以辅助完成任务；
- 随着AI Agent应用编排框架不断收敛、Agentic AI概念的提出，从更强调产品概念的AI Agent，跨度到可以独立完成任务，集自主规划、决策、执行于一身，更强调应用智能程度的Agentic AI。

可以预见，此后也将看到智能化程度更高、对业务流程理解更深的多智能体系统在应用侧的落地，而对处于时代弄潮之巅的AI工程师来说，如何将工程架构完成从传统工程架构向AI Friendly架构的转变，已然成为进入AI时代的重要门票。

## 冲突：当 AI 遇见传统工程架构

传统的工程架构按照服务主体的不同，通常可以划分为业务型架构和平台型架构：

**传统平台型架构**（DDD思想）：系统设计核心是领域模型的标准化与业务流程的抽象化，通过统一抽象实现新增功能可配置、可组合、可沉淀，达到80%~90%功能的复用。

**传统业务型架构**（MVC思想）：简单成熟的分层架构，通过引入恰当的设计模式和数据结构来支持业务的快速发展。

两种架构都秉承着"以人为本"的设计理念，趋向于处理确定性逻辑——输入格式规范、输出内容可预测、基于预定义的流程来执行、依赖于规则和配置。

但AI天生具有概率性和涌现性，当以"不确定"为基础的AI遇见以"确定性"为基础的传统架构时，产生难以调和的矛盾：

- 当AI的输出没有遵循既定的schema格式时，传统架构便束手无策，只能默默报错；
- 当流程/工具/函数需要根据上下文动态选择时，传统架构便无计可施；
- 当以高延迟、低吞吐为特点的Agent进入以低延迟、高吞吐为设计原则的传统架构中，各种超时、可用性问题的确层出不穷。

## 演进：从"传统"到"AI Friendly"

核心逻辑：**赋能传统工程以驾驭"不确定性"的能力**。AI Friendly架构并非对传统工程经验的全盘否定，而是在坚实工程地基上，为应对"不确定性"的一次精准架构升级。

### 演进的三范式

**1. 从确定性到概率性**

传统工程建立在确定性逻辑之上，系统输出严格遵循 y=f(x) 的映射关系。AI工程则运行于概率空间之中，系统输出是大模型、提示词、上下文与环境共同"涌现"的结果。架构设计的核心目标不再是追求零误差，而是通过RAG增强、提示词或上下文工程及评测机制，将概率性输出收敛至业务可接受的"安全区间"。

**2. 从结构化到语义化**

传统工程遵循严格的结构化约定，输入数据必须精确符合预定义的Schema。AI工程则拥抱语义化的柔性交互，系统能够直接理解自然语言、非结构化数据等模糊输入的意图，基于"意图"而非"格式"进行响应，系统边界演变为一层弹性的膜。

**3. 从静态到动态**

传统工程基于预定义流程开发，执行路径依赖硬编码的逻辑判断或规则。AI工程能够基于模型作出决策，系统具备根据当前环境和目标进行推理的能力，无需人工干预地拆解任务、调用工具并响应未知的变化。架构设计核心目标需要从"规则"转向"规划"。

### AI Friendly架构大图

**基础依赖层：**

- 模型管理：依托ideaLab提供的API，可基于OpenAI协议调用各大厂商不同版本的大模型
- 知识管理：依托ideaLab知识库，可将不同来源知识（如钉钉、语雀）进行向量化存储和检索
- 工具管理：ZETTA（HSF团队开发的MCP管理平台，将HSF接口快速转化为MCP Server）+ ideaLab（基于MCP协议实现MCP Client）+ RPA实现Computer Use的Skills

采用Spring AI Alibaba作为开发框架，管理模型、知识、工具等基础依赖，以及上层Agent、意图、会话等能力。

**AI Friendly架构独有的三层模型：**

- **Agent层**：实现不同业务场景下Agent的构建和管理。分两类：具备动态规划解决问题能力的Agent + 具有固定流程编排的Agent。具体实现为BaseAgent（普通ChatBot/AI Workflow）、ReActAgent（ReAct推理范式）、PlanAgent（Plan计划范式）。
- **意图层**：负责对任务的真实目的进行识别和处理，实现从结构化到语义化的转变。需关注"并行意图"、"顺序依赖意图"、"逻辑依赖意图"的处理方式，结合Query改写和扩写实现意图优化。
- **会话层**：重点需要关注多轮会话及长短期记忆能力。记忆的本质就是上下文工程，其重要程度甚至高于模型本身。

**质量和稳定性管理：**

- AI可观测、AI评测、Agent安全——基于AI应用特点，SLA衡量标准与传统架构不同。

### 架构升级的边界

作者强调：**并非所有AI工程都需要向AI Friendly架构演进。** 对于仅需要接入AI Workflow获取结果的系统，将构建好的Agent当作接口使用，只需关注API调用和结果处理即可，无需关注"记忆管理"、"工具管理"、"上下文工程"、"Multi-Agent调度"、"自主规划"、"AI可观测性"、"数据采样与评测"等更深层次的AI能力维度。只有当所面临的业务场景需要涉及到更深层次的AI应用时，才需要对系统架构进行升级。

## 落地：AI驱动的业务系统

### 业务场景

**AI审核（秒杀业务）：**

在秒杀业务"高频迭代、节奏紧凑、供给海量"的环境下，AI审核覆盖商品全生命周期，解决两大核心问题：

- 审核负担重、风险识别滞后 → 基于多模态AI模型实现风险自动分级（自动通过/驳回）
- 在团商品"只管上线、不管表现" → 实时巡检健康度指标，对劣质商品自动预警或下架

**成果：**
- AI审核准确率达到**95.7%**，召回率达到**99.1%**
- 每天审核2-3w报名商品，小二**80%以上**审核效率提升
- 通过微调、MOE等能力优化，可识别未定义的潜在问题

**AI答疑（CogentAI）：**

基于秒杀业务答疑场景，具备自主规划、推理解决问题能力的AI助理。与传统QA问答机器人或RAG问答机器人不同：

- 可以根据问题进行意图识别
- 自主规划问题的解决路径
- 灵活选择工具和知识库使用
- 根据结果动态调整计划

AI问题解决准确率在**98%以上**，带来**80%以上**的效率提升。

### 从ReAct到Multi-Agent

**ReAct范式的实现：**

ReAct (Reasoning + Acting) 的核心逻辑是让大模型在执行任务时，按照 思考(Thought) -> 行动(Action) -> 观察(Observation) 的循环来工作。但ReAct更擅长解决理性类问题，对于主观类问题不能很好地解决，因此通常会结合Plan范式。

**ReAct And Plan范式的结合：**

- Plan产出全局计划，通过沉淀优秀的计划模板来解决可能出现的低质量计划问题
- ReAct来执行细分领域的推理，在垂直领域表现出更好的效果

**Multi-Agent实现（秒杀场景-中心化决策）：**

将答疑分为多个业务域（商品域、订单域、库存域、报名域、补贴域、素材域等），每个域基于ReAct And Plan范式实现具备"计划-推理能力"的Agent，由中心Agent统一做意图识别与任务分发，形成"MOE(混合专家)"形态的Multi-Agent。

### 从Prompt Engineering到Context Engineering

上下文工程的核心：**如何精心挑选、组织和压缩信息，以便在有限的窗口内，让大模型获得回答问题所需的最优知识。**

秒杀AI审核场景下的上下文工程实践：

- **历史审核案例库：** 通过沉淀历史审核的优秀案例并存入向量数据库，对当前审核商品做图片、标题等维度的相似性向量检索，召回最佳案例提供给大模型做参考，**优秀的案例可以为AI审核带来8%左右的准确率提升**
- **混合审核决策：** 通过引入水位有差异的多模型进行多次判断，将投票后的结果给到大模型做参考，结论一致且置信度较高的情况下为AI审核带来**10%以上的准确率提升**

### 从REST-ful到LLM-ful

工具接口的定义应从REST-ful到LLM-ful，即做AI Friendly API和AI Friendly Error。在秒杀AI答疑业务场景中，对原生的商品、订单、报名等接口做了AI Friendly改造：

- **工具原子化改造：** 将接口拆分成适配大模型ReAct推理过程的原子工具
- **工具出入参改造：** 对接口的名称和出入参做拟人化调整，接口名称清晰直接体现用途，出入参仅保留核心参数和字段，尽量使用平铺的KV对来描述
- **工具Error改造：** 预期内的情况提供简短的错误描述，方便大模型做推理决策；预期外的情况提供堆栈信息，方便大模型识别错误原因

### 从评测到AI可观测

**评测链路：** "线上数据采样 → 样本集构建 → 评测（自动、人工） → 优化（工程优化、模型微调） → 线上AB → 指标观测"的正向循环链路。

**AI可观测：** 面对大模型的语义性和不确定性，可观测应关注Agent执行路径、首Token响应时间（TTFT）、Token消耗与成本、TPM、QPM等，必须深入到决策链、上下文等LLM或Agent层面。

## 补充阅读建议

作者推荐的上下文工程进阶技术关键词：知识图谱与结构化（GraphRAG）、动态上下文剪枝（Context Pruning）等。