从吃面到 Multi-Agent 协作：打造高效智能体系统的秘诀

超級の新人

Announcement

私のブログにご訪問いただき、ありがとうございます！

Learn More

标签

4066 字

20 分钟

从吃面到 Multi-Agent 协作：打造高效智能体系统的秘诀

2025-11-18

技术

AI

/

Multi-Agent

/

转载

随着大语言模型（LLM）的能力突飞猛进，智能体（Agent）已成为将 AI 技术转化为实际业务价值的重要桥梁。然而，面对跨领域、长周期或专业性强的复杂任务，单一智能体的局限性逐渐显现，比如上下文信息过多、记忆不够聚焦、决策不够精准等。为了解决这些问题，分布式多智能体（Multi-Agent）系统应运而生，展现出更强大的问题解决能力和更高的准确性。

本文将深入探讨如何通过 多智能体架构 和 上下文工程 打造一个高效、可扩展的 AI 智能体系统，并结合一个通俗易懂的案例，分享一套实用的实践方案。

1 什么是多智能体系统？#

面对日益复杂的任务，由多个具备自主决策和交互能力的 Agent 组成的分布式多智能体（Multi-Agent）系统，相比于单打独斗的 Agent，展现出更强大的问题解决能力和更高的准确率。

1.1 多智能体架构#

理解 Multi-Agent 系统，首先要明确其基本构成单元。

智能体：一个 Agent 的基本构成可以概括为 Agent = LLM + 观察 (Observation) + 思考 (Thought) + 行动 (Action) + 记忆 (Memory)。它能够感知环境，通过思考进行决策，并利用工具执行动作。

观察：感知外部环境，比如用户输入或API返回的数据。
思考：基于大语言模型进行推理和决策。
行动：调用工具（如查询API、执行代码）完成具体任务。
记忆：存储任务过程中的关键信息，支持后续决策。

多智能体系统：它是在单个 Agent 基础上的扩展，其定义为 Multi-Agent = 智能体 + 环境 + 标准操作流程 (SOP) + 通信 + 经济模型。该系统的核心特征包括：

自主性 (Autonomy)：每个 Agent 都具备独立的决策能力，不受其他 Agent 的直接控制。
协作性 (Collaboration)：Agent 之间通过通信、协商或竞争来解决冲突，共同完成任务。例如，MetaGPT 框架通过为不同 Agent（如产品经理、工程师）分配角色和精心编排的 SOP 来模拟软件公司的全流程协作。
分布性 (Distribution)：系统将复杂任务拆解为子任务，交由不同的 Agent 并行处理，从而降低整体复杂度。

1.2 单 Agent vs. 多 Agent#

在简单场景下，单一智能体开发简单、成本低，适合快速落地。但随着任务复杂度的提升，单一智能体的短板暴露无遗：

场景	单一智能体	多智能体
跨领域支持	修改原有智能体，成本高	新增智能体即可支持
长周期任务	上下文截断，信息丢失	智能体轮替，避免信息超限
工具复用	工具强耦合，难以复用	可共享工具库

多 Agent 架构的核心优势：

更专注的上下文：通过意图识别和任务拆解，每个智能体只关注自己领域的上下文，有效解决了长周期任务中的信息丢失问题。
更灵活的扩展：面对新功能，只需新增或集成新的 Agent，无需重构系统。
更高的准确率：多智能体协作在复杂任务中的表现优于单一智能体。

2 如何设计多智能体架构？#

多智能体系统的设计就像搭积木，核心在于选择合适的架构方式和协作模式。

2.1 架构范式#

在构建多智能体系统时，选择正确的架构范式是决定其能力上限和扩展性的关键第一步。这通常涉及到两个层面的核心决策：一是关于单个 Agent 内部如何执行任务的工作流范式，二是关于多个 Agent 之间如何协同工作的协作模式。

工作流：动态 vs 静态

静态工作流：以 Dify 等平台为代表，其工作流依赖于在画布中预先连接好的工具节点，这种静态编排模式难以处理真实任务中的突发状况和未知噪声。
动态工作流（ReAct）：ReAct 通过”推理-行动-观察(Reasoning-Action-Observation)“的动态循环，赋予 Agent 动态决策的能力。例如，当 Agent 发现所需接口无法查询时，它可以自主决策并向用户收集补充信息，而非像静态工作流那样需要人工干预调整。ReAct 支持按需调用工具，更适合对准确性要求高的代码生成、数据分析等复杂场景。

协作模式：分布式 vs. 统一型

统一型：以 Manus 为例，其核心依赖一个中央调度器（如 ToDoList）进行任务分发。在处理跨领域任务时，所有上下文信息都汇集于此，上下文长度极易成为瓶颈。尽管其通过虚拟文件系统等方式缓解了限制，但 Agent 往往**“只知记忆名而不知其内容”**，在需要深度专业知识的场景下，容易缺乏准确的判断语境。
分布式：分布式架构通过意图识别和任务拆解，将不同任务分配给独立的、职责明确的专业 Agent。每个 Agent 只需关注自己领域的上下文，从根本上解决了统一型 Agent 的上下文瓶颈问题，并带来了卓越的系统扩展能力。

结论：基于 ReAct 范式的分布式多智能体架构是目前较为先进且实用的方案。

2.2 一个可行的 Multi-Agent 架构实例#

2025 年初 MCP 出来后，Multi-Agent 之间的协作范式之一，就是 sub-agent 伪装成一个 MCP Server 供 Main Agent 调用。以一个常见需求”今天中午12点去中关村吃面”为例，设计一套基于 Spring AI Alibaba（SAA）的多智能体系统，展示其工作原理。

在早期实践中，一种常见的协作范式是让子 Agent 伪装成 MCP Server，供主 Agent 调用。

主 Agent (MainAgent，Orchestrator)：负责接收用户需求，拆分任务并协调子智能体。
子 Agents (Sub-agents)：如饭馆 Agent、天气 Agent、公交 Agent，各自负责一个垂直领域，并向 Nacos MCP Server 注册自己，伪装成一个 MCP Server，成为 Main Agent 的一个 Tool。
服务注册中心（Nacos）：子智能体注册服务，主智能体通过 Nacos 动态发现并调用它们。

其工作流程如下：

服务注册：子智能体（如饭馆、天气、公交）向 Nacos 注册服务，声明自己的能力。
任务分发：主智能体接收用户请求，解析直接意图（如”中关村""吃面”）以及隐藏意图，向 Nacos 查询能够处理”饭馆”、“天气”和”公交”等任务的子 Agent，然后通过 MCP 协议直接调用它们。
并行执行：
- 饭馆智能体调用地图API，推荐附近面馆。
- 天气智能体查询中午天气情况。
- 公交智能体查找去中关村的公交路线。
结果汇总：主智能体整合子智能体的结果，返回给用户：“推荐XX面馆，天气晴朗，建议乘坐XX路公交。“

2.3 从实例中抽象 Multi-Agent 核心组件#

从这个实例中，我们可以抽象出一个典型的分布式 Multi-Agent 系统的核心逻辑组件：

调度中枢 (Orchestrator)：负责顶级意图识别、任务拆分和向专业 Agent 的动态路由决策。
专业 Agent 池 (Agent Pool)：包含多个各司其职的专业 Agent（如网页开发、数据分析），每个 Agent 独立运行自己的 ReAct 循环。
全局 Checkpointer / MemorySaver：作为跨 Agent 的持久化/可查询记忆层（支持短期与长期记忆），支持共享上下文的读写与查询。
工具层 (Tools / Executor)：提供 Agent 执行动作所需的各种能力，如 API 调用、代码沙盒、编译环境等。
观测与评估层 (Observability & Evaluation)：负责记录日志、监控指标，并对 Agent 的行为和结果进行评估（Accuracy、Tool-use correctness、Latency、Cost）。

2.4 Multi-Agent 的挑战#

Multi-Agent 一个核心挑战浮出水面：如何让多个 Agent 高效协作、共享信息并维持长期记忆？这就依赖于 上下文工程（Context Engineering，下文简称 CE）。

Multi-Agent 系统 CE 原则：

分治上下文：把任务拆成”语义上独立”的子任务，每个 Agent 只维护与其职责相关的上下文；
最小化跨 Agent 共享：只共享”必要且值昂贵”的语义（例如会话关键事实、用户偏好、任务状态），其余信息局部化；
动态路由与可插拔性：Agent 能按需被调度、替换、扩展，无需重构主流程；
可观测与可评估：每个 Agent 的决策路径、工具调用与上下文演进要可审计与可打分。

3 上下文工程：让智能体更聪明#

上下文是智能体的”灵魂”，决定了决策的质量和系统的效率。上下文工程（Context Engineering）通过科学管理上下文，为大模型提供了更精准、更恰当的 context，让多智能体系统更高效。

3.1 核心价值#

在一个 Agent 的工作循环中，模型根据当前上下文选择一个动作，在环境中执行后产生观察结果，随之动作和观察结果被附加到上下文中，成为下一次迭代的输入，直至任务完成。这个过程的质量高度依赖于上下文的构建与管理。

3.2 上下文分类#

上下文可以分为三类，需要不同的管理策略：

临时上下文 (Ephemeral Context)：当前会话内的短期状态，如任务的中间产物，通常存储在内存或短期 KV（如 Redis）中，并设置生命周期（TTL），例如一小时后自动销毁以控制成本。
跨 Agent 记忆 (Shared Memory)：需要在不同 Agent 间继承的重要事实，如用户偏好、任务元数据等，应存储在全局共享的 Checkpointer 中。
长期知识库 (Persistent Knowledge)：如文档、FAQ 等，适合长期存储，并通过 RAG 等检索方式供 Agent 使用。

3.3 分布式环境下的上下文管理#

为了支持多轮对话和跨集群部署，用 LangGraph 提供的 MemorySaver 实现上下文管理，实现会话记忆共享：

工作流：Redis 作为核心的 KV 存储，负责记忆的持久化存储和读取。checkpointer 则基于会话ID维护状态，负责上下文的加载和内存管理。调度中枢（Main-Agent）和专业 Agent 通过 checkpointer 进行记忆的存储和读取，形成闭环。
时效性管理：由于资源限制，临时上下文必须有生命周期，如只支持动态存储一小时，若一小时内没有新的消息，相关的会话将被销毁。

3.4 上下文存储与一致性#

在分布式环境中，可以用 Redis Cluster 作为 Checkpointer 的后端，支持跨 Agent 集群的会话记忆共享与读写：

写入采用 append-only 或乐观并发控制（CAS），避免频繁冲突；
对于跨机房高频访问，采用本地缓存 + 背景同步（cache invalidation）策略；
对写入进行分级：强一致（关键状态）与最终一致（普通记忆），根据业务重要性选择。

3.5 检索与压缩（token 管理）#

策略：长期记忆用检索（RAG），短期上下文用完整回放；对长文本采用分段索引 + 摘要压缩，以及动态上下文合成（selective concatenation）。

实现建议：

在 Checkpointer 中维护”重要性分数”，为检索时排序；
定期对会话进行自动摘要 / 记忆压缩（把低价值的长聊天压缩成要点），以控制 token 成本。

3.6 Multi-Agent 架构下的上下文共享机制#

为了让不同的 Agent 能够协同工作，必须建立一套高效的上下文共享机制。一个可行的实现方式如下：

全局 Checkpointer：平台支持一个全局可读的 checkpointer，用于存储跨 Agent 共享的信息，实现不同 Agent 之间的记忆共享。
记忆继承：各 Agent 会将执行过程中产生的重要记忆存储到这个全局空间。每个 Agent 在初始化时，都会加载全局 MemorySaver 里的记忆，从而实现重要上下文的继承。

可以将跨 Agent 共享放在全局 Checkpointer/MemorySaver 中实现，并对临时上下文做时限（如 1 小时）以控制资源消耗。

3.7 语义合约（上下文协议）#

定义 Agent-to-Agent 的最小语义合约（schema），例如：{session_id, fact_type, fact_value, provenance, ttl}，确保不同 Agent 读写时语义一致。

4 Agent 的设计、运维与风险管理#

在构建和部署智能体系统时，其设计、运维和风险管理是确保其在实际环境中稳定运行的关键考量。

4.1 Agent 设计与运行时规范#

在 Agent 的设计和运行时规范层面，有规范如下：

ReAct + 反思机制：每个 Agent 内部使用 ReAct 循环。在任务开始、调用工具前后、状态变更等关键节点，强制调用 sequentialThinking 等工具进行规划、决策与反思，确保 Agent 的每一步行动都经过深思熟虑。
动态路由与失败降级：调度中枢应基于意图相似度、Agent 可用性和历史成功率进行动态路由。当任务失败时，应有明确的降级策略，如重试其他 Agent、转为人工接管或向用户请求更明确的输入。
安全与合规：所有企业级系统都必须建立在坚实的安全与合规基础上。在写入共享记忆前，必须进行隐私数据过滤和脱敏处理。对于敏感字段，应采用加密或严格限制生命周期等措施来保障数据安全。

4.2 系统运维与评估#

要衡量 Multi-Agent 系统的效能，需要建立一套持续的评估体系，关注以下关键指标：

任务成功率 (End-to-end)
工具调用正确率 (Tool-call correctness)：工具调用是否按预期返回
上下文命中率 (Upstream context hit rate)：检索到的记忆是否有助于决策
平均 Token 成本与任务成本
响应时延与可用性

同时引入持续评估（自动化评估集）对 Agent 输出进行精度/合规/简洁性打分。

4.3 常见风险与缓解策略#

上下文幻觉 (Hallucination)：通过工具结果交叉校验、Observation 驳回机制和证据回溯来缓解。
跨 Agent 冲突：通过严格的语义合约和明确的优先级/仲裁策略来解决。
存储成本爆炸：实施严格的 TTL 策略和记忆摘要/压缩机制是必要的工程妥协。
扩展痛点：在系统设计之初就应规划好 Agent 的注册、版本管理和能力声明（capability manifest）机制，以支持未来的平滑扩展。

5 结论#

多智能体架构与上下文工程是构建高效 AI 系统的两大支柱：

多智能体架构：通过职责分离和分布式协作，降低任务复杂性，提升扩展性，定义了”如何协作”的骨架。
上下文工程：通过科学管理上下文，保证决策质量与长期记忆价值，是流淌于骨架中的”血液”。

从”吃面”案例到分布式架构的演进，我们看到多智能体系统通过技术迭代，从 MCP 到 A2A 的架构演进，再到集成了监控、权限与 Agent 间协作的完整设计，通过技术方案的迭代，构建可靠、可扩展、可运维的 AI Agent 系统，AI 智能体系统将在更多场景中发挥价值，为复杂任务提供更智能的解决方案。

作者：于雨来源：dubbogo社区 发布时间：2025年8月25日

如果这篇文章对你有帮助，欢迎分享给更多人！

从吃面到 Multi-Agent 协作：打造高效智能体系统的秘诀

https://chaojixin.ren/posts/从吃面到multi-agent协作文章转载/

作者

于雨

发布于

2025-11-18

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

NSSCTF平台上部分RE方向刷题的wp

周报2025-11-04

人よ、幸福に生きよ

1 什么是多智能体系统？#

1.1 多智能体架构#

1.2 单 Agent vs. 多 Agent#

2 如何设计多智能体架构？#

2.1 架构范式#

2.2 一个可行的 Multi-Agent 架构实例#

2.3 从实例中抽象 Multi-Agent 核心组件#

2.4 Multi-Agent 的挑战#

3 上下文工程：让智能体更聪明#

3.1 核心价值#

3.2 上下文分类#

3.3 分布式环境下的上下文管理#

3.4 上下文存储与一致性#

3.5 检索与压缩（token 管理）#

3.6 Multi-Agent 架构下的上下文共享机制#

3.7 语义合约（上下文协议）#

4 Agent 的设计、运维与风险管理#

4.1 Agent 设计与运行时规范#

4.2 系统运维与评估#

4.3 常见风险与缓解策略#

5 结论#