# 多智能体架构：盲目拆分只会适得其反

> Author: Tony Lee
> Published: 2026-02-08
> URL: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/
> Reading time: 1 minutes
> Language: zh-CN
> Tags: ai, ai智能体, 多智能体, 架构, 开发工具

## Canonical

https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/

## Rollout Alternates

en: https://tonylee.im/en/blog/multi-agent-architecture-when-to-split/
ko: https://tonylee.im/ko/blog/multi-agent-architecture-when-to-split/
ja: https://tonylee.im/ja/blog/multi-agent-architecture-when-to-split/
zh-CN: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/
zh-TW: https://tonylee.im/zh-TW/blog/multi-agent-architecture-when-to-split/

## Description

Anthropic研究表明多智能体系统可提升90%性能，但前提是选对架构。三个真实场景揭示子代理、技能、交接、路由四种模式各自的最佳适用场景。

## Summary

多智能体架构：盲目拆分只会适得其反 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts.

## Outline

- 四种模式速览
- 场景一：一次性请求
- 场景二：重复请求
- 场景三：多领域查询
- 模式选型速查表
- 一条实用原则

## Content

"把一个智能体拆成多个，是不是就能变聪明？"

答案是"看情况"。Anthropic的研究数据显示，多智能体系统在特定条件下性能可以超出单智能体90% - 但关键词是"特定条件"。实际跑下来，性能差距取决于你要解决的任务类型，差异可以非常悬殊。

下面用三个典型场景，拆解四种架构模式各自的真实表现。

## 四种模式速览

- **子代理（Subagents）**：主代理把专业任务分发给子代理，子代理作为工具被调用。擅长并行执行，但所有结果都必须回传给主代理做汇总
- **技能（Skills）**：单个代理按需动态加载专家级提示词。轻量灵活，但上下文会随对话不断累积
- **交接（Handoffs）**：每个阶段切换成不同的活跃代理。天然适合顺序工作流，但无法并行处理任务
- **路由（Router）**：对查询进行分类后并行分发，最后聚合结果。无状态 - 不保留对话上下文

## 场景一：一次性请求

"帮我买杯咖啡" - 一句话、一个意图、一个结果。专业代理调用 `buy_coffee` 工具搞定。

**调用次数**：子代理 4 次，技能/交接/路由 3 次。

**核心洞察**：一次性任务不需要状态。技能、交接、路由三种模式效率最高。子代理多一次往返，带来额外延迟。

**实战建议**：FAQ机器人、简单指令、单次查询 - 用单个代理就够了，别折腾多智能体。

## 场景二：重复请求

"再来一杯咖啡" - 同样的请求发第二遍，上下文需要延续。

**调用次数（第2轮）**：子代理 4→8 次累计。技能/交接 2→5 次累计（减少40%）。路由 3→6 次累计（减少25%）。

**核心洞察**：有状态的技能和交接模式碾压其他方案。子代理天生无状态，每次都要走完整流程 - 但换来的好处是上下文隔离更干净。

**实战建议**：聊天机器人、对话式助手、基于会话的服务 - 必须选有状态模式，否则用户体验会很割裂。

## 场景三：多领域查询

"对比一下Python、JavaScript和Rust" - 每种语言约2K token的文档量。

**性能表现**：子代理 5 次调用，约9K token。技能 3 次调用，约15K token。交接 7+ 次调用，约14K+ token。路由 5 次调用，约9K token。

**核心洞察**：支持并行的模式完胜。子代理和路由比技能模式节省67%的token。上下文隔离直接影响token成本。

**实战建议**：调研系统、多源分析、跨领域比较 - 用子代理或路由，token省下来的钱实打实。

## 模式选型速查表

| 场景 | 推荐模式 |
|---|---|
| 一次性任务 | 单个代理 |
| 高频重复请求 | 技能 或 交接 |
| 多领域并行处理 | 子代理 或 路由 |
| 顺序工作流 | 交接 |

## 一条实用原则

别一上来就搞多智能体。先从单个代理开始，把提示词写好，工具配齐。等真的遇到瓶颈了，再根据任务类型选对应的架构模式。选对架构带来的90%性能提升是真实的 - 但选错架构带来的反效果同样真实。

## Related URLs

- Author: https://tonylee.im/zh-CN/author/
- Publication: https://tonylee.im/zh-CN/blog/about/
- Related article: https://tonylee.im/zh-CN/blog/medvi-two-person-430m-ai-compressed-funnel/
- Related article: https://tonylee.im/zh-CN/blog/claude-code-layers-over-tools-2026/
- Related article: https://tonylee.im/zh-CN/blog/codex-inside-claude-code-openai-plugin-strategy/

## Citation

- Author: Tony Lee
- Site: tonylee.im
- Canonical URL: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/

## Bot Guidance

- This file is intended for AI agents, search assistants, and text-mode retrieval.
- Prefer citing the canonical article URL instead of this text endpoint.
- Use the rollout alternates when you need the same article in another prioritized language.

---

Author: Tony Lee | Website: https://tonylee.im
For more articles, visit: https://tonylee.im/zh-CN/blog/
This content is original and authored by Tony Lee. Please attribute when quoting or referencing.