# 多智能体架构:盲目拆分只会适得其反 > Author: Tony Lee > Published: 2026-02-08 > URL: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/ > Reading time: 1 minutes > Language: zh-CN > Tags: ai, ai智能体, 多智能体, 架构, 开发工具 ## Canonical https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/ ## Rollout Alternates en: https://tonylee.im/en/blog/multi-agent-architecture-when-to-split/ ko: https://tonylee.im/ko/blog/multi-agent-architecture-when-to-split/ ja: https://tonylee.im/ja/blog/multi-agent-architecture-when-to-split/ zh-CN: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/ zh-TW: https://tonylee.im/zh-TW/blog/multi-agent-architecture-when-to-split/ ## Description Anthropic研究表明多智能体系统可提升90%性能,但前提是选对架构。三个真实场景揭示子代理、技能、交接、路由四种模式各自的最佳适用场景。 ## Summary 多智能体架构:盲目拆分只会适得其反 is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - 四种模式速览 - 场景一:一次性请求 - 场景二:重复请求 - 场景三:多领域查询 - 模式选型速查表 - 一条实用原则 ## Content "把一个智能体拆成多个,是不是就能变聪明?" 答案是"看情况"。Anthropic的研究数据显示,多智能体系统在特定条件下性能可以超出单智能体90% - 但关键词是"特定条件"。实际跑下来,性能差距取决于你要解决的任务类型,差异可以非常悬殊。 下面用三个典型场景,拆解四种架构模式各自的真实表现。 ## 四种模式速览 - **子代理(Subagents)**:主代理把专业任务分发给子代理,子代理作为工具被调用。擅长并行执行,但所有结果都必须回传给主代理做汇总 - **技能(Skills)**:单个代理按需动态加载专家级提示词。轻量灵活,但上下文会随对话不断累积 - **交接(Handoffs)**:每个阶段切换成不同的活跃代理。天然适合顺序工作流,但无法并行处理任务 - **路由(Router)**:对查询进行分类后并行分发,最后聚合结果。无状态 - 不保留对话上下文 ## 场景一:一次性请求 "帮我买杯咖啡" - 一句话、一个意图、一个结果。专业代理调用 `buy_coffee` 工具搞定。 **调用次数**:子代理 4 次,技能/交接/路由 3 次。 **核心洞察**:一次性任务不需要状态。技能、交接、路由三种模式效率最高。子代理多一次往返,带来额外延迟。 **实战建议**:FAQ机器人、简单指令、单次查询 - 用单个代理就够了,别折腾多智能体。 ## 场景二:重复请求 "再来一杯咖啡" - 同样的请求发第二遍,上下文需要延续。 **调用次数(第2轮)**:子代理 4→8 次累计。技能/交接 2→5 次累计(减少40%)。路由 3→6 次累计(减少25%)。 **核心洞察**:有状态的技能和交接模式碾压其他方案。子代理天生无状态,每次都要走完整流程 - 但换来的好处是上下文隔离更干净。 **实战建议**:聊天机器人、对话式助手、基于会话的服务 - 必须选有状态模式,否则用户体验会很割裂。 ## 场景三:多领域查询 "对比一下Python、JavaScript和Rust" - 每种语言约2K token的文档量。 **性能表现**:子代理 5 次调用,约9K token。技能 3 次调用,约15K token。交接 7+ 次调用,约14K+ token。路由 5 次调用,约9K token。 **核心洞察**:支持并行的模式完胜。子代理和路由比技能模式节省67%的token。上下文隔离直接影响token成本。 **实战建议**:调研系统、多源分析、跨领域比较 - 用子代理或路由,token省下来的钱实打实。 ## 模式选型速查表 | 场景 | 推荐模式 | |---|---| | 一次性任务 | 单个代理 | | 高频重复请求 | 技能 或 交接 | | 多领域并行处理 | 子代理 或 路由 | | 顺序工作流 | 交接 | ## 一条实用原则 别一上来就搞多智能体。先从单个代理开始,把提示词写好,工具配齐。等真的遇到瓶颈了,再根据任务类型选对应的架构模式。选对架构带来的90%性能提升是真实的 - 但选错架构带来的反效果同样真实。 ## Related URLs - Author: https://tonylee.im/zh-CN/author/ - Publication: https://tonylee.im/zh-CN/blog/about/ - Related article: https://tonylee.im/zh-CN/blog/medvi-two-person-430m-ai-compressed-funnel/ - Related article: https://tonylee.im/zh-CN/blog/claude-code-layers-over-tools-2026/ - Related article: https://tonylee.im/zh-CN/blog/codex-inside-claude-code-openai-plugin-strategy/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/zh-CN/blog/multi-agent-architecture-when-to-split/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/zh-CN/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.