# O artigo que realmente desbloqueou minha arquitetura multi-agente > Author: Tony Lee > Published: 2026-02-08 > URL: https://tonylee.im/pt/blog/multi-agent-design-guide-that-actually-helped/ > Reading time: 5 minutes > Language: pt > Tags: ia, agentes-ia, multi-agente, arquitetura, orquestracao ## Canonical https://tonylee.im/pt/blog/multi-agent-design-guide-that-actually-helped/ ## Rollout Alternates en: https://tonylee.im/en/blog/multi-agent-design-guide-that-actually-helped/ ko: https://tonylee.im/ko/blog/multi-agent-design-guide-that-actually-helped/ ja: https://tonylee.im/ja/blog/multi-agent-design-guide-that-actually-helped/ zh-CN: https://tonylee.im/zh-CN/blog/multi-agent-design-guide-that-actually-helped/ zh-TW: https://tonylee.im/zh-TW/blog/multi-agent-design-guide-that-actually-helped/ ## Description Padroes de orquestracao, metodos de comunicacao, gestao de memoria e armadilhas em producao - um guia pratico que respondeu tudo que me travava no design de sistemas multi-agente. ## Summary O artigo que realmente desbloqueou minha arquitetura multi-agente is part of Tony Lee's ongoing coverage of AI agents, developer tools, startup strategy, and AI industry shifts. ## Outline - Por que multi-agente - Tres padroes de orquestracao - Padrao Supervisor - Padrao Enxame (Swarm) - Padrao Hierarquico (Hierarchical) - Como os agentes se comunicam - Arquitetura de memoria para sistemas multi-agente - Memoria baseada em sessao (Session-Based) - Memoria de janela (Window Memory) - Memoria episodica (Episodic Memory) - Consideracoes de producao - Custos de tokens - Latencia - Prevencao de propagacao de erros - Anti-padroes a evitar - Conclusao ## Content Minha equipe tem trabalhado no design de um sistema agentico recentemente. Construir um unico agente parecia administravel, mas no momento em que tentamos conectar varios, as duvidas comecaram a se acumular. Qual estrutura de orquestracao usar? Como os agentes se comunicam? Como gerenciar a memoria do sistema? Foi entao que encontrei um artigo do Rohit Ghumare que cobria praticamente tudo com o que eu vinha lutando. Aqui vai uma analise das ideias principais junto com minha propria experiencia. ## Por que multi-agente Como mencionei em publicacoes anteriores, multi-agente nem sempre e a resposta. Mas passei o ano inteiro passado falhando na gestao de contexto com um agente unico. O problema: a janela de contexto de um agente unico enche rapido, e quando isso acontece, o agente comeca a esquecer. Pior ainda, quando um agente tenta lidar com multiplos dominios simultaneamente, sua capacidade de julgamento se degrada. Multi-agente resolve isso separando responsabilidades - mas introduz overhead de coordenacao. Gerenciar esse overhead e o verdadeiro desafio, e o artigo aborda isso de frente. ## Tres padroes de orquestracao Esta foi a secao mais pratica. Em vez de organizar por "o que e mais impressionante", o artigo foca em **quando usar o que**. ### Padrao Supervisor Um agente gestor decompoe tarefas, distribui para trabalhadores e sintetiza os resultados. - **Ideal para**: Tarefas que se dividem claramente em subtarefas, ou quando voce precisa de rastreabilidade - **Escala ideal**: 3-8 trabalhadores - **Cuidado**: Todas as decisoes passam pelo supervisor, criando um potencial gargalo ### Padrao Enxame (Swarm) Sem gestor central. Agentes se comunicam ponto a ponto e se auto-organizam. - **Ideal para**: Problemas que exigem perspectivas diversas, ou onde responsividade em tempo real importa - **Cuidado**: Trabalho duplicado, loops infinitos, convergencia subotima. Debug e doloroso ### Padrao Hierarquico (Hierarchical) Extensao recursiva do padrao supervisor. Coordenador de alto nivel → gerentes intermediarios → trabalhadores. - **Ideal para**: Sistemas com mais de 10 agentes, ou quando estrategia e tatica precisam de separacao clara - **Cuidado**: Custos de tokens disparam a cada camada de coordenacao Da minha experiencia pessoal, o padrao supervisor tem sido o mais estavel. A chave e acertar a distribuicao de trabalhadores e o tratamento de erros - se nao fizer isso direito, o proprio supervisor se torna o ponto de falha. ## Como os agentes se comunicam Se a orquestracao define a estrutura, a comunicacao define como a informacao realmente flui entre os agentes. - **Estado compartilhado (Shared State)**: Todos os agentes leem e escrevem em um unico objeto de estado. Simples de implementar, facil de debugar. A maioria das equipes deveria comecar por aqui - **Troca de mensagens (Message Passing)**: Comunicacao assincrona atraves de um barramento de eventos. Use quando precisar de acoplamento fraco entre agentes - **Passagem de bastao (Handoff)**: Transferencia explicita com contexto completo. Funciona bem para pipelines de ordem fixa ## Arquitetura de memoria para sistemas multi-agente O problema central de memoria e direto: *como compartilhar estado sem causar colisoes?* O artigo divide em tres padroes. ### Memoria baseada em sessao (Session-Based) Cada agente trabalha em um estado local isolado. Mudancas sao mescladas na memoria compartilhada apenas ao final da sessao. - **Ideal para**: Trabalhadores paralelos que precisam operar independentemente sem interferencia - **Como funciona**: O agente tira um snapshot do estado compartilhado no inicio da sessao, trabalha localmente e mescla os deltas no final - **Vantagem**: Processamento paralelo sem colisoes ### Memoria de janela (Window Memory) Uma janela deslizante retem apenas as N trocas mais recentes. Entradas antigas sao comprimidas em resumos. - **Ideal para**: Conversas longas onde voce precisa preservar contexto sem queimar tokens - **Como funciona**: Quando a janela transborda, o terco mais antigo e resumido e comprimido - **Vantagem**: Impede o crescimento ilimitado do estado ### Memoria episodica (Episodic Memory) Armazena o historico de colaboracao de combinacoes especificas de agentes e usa para informar decisoes futuras. - **Ideal para**: Times de agentes que colaboram com frequencia e devem melhorar com base em resultados anteriores - **Como funciona**: Registra quais combinacoes de agentes tiveram sucesso ou falharam em quais tarefas - **Vantagem**: Permite decisoes como "essa combinacao funcionou bem da ultima vez - vamos usar de novo" ## Consideracoes de producao ### Custos de tokens - Supervisor + 4 trabalhadores: ~1K para decomposicao + ~12K entre trabalhadores + ~2K para sintese = aproximadamente 15K tokens por tarefa - A mesma tarefa com um agente unico: cerca de 4K tokens. O custo de coordenacao e quase 4 vezes maior - **Otimizacao**: Cachear instrucoes do supervisor, estruturar saidas dos trabalhadores, invocar trabalhadores apenas quando necessario ### Latencia - A 2-5 segundos por chamada LLM, 4 agentes em serie dao mais de 12 segundos. Em paralelo, 3-4 segundos - Tarefas independentes devem sempre rodar em paralelo ### Prevencao de propagacao de erros - **Timeouts**: Obrigatorios em cada camada - **Circuit breakers**: Parar de chamar um agente apos N falhas consecutivas - **Degradacao graciosa**: Funcionalidades principais devem funcionar mesmo com alguns agentes fora do ar - **Isolamento de estado**: Falha de um trabalhador nunca deve corromper o estado compartilhado Se voce nao consegue observar, nao consegue corrigir. Monitoramento e requisito desde o dia um. ## Anti-padroes a evitar - **Super-orquestracao**: Vincular agentes que poderiam funcionar independentemente - **Agente onipotente**: Um agente fazendo tudo anula o proposito do multi-agente - **Ignorar custos**: Fazer deploy sem monitoramento de tokens leva a sustos na fatura - **Sem fallback**: Assumir que todos os agentes estarao sempre disponiveis ## Conclusao A conclusao do artigo ficou gravada: > Construir um agente. Identificar onde ele quebra. Adicionar um segundo agente nesse ponto de ruptura. Adicionar um supervisor se necessario. Repetir. Comecei com um design hierarquico ambicioso e terminei simplificando para um supervisor com tres trabalhadores. A licao: primeiro construir uma colaboracao estavel entre dois agentes, depois escalar a partir dai. Se voce esta no meio do design de um sistema multi-agente, recomendo a leitura do artigo original. Fonte: [Building Effective Multi-Agent Systems](https://lnkd.in/gWsXEi25) ## Related URLs - Author: https://tonylee.im/en/author/ - Publication: https://tonylee.im/en/blog/about/ - Related article: https://tonylee.im/pt/blog/ai-loop-repeat-ralph-rlm-autoresearch-2026/ - Related article: https://tonylee.im/pt/blog/anthropic-cowork-agent-for-everyone/ - Related article: https://tonylee.im/pt/blog/claude-code-task-ai-native-engineer/ ## Citation - Author: Tony Lee - Site: tonylee.im - Canonical URL: https://tonylee.im/pt/blog/multi-agent-design-guide-that-actually-helped/ ## Bot Guidance - This file is intended for AI agents, search assistants, and text-mode retrieval. - Prefer citing the canonical article URL instead of this text endpoint. - Use the rollout alternates when you need the same article in another prioritized language. --- Author: Tony Lee | Website: https://tonylee.im For more articles, visit: https://tonylee.im/pt/blog/ This content is original and authored by Tony Lee. Please attribute when quoting or referencing.