MÓDULO 3.3 · Trilha 3 · Modelo, custo e orquestração

Encadeando subagentes

O maestro não apenas dispara subagentes — ele os encadeia: o resultado de A alimenta B, que alimenta C. Este módulo ensina como projetar, depurar e escalar pipelines sequenciais sem deixar agentes conversando entre si.

⏱ ~25 min 🔗 7 tópicos 💡 Nível intermediário
🎼 MAESTRO coordena a cadeia Agente A pesquisa Agente B rascunho Agente C revisão output ⛔ Agente não chama Agente sempre via maestro Maestro → A → B → C → Resultado

O maestro coordena toda a cadeia. Agentes não se comunicam diretamente — cada um responde apenas ao maestro.

Conteúdo detalhado

O que é

Encadear subagentes significa que o output de A vira o input de B, que por sua vez alimenta C — e o maestro orquestra cada passagem. Não existe conversa direta entre os agentes: a cadeia vive inteiramente no contexto do maestro.

Por que aprender

Separa responsabilidades em etapas claras
Cada agente opera em contexto limpo e focado
Facilita depuração: falhou em B, não em A nem C
Permite reusar etapas em outras cadeias

Conceitos-chave

Input bridge

O maestro extrai o resultado de A e o injeta como contexto no prompt de B.

Cadeia determinística

A→B→C sempre nessa ordem; o maestro não pula etapas sem checar o output anterior.

Ponto de controle

Entre cada etapa o maestro pode validar, transformar ou abortar antes de continuar.

O que é

Skills são instruções carregadas no contexto do maestro — elas guiam o comportamento. Agents são sub-processos com janela própria — eles executam trabalho isolado. Em uma cadeia, a skill define o roteiro; os agents fazem as etapas.

Conceitos-chave

✓ Skill: bom para

  • Definir etapas da cadeia
  • Reutilizar lógica entre projetos
  • Disparar múltiplos subagentes
  • Manter contexto do maestro curto

◎ Agent: bom para

  • Leitura intensiva de arquivos
  • Pesquisa web em profundidade
  • Geração de artefato isolado
  • Tarefa com ferramentas próprias

💡 Dica prática

Use a skill como o maestro da cadeia — ela contém o prompt que lança cada agent em sequência e instrui o maestro a fazer o handoff de outputs entre eles.

Por que aprender

Confundir skill com agent é o erro mais comum ao projetar cadeias. Entender a distinção evita inflar o contexto do maestro com trabalho que deveria viver em janela separada.

O que é

No Claude Code, um subagente não tem permissão de lançar outro subagente diretamente. Toda delegação passa pelo maestro. Isso não é limitação — é design intencional para garantir rastreabilidade, controle de custos e visibilidade do fluxo.

⛔ Padrão proibido

# ❌ NÃO funciona assim
Agent A → lança Agent B internamente
Agent B → lança Agent C internamente

# ✓ Como funciona de fato
Maestro → Agent A → retorna resultado
Maestro → Agent B (com output de A) → retorna resultado
Maestro → Agent C (com output de B) → retorna resultado

Por que aprender

✗ Risco de ignorar

  • • Loops infinitos de delegação
  • • Custos de API sem teto
  • • Rastreabilidade zero
  • • Difícil de depurar

✓ Benefício do modelo

  • • Maestro vê tudo
  • • Custo previsível por etapa
  • • Pode abortar em qualquer ponto
  • • Logs claros por agente

Conceitos-chave

A arquitetura é estrela (maestro no centro), não malha (todos conectados). Cada subagente é uma folha da árvore — nunca um nó intermediário com filhos próprios.

O que é

Cada subagente tem exatamente uma relação: com o maestro que o criou. Ele não conhece outros subagentes, não tem acesso ao contexto deles e não pode influenciá-los. É um especialista contratado para uma única missão — entrega o relatório e encerra.

Conceitos-chave — ciclo de vida

Maestro monta o prompt

Inclui contexto necessário + saída da etapa anterior

Subagente abre janela própria

Contexto zerado — só vê o que o maestro enviou

Executa a tarefa

Pode usar ferramentas, ler arquivos, chamar APIs

Retorna resultado ao maestro

Texto limpo — relatório único, sem conversa

Janela encerra — contexto liberado

Não existe "depois" para o subagente

Por que aprender

Entender a relação 1-para-1 evita tentar "fazer agentes colaborarem diretamente" — o que quebra silenciosamente, sem erro explícito.

O que é

A decisão de sequenciar é do maestro, não dos agentes. O maestro avalia: "B depende do output de A?" Se sim, é cadeia. Se não, pode ser paralelo. Essa decisão determina latência vs. custo.

Conceitos-chave

🔗 Encadear quando:

  • B usa output de A
  • Ordem importa para qualidade
  • Precisão > velocidade
  • Revisão incremental do resultado

⚡ Paralelizar quando:

  • Tarefas são independentes
  • Velocidade > precisão
  • Fan-out de coleta de dados
  • N versões para comparar depois

💡 Regra do polegar

Se você consegue descrever a tarefa como "pesquise e depois redija e depois revise", é uma cadeia. Se é "pesquise e ao mesmo tempo colete exemplos", é paralelo.

Por que aprender

Encadear quando poderia paralelizar desperdiça latência. Paralelizar quando há dependência produz resultados incorretos. Saber diferenciar é a habilidade central de orquestração.

O que é

Uma skill pode conter instruções que orientam o maestro a lançar subagentes em sequência. A skill não executa nada — ela é carregada no contexto do maestro e guia cada chamada ao Agent tool.

Conceitos-chave

1
Skill define o roteiro

Lista as etapas, o que cada agente recebe e o que deve retornar.

2
Maestro executa o roteiro

Lança Agent A, captura output, monta prompt para Agent B, e assim por diante.

3
Skill é reutilizável

O mesmo roteiro pode ser invocado em qualquer projeto sem reescrever.

Por que aprender

Colocar a lógica da cadeia numa skill torna o projeto auditável, versionável e portável. Sem esse padrão, a orquestração fica espalhada em prompts ad-hoc impossíveis de manter.

O que é

Uma cadeia de 3-5 agentes funciona bem com maestro humano. Acima disso, os outputs acumulados inflam o contexto e aumentam o custo de cada etapa. O passo natural é migrar para um workflow: ferramentas como n8n, LangGraph ou scripts Python que coordenam as chamadas de agente fora do contexto do LLM.

Conceitos-chave — sinais de que é hora de escalar

⚠ Sinais de alerta

  • ! Cadeia com >6 etapas
  • ! Output de A cabe mal no prompt de B
  • ! Precisa de retry por etapa
  • ! Custo total imprevisível

✓ Solução: workflow

  • n8n coordena por JSON/HTTP
  • Estado persiste entre etapas
  • Retry sem re-executar tudo
  • Logs por node, não por token

Por que aprender

Saber quando parar de usar o maestro conversacional e migrar para workflow é a diferença entre um pipeline que funciona em produção e um que colapsa na terceira semana.

Exemplo real

Skill que orquestra subagentes em cadeia pesquisa → rascunho → revisão

.claude/skills/pipeline-pesquisa.md
# pipeline-pesquisa

Orquestra 3 subagentes em cadeia para produzir um artigo pesquisado e revisado.

## Quando usar
Quando o usuário pedir "pesquise X e escreva um artigo" com qualidade alta.

## Etapas

### ETAPA 1 — Pesquisa (web-research-assistant)
Lançar um subagente `web-research-assistant` com o prompt:

```
Pesquise profundamente sobre: {TEMA}
Retorne:
- 5 fatos verificados com fonte
- 3 perspectivas contraditórias
- 1 dado quantitativo recente
Formato: markdown estruturado, máx. 400 palavras.
```

Capture o output como `PESQUISA`.

### ETAPA 2 — Rascunho (general-purpose)
Com `PESQUISA` em mãos, lançar `general-purpose`:

```
Com base nas pesquisas abaixo, escreva um artigo de 600 palavras sobre {TEMA}.
Tom: educativo, direto, sem jargão.
Use os fatos como base; cite as perspectivas contraditórias.

--- PESQUISA ---
{PESQUISA}
```

Capture como `RASCUNHO`.

### ETAPA 3 — Revisão (general-purpose)
Lançar `general-purpose` com o rascunho:

```
Revise o artigo abaixo para:
1. Precisão factual (corrija erros vs. pesquisa fornecida)
2. Clareza e fluidez
3. Tamanho: mantenha 500-650 palavras
Retorne APENAS o artigo final, sem comentários.

--- RASCUNHO ---
{RASCUNHO}
--- PESQUISA ORIGINAL ---
{PESQUISA}
```

## Output
Retorne ao usuário o artigo revisado com o cabeçalho:
`## Artigo: {TEMA} (pesquisado + revisado)`

## Regras
- Maestro NÃO encurta as etapas
- Se ETAPA 1 falhar, abortar com mensagem clara
- Agentes não se comunicam diretamente

Etapa 1

web-research-assistant coleta fatos com fontes

Etapa 2

general-purpose transforma pesquisa em rascunho

Etapa 3

general-purpose revisa e entrega o artigo final

Prompts prontos

Copie e adapte — cada prompt dispara uma cadeia de subagentes

Cadeia pesquisa → rascunho → revisão
Use a skill pipeline-pesquisa. Tema: "impacto dos LLMs no mercado de trabalho".
Encadeie: [1] web-research-assistant para coletar 5 fatos recentes com fonte,
[2] general-purpose para rascunhar artigo de 600 palavras,
[3] general-purpose para revisar precisão e fluência.
Retorne apenas o artigo final.
Cadeia análise de código → refactor → teste
Encadeie 3 subagentes:
1. Explore para mapear todos os arquivos em src/ e listar funções com mais de 50 linhas
2. general-purpose para refatorar as 3 maiores funções encontradas (recebe output do 1)
3. general-purpose para escrever testes unitários das funções refatoradas (recebe output do 2)
Cada agente recebe apenas o output do anterior — não o contexto todo.
Cadeia coleta → síntese → publicação
Monte uma cadeia de 3 subagentes para processar o relatório em /docs/relatorio.pdf:
[A] web-research-assistant: pesquise o contexto de mercado do tema do relatório
[B] general-purpose: sintetize relatório + pesquisa num resumo executivo de 1 página
[C] general-purpose: formate o resumo em HTML compatível com o design system AutomationsAI
Passe o output de cada etapa como contexto para a próxima.

Tela simulada

Maestro orquestrando uma cadeia de 3 subagentes no terminal

claude — pipeline-pesquisa $ /pipeline-pesquisa "impacto dos LLMs no mercado" ▶ Etapa 1 — web-research-assistant prompt: "Pesquise profundamente: impacto dos LLMs..." subagent_type: web-research-assistant | context: isolado ✓ concluído → 412 tokens output └─ output capturado → injetado em Etapa 2 ▶ Etapa 2 — general-purpose (rascunho) prompt: "Com base nas pesquisas abaixo, escreva..." contexto: output Etapa 1 incluído | janela própria ✓ concluído → 638 palavras └─ rascunho capturado → injetado em Etapa 3 ▶ Etapa 3 — general-purpose (revisão) prompt: "Revise para precisão factual e clareza..." contexto: rascunho + pesquisa original | janela própria ✓ concluído → 601 palavras ✓ Pipeline concluído: 3 etapas | ~2.8k tokens total ## Artigo: impacto dos LLMs no mercado de trabalho (pesquisado + revisado) Os grandes modelos de linguagem estão redefinindo...
🎯

Exercício

Modele uma cadeia de 3 etapas para um problema real seu

Tarefa

  1. 1. Escolha um problema real do seu trabalho que envolva 3 etapas distintas (ex.: coletar dados → analisar → redigir relatório).
  2. 2. Para cada etapa, defina: nome do subagente, input (o que recebe do maestro) e output (o que entrega de volta).
  3. 3. Escreva o "ponto de controle" do maestro entre cada etapa: o que ele valida antes de avançar?
  4. 4. Justifique: por que cada etapa precisa ser sequencial e não paralela?

Critério de verificação

✓ Cadeia bem modelada

  • Cada agente recebe apenas o necessário
  • Nenhum agente chama outro diretamente
  • Maestro tem ponto de controle explícito
  • Justificativa de sequência clara

✗ Sinais de problema

  • "Agente A pergunta ao Agente B"
  • Input de B não usa output de A
  • Maestro não valida entre etapas
  • Etapas poderiam ser paralelas

💡 Dica de auto-avaliação

Passe seu modelo pelo teste do "e se A falhar?": se o maestro consegue detectar e abortar antes de lançar B, a cadeia está bem desenhada. Se não, falta um ponto de controle.

Anterior: Módulo 3.2 Próximo: Módulo 3.4