MÓDULO 3.5 · Trilha 3 · Modelo, custo e orquestração

⚙️ Workflows dinâmicos

Um workflow dispara dezenas ou centenas de subagentes em paralelo — cada um com sua própria sessão, seu próprio contexto, seu próprio custo. Aprender quando essa potência se justifica (e quando destrói o orçamento) é o que separa quem orquestra com precisão de quem apenas chama agentes aleatoriamente.

7
Tópicos
~30
Minutos
Avançado
Nível
Custo
Foco

Imagine que você precisa processar 210 arquivos de uma só vez: revisar código, extrair metadados, gerar relatórios. Fazer isso em sequência levaria horas. Com um workflow dinâmico, o orquestrador dispara um subagente por arquivo — todos ao mesmo tempo, cada um na sua janela — e você recebe o consolidado em minutos. O desenho abaixo é o que acontece por baixo.

Orquestrador Task tool 1 sessão Subagente 1 arquivo_001.py Subagente 2 arquivo_002.py Subagente N arquivo_210.py ··· + 41 extras concorrentes Resultado consolidado N relatórios → 1 até 210 subagentes simultâneos

Conteúdo detalhado

1

🌐 O que é um workflow dinâmico

No Claude Code, um workflow dinâmico é uma orquestração onde o número de subagentes não está fixo no prompt — ele é determinado em tempo de execução pelo orquestrador. O maestro recebe a lista de itens, decide quantos agentes vai precisar e os dispara todos via Task tool, um para cada item.

O que é

Uma estrutura de execução onde o orquestrador gera dinamicamente N tarefas paralelas com base no input — seja uma lista de arquivos, uma lista de URLs, uma lista de capítulos ou qualquer coleção iterável. Cada item vira um subagente independente.

Por que aprender

Entender workflows dinâmicos é o que permite executar jobs que seriam impossíveis em sequência dentro de uma única sessão. É a diferença entre processar 5 arquivos e processar 200 — com o mesmo esforço de prompt. Sem esse conhecimento, você subutiliza a ferramenta mais poderosa da plataforma.

Conceitos-chave

⚙️
Task tool
dispara agente
🔀
Fan-out
1 → N
🔗
Dinâmico
N = f(input)
📊
Consolidação
N → 1
2

🚀 O gatilho: de "workflow" a ultracode

A palavra mágica mudou. Durante muito tempo, o prompt-padrão para ativar orquestração massiva era workflow. Com as versões mais recentes do Claude Code, o gatilho recomendado virou ultracode. O comportamento é o mesmo — mas o token mudou. Saber isso evita frustração quando você segue tutoriais antigos.

O que é

ultracode é uma instrução ao orquestrador para usar a máxima capacidade paralela disponível. Quando você inclui esse token no prompt, o maestro sabe que pode (e deve) disparar o maior número de subagentes necessário, sem contenção artificial.

Por que aprender

O token certo muda a estratégia de execução do modelo. Sem ele, o Claude pode optar por processar em sequência ou com menos agentes. Com ele, você declara explicitamente: "use orquestração massiva aqui". É o interruptor entre modo normal e modo de escala total.

Conceitos-chave

✅ Novo token
ultracode
ativa orquestração máxima
⚠️ Token antigo
workflow
ainda funciona em versões antigas
3

📈 Escala: dezenas e centenas de agentes

O Claude Code foi projetado para suportar orquestração em escala real. Não estamos falando de 3 a 5 subagentes — estamos falando de dezenas a centenas rodando em paralelo. Cada subagente tem sua própria sessão, usa tokens independentes, e pode ser um modelo diferente do orquestrador.

O que é

A plataforma não impõe limite rígido de subagentes por workflow. O limite prático é a sua conta de API (rate limits), o orçamento disponível e a capacidade de consolidar os resultados sem explodir o contexto do orquestrador. Jobs com 40+ agentes simultâneos são comuns em cenários de auditoria massiva.

Por que aprender

Saber a escala possível muda sua arquitetura de prompt. Se você não sabe que pode disparar 100 agentes, vai continuar projetando soluções sequenciais para problemas paralelizáveis. Conhecer o teto real permite projetar workflows corretos desde o início.

Conceitos-chave

2–5 agentesuso comum, baixo custo
10–40 agentesauditoria de codebase médio
41–100 agentesworkflows pesados, custo elevado
100–210+ agentescasos extremos, planejar orçamento
4

💸 Custo e limite de sessão

Workflows dinâmicos são caros por design. Cada subagente consome tokens independentemente — e o custo de um workflow com 200 agentes é aproximadamente 200× o custo de um único agente rodando a mesma tarefa. Além do custo financeiro, há o limite de sessão: o orquestrador ainda precisa de contexto suficiente para ler todos os relatórios de volta.

O que é

O custo de um workflow é a soma dos tokens de cada subagente mais os tokens do orquestrador ao consolidar. O orquestrador precisa de contexto para receber os relatórios — se cada agente devolver 500 tokens e você tiver 200 agentes, isso são 100 000 tokens apenas nos relatórios, antes de qualquer análise.

Por que aprender

Planejar o custo antes de executar evita surpresas. Um workflow mal dimensionado pode consumir o orçamento mensal inteiro em minutos. Entender a estrutura de custo permite decidir: vale usar Haiku nos subagentes? Vale pedir resumos ultra-curtos? Vale subdividir em lotes menores?

Conceitos-chave

✅ Boas práticas de custo
  • • Usar Haiku nos subagentes quando possível
  • • Pedir resumo curto (não dump bruto)
  • • Processar em lotes de 20–40 por vez
  • • Testar com 5 itens antes de escalar
❌ Armadilhas de custo
  • • Pedir output longo de cada agente
  • • Usar Opus em todos os subagentes
  • • Disparar 200 agentes sem testar antes
  • • Ignorar o custo de consolidação
5

🔬 O caso real: 41 e 210 subagentes

Dois números viraram referência na comunidade Claude Code para workflows em escala real: 41 subagentes (caso de auditoria de codebase) e 210 subagentes (processamento de documento massivo). Esses não são limites da ferramenta — são casos documentados que provam que a arquitetura suporta escala sem falhas estruturais.

O que é

41
Auditoria de codebase

Cada subagente analisou um módulo diferente. O orquestrador consolidou os achados em um único relatório de segurança.

210
Processamento de documento

Cada subagente processou uma seção de um documento grande. Fan-out completo em uma única chamada ao orquestrador.

Por que aprender

Esses casos provam que workflows dinâmicos não são teoria — são prática. Eles também definem uma régua de escala: se seu problema tem menos de 40 itens paralelos, você está bem dentro do conforto. Se tem mais de 100, precisa de planejamento de custo explícito.

Conceitos-chave

41
caso de referência
210
escala máxima doc.
limite = orçamento
6

✅ Quando vale usar workflows dinâmicos

Não é todo job paralelo que precisa de workflow dinâmico. A regra prática: se o processamento de cada item é independente, a lista tem mais de 10 itens e o contexto explodiria processando em sequência — aí workflows dinâmicos são a escolha certa.

O que é

O critério de decisão tem três dimensões: independência (os itens não dependem uns dos outros), volume (lista longa o suficiente para justificar overhead de orquestração) e risco de contexto (processar tudo no maestro explodiria a janela de contexto).

Por que aprender

O erro mais comum é usar workflow para tudo — incluindo jobs pequenos onde a sequência seria mais eficiente e mais barata. Aprender o critério correto evita desperdício de tokens e complexidade desnecessária.

Conceitos-chave

✅ Use workflow dinâmico
  • • Revisar 20+ arquivos de código
  • • Processar seções de documento longo
  • • Gerar relatório para N repositórios
  • • Analisar N contratos em paralelo
  • • Traduzir N páginas simultaneamente
❌ Não use workflow
  • • Job com 2–3 itens (sequência basta)
  • • Itens que dependem uns dos outros
  • • Quando custo supera o ganho de tempo
  • • Tarefas criativas que precisam de coerência
  • • Pipeline com estado compartilhado
7

⚠️ Cuidados: o que pode dar errado

Orquestração massiva traz riscos que não existem em jobs simples. Os três mais críticos: explosão de contexto no consolidador, custo inesperado e falhas silenciosas — um subagente que retorna vazio sem avisar.

O que é

Cada risco tem uma causa específica: o orquestrador recebe relatórios grandes demais (explosão de contexto); o modelo não tem visão prévia do custo total antes de executar (surpresa financeira); um subagente trava ou retorna erro silencioso, contaminando o consolidado sem que o orquestrador perceba.

Por que aprender

Workflows que falham silenciosamente são os mais perigosos — o orquestrador entrega um relatório incompleto sem sinalizar que 3 dos 40 subagentes não retornaram nada. Saber o risco permite adicionar instruções explícitas de validação no prompt do orquestrador.

Conceitos-chave: mitigações

01
Instrua output curto
Peça resumo de 3–5 bullets por subagente, não dump completo
02
Teste com lote pequeno
Rode com 5 itens primeiro, valide saída, depois escale
03
Valide no consolidador
Instrua o orquestrador a reportar quantos agentes retornaram vazio
04
Calcule antes de executar
Estime: N × custo-médio-por-agente × tokens-de-consolidação
📄

Exemplo conceitual

Abaixo, o padrão mental de um workflow para processar 15 capítulos de um livro técnico em paralelo. Note como o orquestrador não precisa ler os 15 capítulos — cada agente lê o seu, e devolve apenas o essencial.

Estrutura mental do workflow (conceitual) não é código real
ORQUESTRADOR recebe: lista de 15 capítulos

PARA CADA capítulo em paralelo (ultracode):
  SUBAGENTE recebe: "Leia capitulo_X.md e me traga:
    1. Tese central (1 frase)
    2. Principais conceitos (3 bullets)
    3. Pontos confusos para revisão (máx 2)
    Resposta: máx 100 tokens."

ORQUESTRADOR consolida: 15 resumos → relatório final
  → identifica capítulos com mais pontos confusos
  → sugere ordem de revisão prioritária

Chave do design: cada subagente retorna máximo 100 tokens. Com 15 agentes, o orquestrador recebe ~1 500 tokens de input — gerenciável. Sem esse limite, 15 capítulos longos poderiam devolver 50 000 tokens e explodir o contexto.

⌨️

Prompts prontos (copie e cole)

Três prompts para ativar workflows dinâmicos com controle de custo. Em todos, repare no padrão: declare o volume, limite o output de cada agente e peça validação no consolidado.

Prompt 1 — workflow de auditoria de arquivos com controle de custo
Use ultracode para auditar os arquivos em src/.
Para cada arquivo, abra um subagente com Haiku.
Cada subagente deve retornar APENAS:
- Arquivo: nome
- Problemas: lista de até 3 items
- Severidade: baixa/média/alta
Máximo 80 tokens por resposta.
Ao final, consolide quantos arquivos retornaram
vazio e liste os de severidade alta primeiro.
Prompt 2 — workflow com ressalva de custo explícita pede estimativa antes de executar
Tenho 80 contratos em /docs/contratos/.
ANTES de rodar, estime quantos subagentes serão
criados e o custo aproximado se cada agente usar
~2 000 tokens.
Se aprovado, use ultracode: abra um subagente por
contrato, extraia só: partes, valor total, cláusula
de rescisão. Resposta máx 60 tokens cada.
Relatório final: tabela resumida.
Prompt 3 — workflow em lotes (custo controlado) para listas muito grandes
Tenho 200 URLs em urls.txt. Processe em LOTES
de 20 URLs por vez (não todas de uma vez).
Cada lote: use ultracode, abra 20 subagentes em
paralelo, cada um faz: título + resumo em 2 linhas.
Após cada lote, mostre progresso (lote X/10 concluído).
Ao final, consolide tudo em uma lista numerada.
🖥️

Tela simulada: workflow rodando 6 subagentes

Assim aparece um workflow de auditoria no terminal do Claude Code: o orquestrador disparou 6 agentes simultâneos, cada um em sua própria sessão. A status line do orquestrador mostra apenas ~8% do contexto usado — o trabalho pesado ficou nos subagentes.

claude — ~/projetos/auditoria — ultracode workflow ORQUESTRADOR
# orquestrador iniciou workflow dinâmico
Detectados 6 arquivos em src/modules/ → disparando 6 subagentes em paralelo
# subagentes ativos
auth.py
92% Haiku · 1.8k tok
db_models.py
74% Haiku · 2.1k tok
api_routes.py
61% Haiku · 1.4k tok
utils.py
45% Haiku · 0.9k tok
middleware.py
33% Haiku · 0.7k tok
tests.py
18% Haiku · 0.3k tok
Orquestrador · contexto
8% usado
recriação ilustrativa — não é screenshot real
🏋️

Exercício: workflow ou sequência?

Para cada cenário abaixo, decida: workflow dinâmico ou processamento sequencial? Justifique com base nos três critérios: independência, volume e risco de contexto.

A

Revisar 3 arquivos de configuração para verificar se há variáveis de ambiente expostas.

Dica: pense no volume e no overhead de orquestração.

B

Gerar um resumo de 50 artigos científicos para um survey de literatura. Cada artigo tem ~10 000 palavras.

Dica: o que acontece com o contexto se você processar em sequência?

C

Refatorar um módulo grande em etapas: primeiro extrair classes, depois renomear variáveis, depois adicionar testes.

Dica: pense na dependência entre as etapas.

Critério de avaliação

A — Sequencial: apenas 3 arquivos, overhead de workflow não se justifica. Custo e complexidade superam o benefício de paralelismo.

B — Workflow dinâmico: 50 artigos independentes, cada um com 10k palavras. Processar em sequência explodiria o contexto. Fan-out de 50 agentes com resumo curto é a solução correta.

C — Sequencial: as etapas são dependentes (não dá para renomear antes de extrair). Paralelismo não se aplica a pipelines com dependência de estado.

Resumo do módulo

  • Workflow dinâmico = orquestrador dispara N subagentes com base no input — N determinado em tempo de execução.
  • O token gatilho atual é ultracode (era "workflow" nas versões antigas).
  • A plataforma suporta dezenas a centenas de agentes simultâneos — o limite prático é o orçamento.
  • Custo = soma dos tokens de todos os subagentes + consolidação. Calcule antes de executar.
  • Casos de referência: 41 agentes (auditoria) e 210 agentes (processamento de documento).
  • Use quando: itens independentes + volume alto + risco de contexto em sequência.
  • Mitigações: output curto por agente, teste com lote pequeno, validação no consolidador.