Workflows dinâmicos

Imagine que você precisa processar 210 arquivos de uma só vez: revisar código, extrair metadados, gerar relatórios. Fazer isso em sequência levaria horas. Com um workflow dinâmico, o orquestrador dispara um subagente por arquivo — todos ao mesmo tempo, cada um na sua janela — e você recebe o consolidado em minutos. O desenho abaixo é o que acontece por baixo.

Conteúdo detalhado

🌐 O que é um workflow dinâmico

No Claude Code, um workflow dinâmico é uma orquestração onde o número de subagentes não está fixo no prompt — ele é determinado em tempo de execução pelo orquestrador. O maestro recebe a lista de itens, decide quantos agentes vai precisar e os dispara todos via Task tool, um para cada item.

O que é

Uma estrutura de execução onde o orquestrador gera dinamicamente N tarefas paralelas com base no input — seja uma lista de arquivos, uma lista de URLs, uma lista de capítulos ou qualquer coleção iterável. Cada item vira um subagente independente.

Por que aprender

Entender workflows dinâmicos é o que permite executar jobs que seriam impossíveis em sequência dentro de uma única sessão. É a diferença entre processar 5 arquivos e processar 200 — com o mesmo esforço de prompt. Sem esse conhecimento, você subutiliza a ferramenta mais poderosa da plataforma.

Conceitos-chave

⚙️

Task tool

dispara agente

🔀

Fan-out

1 → N

🔗

Dinâmico

N = f(input)

📊

Consolidação

N → 1

🚀 O gatilho: de "workflow" a `ultracode`

A palavra mágica mudou. Durante muito tempo, o prompt-padrão para ativar orquestração massiva era workflow. Com as versões mais recentes do Claude Code, o gatilho recomendado virou ultracode. O comportamento é o mesmo — mas o token mudou. Saber isso evita frustração quando você segue tutoriais antigos.

O que é

ultracode é uma instrução ao orquestrador para usar a máxima capacidade paralela disponível. Quando você inclui esse token no prompt, o maestro sabe que pode (e deve) disparar o maior número de subagentes necessário, sem contenção artificial.

Por que aprender

O token certo muda a estratégia de execução do modelo. Sem ele, o Claude pode optar por processar em sequência ou com menos agentes. Com ele, você declara explicitamente: "use orquestração massiva aqui". É o interruptor entre modo normal e modo de escala total.

Conceitos-chave

✅ Novo token

ultracode

ativa orquestração máxima

⚠️ Token antigo

workflow

ainda funciona em versões antigas

📈 Escala: dezenas e centenas de agentes

O Claude Code foi projetado para suportar orquestração em escala real. Não estamos falando de 3 a 5 subagentes — estamos falando de dezenas a centenas rodando em paralelo. Cada subagente tem sua própria sessão, usa tokens independentes, e pode ser um modelo diferente do orquestrador.

O que é

A plataforma não impõe limite rígido de subagentes por workflow. O limite prático é a sua conta de API (rate limits), o orçamento disponível e a capacidade de consolidar os resultados sem explodir o contexto do orquestrador. Jobs com 40+ agentes simultâneos são comuns em cenários de auditoria massiva.

Por que aprender

Saber a escala possível muda sua arquitetura de prompt. Se você não sabe que pode disparar 100 agentes, vai continuar projetando soluções sequenciais para problemas paralelizáveis. Conhecer o teto real permite projetar workflows corretos desde o início.

Conceitos-chave

2–5 agentesuso comum, baixo custo

10–40 agentesauditoria de codebase médio

41–100 agentesworkflows pesados, custo elevado

100–210+ agentescasos extremos, planejar orçamento

💸 Custo e limite de sessão

Workflows dinâmicos são caros por design. Cada subagente consome tokens independentemente — e o custo de um workflow com 200 agentes é aproximadamente 200× o custo de um único agente rodando a mesma tarefa. Além do custo financeiro, há o limite de sessão: o orquestrador ainda precisa de contexto suficiente para ler todos os relatórios de volta.

O que é

O custo de um workflow é a soma dos tokens de cada subagente mais os tokens do orquestrador ao consolidar. O orquestrador precisa de contexto para receber os relatórios — se cada agente devolver 500 tokens e você tiver 200 agentes, isso são 100 000 tokens apenas nos relatórios, antes de qualquer análise.

Por que aprender

Planejar o custo antes de executar evita surpresas. Um workflow mal dimensionado pode consumir o orçamento mensal inteiro em minutos. Entender a estrutura de custo permite decidir: vale usar Haiku nos subagentes? Vale pedir resumos ultra-curtos? Vale subdividir em lotes menores?

Conceitos-chave

✅ Boas práticas de custo

• Usar Haiku nos subagentes quando possível
• Pedir resumo curto (não dump bruto)
• Processar em lotes de 20–40 por vez
• Testar com 5 itens antes de escalar

❌ Armadilhas de custo

• Pedir output longo de cada agente
• Usar Opus em todos os subagentes
• Disparar 200 agentes sem testar antes
• Ignorar o custo de consolidação

🔬 O caso real: 41 e 210 subagentes

Dois números viraram referência na comunidade Claude Code para workflows em escala real: 41 subagentes (caso de auditoria de codebase) e 210 subagentes (processamento de documento massivo). Esses não são limites da ferramenta — são casos documentados que provam que a arquitetura suporta escala sem falhas estruturais.

O que é

Auditoria de codebase

Cada subagente analisou um módulo diferente. O orquestrador consolidou os achados em um único relatório de segurança.

210

Processamento de documento

Cada subagente processou uma seção de um documento grande. Fan-out completo em uma única chamada ao orquestrador.

Por que aprender

Esses casos provam que workflows dinâmicos não são teoria — são prática. Eles também definem uma régua de escala: se seu problema tem menos de 40 itens paralelos, você está bem dentro do conforto. Se tem mais de 100, precisa de planejamento de custo explícito.

Conceitos-chave

caso de referência

210

escala máxima doc.

∞

limite = orçamento

✅ Quando vale usar workflows dinâmicos

Não é todo job paralelo que precisa de workflow dinâmico. A regra prática: se o processamento de cada item é independente, a lista tem mais de 10 itens e o contexto explodiria processando em sequência — aí workflows dinâmicos são a escolha certa.

O que é

O critério de decisão tem três dimensões: independência (os itens não dependem uns dos outros), volume (lista longa o suficiente para justificar overhead de orquestração) e risco de contexto (processar tudo no maestro explodiria a janela de contexto).

Por que aprender

O erro mais comum é usar workflow para tudo — incluindo jobs pequenos onde a sequência seria mais eficiente e mais barata. Aprender o critério correto evita desperdício de tokens e complexidade desnecessária.

Conceitos-chave

✅ Use workflow dinâmico

• Revisar 20+ arquivos de código
• Processar seções de documento longo
• Gerar relatório para N repositórios
• Analisar N contratos em paralelo
• Traduzir N páginas simultaneamente

❌ Não use workflow

• Job com 2–3 itens (sequência basta)
• Itens que dependem uns dos outros
• Quando custo supera o ganho de tempo
• Tarefas criativas que precisam de coerência
• Pipeline com estado compartilhado

⚠️ Cuidados: o que pode dar errado

Orquestração massiva traz riscos que não existem em jobs simples. Os três mais críticos: explosão de contexto no consolidador, custo inesperado e falhas silenciosas — um subagente que retorna vazio sem avisar.

O que é

Cada risco tem uma causa específica: o orquestrador recebe relatórios grandes demais (explosão de contexto); o modelo não tem visão prévia do custo total antes de executar (surpresa financeira); um subagente trava ou retorna erro silencioso, contaminando o consolidado sem que o orquestrador perceba.

Por que aprender

Workflows que falham silenciosamente são os mais perigosos — o orquestrador entrega um relatório incompleto sem sinalizar que 3 dos 40 subagentes não retornaram nada. Saber o risco permite adicionar instruções explícitas de validação no prompt do orquestrador.

Conceitos-chave: mitigações

Instrua output curto

Peça resumo de 3–5 bullets por subagente, não dump completo

Teste com lote pequeno

Rode com 5 itens primeiro, valide saída, depois escale

Valide no consolidador

Instrua o orquestrador a reportar quantos agentes retornaram vazio

Calcule antes de executar

Estime: N × custo-médio-por-agente × tokens-de-consolidação

📄

Exemplo conceitual

Abaixo, o padrão mental de um workflow para processar 15 capítulos de um livro técnico em paralelo. Note como o orquestrador não precisa ler os 15 capítulos — cada agente lê o seu, e devolve apenas o essencial.

Estrutura mental do workflow (conceitual) não é código real

ORQUESTRADOR recebe: lista de 15 capítulos

PARA CADA capítulo em paralelo (ultracode):
  SUBAGENTE recebe: "Leia capitulo_X.md e me traga:
    1. Tese central (1 frase)
    2. Principais conceitos (3 bullets)
    3. Pontos confusos para revisão (máx 2)
    Resposta: máx 100 tokens."

ORQUESTRADOR consolida: 15 resumos → relatório final
  → identifica capítulos com mais pontos confusos
  → sugere ordem de revisão prioritária

Chave do design: cada subagente retorna máximo 100 tokens. Com 15 agentes, o orquestrador recebe ~1 500 tokens de input — gerenciável. Sem esse limite, 15 capítulos longos poderiam devolver 50 000 tokens e explodir o contexto.

⌨️

Prompts prontos (copie e cole)

Três prompts para ativar workflows dinâmicos com controle de custo. Em todos, repare no padrão: declare o volume, limite o output de cada agente e peça validação no consolidado.

Prompt 1 — workflow de auditoria de arquivos com controle de custo

Use ultracode para auditar os arquivos em src/.
Para cada arquivo, abra um subagente com Haiku.
Cada subagente deve retornar APENAS:
- Arquivo: nome
- Problemas: lista de até 3 items
- Severidade: baixa/média/alta
Máximo 80 tokens por resposta.
Ao final, consolide quantos arquivos retornaram
vazio e liste os de severidade alta primeiro.

Prompt 2 — workflow com ressalva de custo explícita pede estimativa antes de executar

Tenho 80 contratos em /docs/contratos/.
ANTES de rodar, estime quantos subagentes serão
criados e o custo aproximado se cada agente usar
~2 000 tokens.
Se aprovado, use ultracode: abra um subagente por
contrato, extraia só: partes, valor total, cláusula
de rescisão. Resposta máx 60 tokens cada.
Relatório final: tabela resumida.

Prompt 3 — workflow em lotes (custo controlado) para listas muito grandes

Tenho 200 URLs em urls.txt. Processe em LOTES
de 20 URLs por vez (não todas de uma vez).
Cada lote: use ultracode, abra 20 subagentes em
paralelo, cada um faz: título + resumo em 2 linhas.
Após cada lote, mostre progresso (lote X/10 concluído).
Ao final, consolide tudo em uma lista numerada.

🖥️

Tela simulada: workflow rodando 6 subagentes

Assim aparece um workflow de auditoria no terminal do Claude Code: o orquestrador disparou 6 agentes simultâneos, cada um em sua própria sessão. A status line do orquestrador mostra apenas ~8% do contexto usado — o trabalho pesado ficou nos subagentes.

claude — ~/projetos/auditoria — ultracode workflow ORQUESTRADOR

# orquestrador iniciou workflow dinâmico

✦ Detectados 6 arquivos em src/modules/ → disparando 6 subagentes em paralelo

# subagentes ativos

⊕ auth.py

92% Haiku · 1.8k tok

⊕ db_models.py

74% Haiku · 2.1k tok

⊕ api_routes.py

61% Haiku · 1.4k tok

⊕ utils.py

45% Haiku · 0.9k tok

⊕ middleware.py

33% Haiku · 0.7k tok

⊕ tests.py

18% Haiku · 0.3k tok

Orquestrador · contexto

8% usado

recriação ilustrativa — não é screenshot real

🏋️

Exercício: workflow ou sequência?

Para cada cenário abaixo, decida: workflow dinâmico ou processamento sequencial? Justifique com base nos três critérios: independência, volume e risco de contexto.

Revisar 3 arquivos de configuração para verificar se há variáveis de ambiente expostas.

Dica: pense no volume e no overhead de orquestração.

Gerar um resumo de 50 artigos científicos para um survey de literatura. Cada artigo tem ~10 000 palavras.

Dica: o que acontece com o contexto se você processar em sequência?

Refatorar um módulo grande em etapas: primeiro extrair classes, depois renomear variáveis, depois adicionar testes.

Dica: pense na dependência entre as etapas.

Critério de avaliação

A — Sequencial: apenas 3 arquivos, overhead de workflow não se justifica. Custo e complexidade superam o benefício de paralelismo.

B — Workflow dinâmico: 50 artigos independentes, cada um com 10k palavras. Processar em sequência explodiria o contexto. Fan-out de 50 agentes com resumo curto é a solução correta.

C — Sequencial: as etapas são dependentes (não dá para renomear antes de extrair). Paralelismo não se aplica a pipelines com dependência de estado.

✅ Resumo do módulo

▸ Workflow dinâmico = orquestrador dispara N subagentes com base no input — N determinado em tempo de execução.
▸ O token gatilho atual é ultracode (era "workflow" nas versões antigas).
▸ A plataforma suporta dezenas a centenas de agentes simultâneos — o limite prático é o orçamento.
▸ Custo = soma dos tokens de todos os subagentes + consolidação. Calcule antes de executar.
▸ Casos de referência: 41 agentes (auditoria) e 210 agentes (processamento de documento).
▸ Use quando: itens independentes + volume alto + risco de contexto em sequência.
▸ Mitigações: output curto por agente, teste com lote pequeno, validação no consolidador.

← Módulo anterior Próximo módulo →

Conteúdo detalhado

🌐 O que é um workflow dinâmico

O que é

Por que aprender

Conceitos-chave

🚀 O gatilho: de "workflow" a ultracode

O que é

Por que aprender

Conceitos-chave

📈 Escala: dezenas e centenas de agentes

O que é

Por que aprender

Conceitos-chave

💸 Custo e limite de sessão

O que é

Por que aprender

Conceitos-chave

🔬 O caso real: 41 e 210 subagentes

O que é

Por que aprender

Conceitos-chave

✅ Quando vale usar workflows dinâmicos

O que é

Por que aprender

Conceitos-chave

⚠️ Cuidados: o que pode dar errado

O que é

Por que aprender

Conceitos-chave: mitigações

Exemplo conceitual

Prompts prontos (copie e cole)

Tela simulada: workflow rodando 6 subagentes

Exercício: workflow ou sequência?

Critério de avaliação

✅ Resumo do módulo

🚀 O gatilho: de "workflow" a `ultracode`