MÓDULO 3.1 · Trilha 3 · Modelo, custo e orquestração

🎚️ Modelo por tarefa

Todo subagente roda algum modelo. Escolher errado custa caro nos dois sentidos: um Opus pra varrer arquivo é dinheiro jogado fora; um Haiku pra decidir arquitetura é qualidade jogada fora. Casar a tarefa com o tier certo é a primeira alavanca de economia da Trilha 3.

6
Tópicos
~28
Minutos
Médio
Nível
Decisão
Tipo

Pense numa oficina mecânica. Pra trocar um pneu você não chama o engenheiro-chefe — manda o ajudante, é rápido e barato. Pra remontar o motor, aí sim o mestre entra. Modelos de IA funcionam igual: existe um tier baixo (rápido, barato, ótimo pra trabalho braçal), um tier médio (o operário competente que constrói e revisa) e um tier alto (o mestre que você só aciona quando o problema exige raciocínio de verdade). No Claude Code esses três são Haiku, Sonnet e Opus — e cada subagente pode rodar o seu.

custo ↑ · raciocínio ↑ · latência ↑ → Haiku escanear · buscar · resumir $ · rápido Sonnet construir · revisar $$ · equilibrado Opus raciocínio · segurança · arquitetura $$$ · profundo

↑ A escada de tiers: cada degrau pra cima ganha raciocínio, mas paga em custo e latência. Suba só o quanto a tarefa exige.

Conteúdo detalhado

1

⚡ Haiku — o trabalhador braçal

Haiku é o tier barato e rápido. Ele brilha no trabalho mecânico de alto volume: escanear uma pasta inteira, buscar uma string em centenas de arquivos, resumir um log gigante, ler documentação e devolver os 5 pontos que importam. Tarefas onde a resposta é "ache e relate", não "pense fundo".

🔎 O ponto-doce do Haiku

Quando o subagente vai gerar uma parede de leitura que ninguém vai reler — só interessa a conclusão — você quer o tier mais barato que faça o serviço. Pagar caro por isso é queimar dinheiro num trabalho que não pede inteligência:

  • Escanear — varrer arquivos/diretórios atrás de um padrão.
  • Buscar — localizar onde algo aparece num repositório grande.
  • Resumir — comprimir um log, um PDF, uma transcrição.
  • Ler docs — trazer os fatos de uma página, sem colar a página.
O que é:

O tier de menor custo e menor latência. Pensa raso, mas executa rápido e em volume — ideal para o trabalho de "garimpo" que alimenta o resto.

Por que aprender:

A maior parte do que um subagente faz é leitura bruta descartável. Rodar isso em Haiku derruba a conta sem mexer na qualidade do resultado final.

Conceitos-chave:

Barato · rápido · alto volume · "ache e relate" · trabalho mecânico descartável.

🔦
Escanear
pastas
🔍
Buscar
strings
🗜️
Resumir
logs
📚
Ler docs
fatos
2

🔧 Sonnet — o operário competente

Sonnet é o tier médio — o cavalo de batalha do dia a dia. Ele constrói (escreve código, monta arquivos, implementa um passo de um plano) e revisa (lê um diff e aponta bugs). É inteligente o bastante para a maioria das tarefas reais e ainda assim muito mais barato que o tier alto. Quando você está em dúvida, Sonnet costuma ser o default seguro.

1

Recebe uma tarefa concreta

Construir ou revisar algo bem-definido.

"Implemente a validação de e-mail neste formulário" ou "revise este diff e aponte bugs e testes faltando".

2

Executa com competência

Bom raciocínio, custo razoável.

Entende o intento, escreve um código correto, segue o padrão do projeto. Não precisa do raciocínio de fronteira do Opus para isso.

3

Entrega no ritmo certo

Equilíbrio qualidade × preço.

O resultado é sólido sem inflar a conta. É por isso que Sonnet é o tier "padrão" de quem constrói e revisa o dia inteiro.

📊 O default sensato

Se você não consegue justificar por que a tarefa precisa de Opus, ela quase sempre cabe em Sonnet. E se ela é só "ache e relate", desça pra Haiku. O exercício mental é sempre: quão fundo essa tarefa precisa pensar?

O que é: o tier de meio — inteligente para construir e revisar, com custo controlado.
Por que aprender: é o default que cobre a maioria das tarefas; saber isso evita o reflexo de "tudo no Opus".
Conceitos-chave: construir · revisar · default seguro · equilíbrio qualidade/custo.
3

🧠 Opus — o mestre que você só chama quando precisa

Opus é o tier caro e mais lento, reservado para o que realmente exige raciocínio profundo: decisões de arquitetura, análise de segurança, planejamento delicado, depuração de um problema que ninguém entende. Aqui o custo extra se paga: um erro de arquitetura sai muito mais caro que alguns tokens a mais.

🏛️

Arquitetura

Decisões de longo alcance

"Como estruturar este módulo?" — uma escolha que vai pesar por meses.

🔐

Segurança

Onde o erro custa caro

Achar uma falha de injeção ou um vazamento exige pensar como atacante.

🧩

Raciocínio difícil

Problema emaranhado

Um bug que cruza cinco arquivos e não tem causa óbvia.

🗺️

Planejamento

Plano que outros seguem

Quebrar um trabalho grande em passos que vários subagentes vão executar.

⚖️

Trade-offs

Pesar opções a fundo

Comparar duas abordagens e justificar a escolha com nuance.

💎

O custo se paga

Em tarefas raras e de alto risco, o tier caro é o investimento mais barato que existe.

💡 Opus é exceção, não default

O instinto de iniciante é "use o melhor modelo em tudo". Errado. Opus deve ser a minoria dos seus subagentes — só aqueles cuja decisão é cara de errar. Para o resto, Haiku e Sonnet entregam o mesmo resultado por uma fração do preço.

O que é: o tier de raciocínio máximo, mais caro e mais lento, para decisões de alto risco.
Por que aprender: saber quando vale o Opus (e quando não) é o que separa quem economiza de quem desperdiça.
Conceitos-chave: arquitetura · segurança · raciocínio profundo · exceção justificada.
4

📐 Os três eixos: raciocínio × custo × latência

Subir de tier não é só "ficar mais esperto". São três dials que se movem juntos: mais raciocínio vem com mais custo e mais latência (demora mais para responder). Escolher modelo é decidir de quanto de cada um a tarefa precisa — e parar de pagar pelo que ela não usa.

✓ Subir de tier faz sentido quando…

  • A tarefa exige raciocínio que o tier abaixo erra
  • O erro é caro (arquitetura, segurança)
  • A decisão vale por muito tempo
  • Você consegue justificar o custo extra

✗ Subir de tier é desperdício quando…

  • É só escanear, buscar ou resumir
  • A saída é descartável (ninguém relê)
  • Você roda isso centenas de vezes
  • A latência importa (você quer rápido)

⏱️ A latência também conta

Num fan-out com 30 subagentes de busca, um modelo lento multiplica a espera por 30. Haiku não é só mais barato — é mais rápido, e isso muda a sensação de usar o sistema. Tier alto numa tarefa trivial te faz esperar à toa.

O que é: o trade-off de três eixos que todo tier carrega — raciocínio, custo e latência sobem juntos.
Por que aprender: escolher modelo é dosar esses três; você só acerta se enxergar os três ao mesmo tempo.
Conceitos-chave: raciocínio · custo · latência · "pague só pelo que a tarefa usa".
5

🪤 A armadilha: o subagente começa em branco

Eis o detalhe que pega muita gente. O subagente não herda a sua conversa — ele começa do zero, com a janela vazia. Antes de produzir qualquer coisa, ele precisa reunir o contexto sozinho: ler os arquivos, entender o terreno. Isso muda a conta: parte do trabalho dele é só "se situar", e esse trabalho de leitura é exatamente o que um tier barato faz bem.

o que o subagente vê ao nascer janela em branco
# o maestro já conversou com você por 1h.
# o subagente NÃO sabe nada disso. ele nasce assim:

contexto: (vazio)
tarefa:   "ache onde o login quebra nos 40 arquivos de /auth"

# 1º ele GASTA tokens só pra se situar:
#   - lista a pasta /auth
#   - abre os 40 arquivos
#   - mapeia o fluxo de login
# SÓ DEPOIS ele começa a raciocinar sobre o bug.

# lição: essa fase de "reunir contexto" é leitura bruta
# → é trabalho de Haiku, não de Opus.

⚠️ Por que isso é uma armadilha de custo

Se você joga essa tarefa inteira no Opus, está pagando o tier mais caro para uma fase que é pura leitura (listar pasta, abrir arquivo). O ideal muitas vezes é separar: um Haiku reúne e resume o contexto, e só o raciocínio final — se for difícil — sobe de tier. Não pague Opus para abrir arquivos.

O que é: o subagente nasce sem contexto e gasta esforço só para se situar antes de pensar.
Por que aprender: muda a escolha de modelo — a fase de "reunir contexto" é leitura barata, não raciocínio caro.
Conceitos-chave: janela em branco · reunir contexto · leitura ≠ raciocínio · separar as fases.
6

⚖️ Tarefa grande vale, tarefa de 30s desperdiça

Há um custo fixo em disparar um subagente: ele nasce em branco, reúne contexto, depois trabalha. Para uma tarefa grande, esse custo se dilui — vale a pena. Para uma microtarefa de 30 segundos, a sobrecarga de "se situar" é maior que o trabalho em si: é desperdício. E para o caso comum, existe o atalho honesto — herdar o modelo do pai.

✓ Vale o subagente (tarefa grande)

  • Ler e cruzar dezenas de arquivos
  • Pesquisa pesada que gera parede de output
  • Trabalho que roda em paralelo (fan-out)
  • O custo de se situar se dilui no tamanho

✗ Desperdício (tarefa de 30 segundos)

  • Trocar uma linha que você já tem na frente
  • Responder algo que o maestro já sabe
  • Tarefa onde "reunir contexto" > o trabalho
  • Edição rápida no meio da conversa

🧬 inherit-from-parent — o default honesto

Se você não declarar model no subagente, ele costuma herdar o modelo do pai (o maestro). É o comportamento padrão e quase sempre razoável: você só fixa um modelo quando tem um motivo claro para desviar do pai.

  • Herdar — deixar sem model: o subagente roda no modelo do maestro. Default seguro.
  • Forçar pra baixomodel: haiku num agente de busca, mesmo com maestro no Opus: economia.
  • Forçar pra cimamodel: opus num revisor de segurança, mesmo com maestro no Sonnet: qualidade onde dói.
O que é: o subagente tem custo fixo de partida; herdar o modelo do pai é o default quando você não quer escolher.
Por que aprender: evita disparar subagente pra microtarefa e ensina quando fixar o modelo vale o esforço.
Conceitos-chave: custo fixo de partida · tarefa grande × 30s · inherit-from-parent · forçar para cima/baixo.
📊

A tabela de decisão: Modelo × Raciocínio × Custo × Quando usar

Esta é a tabela canônica do curso para escolher modelo. Leia da esquerda para a direita: cada tier tem um nível de raciocínio, um custo relativo, uma latência — e um conjunto de tarefas onde é a escolha certa. Guarde-a; ela volta na Trilha 4 quando compararmos modelos de outros provedores.

Modelo Raciocínio Custo Latência Quando usar
Haiku
o ajudante
Raso
ache & relate
$
o mais barato
Baixa
o mais rápido
Escanear, buscar, resumir, ler docs, varreduras, reunir contexto bruto.
Sonnet
o operário
Bom
constrói & revisa
$$
médio
Média
equilibrada
Construir código, implementar passos, revisar diffs. Default quando em dúvida.
Opus
o mestre
Profundo
pensa fundo
$$$
o mais caro
Alta
o mais lento
Arquitetura, segurança, planejamento, depuração difícil. Exceção justificada.
inherit
herda do pai
= do maestro
o que o pai usa
= do maestro = do maestro Quando não há motivo para desviar. Omita o campo model e pronto.

💡 Como ler a tabela na prática

Comece de baixo: a tarefa é "ache e relate"? Haiku. Não? Ela "constrói ou revisa"? Sonnet. Só sobe pra Opus se você conseguir dizer em voz alta por que o raciocínio precisa ser o melhor possível. Não souber justificar? Não suba.

📄

Exemplo real: três agentes, três modelos

A escolha de modelo mora no campo model do frontmatter. Veja três subagentes de um mesmo projeto, cada um no tier justificado pela sua tarefa — e leia o comentário que explica por quê cada um está onde está.

.claude/agents/ (três arquivos) Markdown + YAML
# ── 1) file-scout.md ── varre o repo atrás de um padrão
---
name: file-scout
description: Varre o repositório atrás de onde um símbolo
  ou string aparece e devolve só os caminhos + linhas.
tools: Read, Grep, Glob       # só leitura
model: haiku                  # ← é "ache e relate": tier barato basta
---
You are a fast code scout. Liste apenas os arquivos e linhas
onde o alvo aparece. Não explique, não opine. Só o mapa.


# ── 2) feature-builder.md ── implementa um passo do plano
---
name: feature-builder
description: Implementa um passo bem-definido de um plano
  (uma função, uma validação, um endpoint) e roda os testes.
tools: Read, Edit, Write, Bash
model: sonnet                 # ← constrói código: o operário competente
---
You are a focused implementer. Implemente exatamente o passo
pedido, siga o padrão do projeto e rode os testes ao final.


# ── 3) security-reviewer.md ── caça falha de segurança
---
name: security-reviewer
description: Revisa o diff em busca de falhas de segurança
  (injeção, vazamento, authz). Use após mexer em auth/pagamentos.
tools: Read, Grep, Glob       # read-only: revisor não edita
model: opus                   # ← raciocínio de segurança: o erro é caro
---
You are a senior security reviewer. Pense como atacante.
Aponte cada risco com arquivo:linha e a gravidade. Não conserte.
file-scout
model: haiku

Só localiza e lista. Zero raciocínio profundo → o tier mais barato e rápido é o certo.

feature-builder
model: sonnet

Escreve código correto seguindo um plano. Trabalho de construção real → o default médio.

security-reviewer
model: opus

Caçar uma falha exige pensar fundo, e errar custa caro → o tier alto se justifica aqui.

⌨️

Prompts prontos (copie e cole)

Três prompts para mandar o maestro casar modelo com tarefa. Repare no padrão: você diz o tier e a razão — e deixa o trabalho barato no Haiku, o caro no Opus.

Prompt 1 — barato pra escanear, caro pra decidir divide as fases
Use um subagente em Haiku pra escanear /auth e me
trazer só os trechos que tocam o login. Depois,
com esse resumo, use Opus só pra decidir onde está
o bug. Não rode o Opus na varredura.
Prompt 2 — fixar o modelo de um agente define o campo model
Crie um subagente "doc-summarizer" read-only com
model: haiku — a tarefa é só ler docs e resumir,
então quero o tier mais barato e rápido.
Prompt 3 — subir o tier onde dói justifica o Opus
Esse é um revisor de segurança: coloque model: opus.
O erro aqui é caro, então quero o raciocínio máximo,
mesmo custando mais. Mantenha o agente read-only.
🖥️

Tela simulada: o modelo de cada subagente

É assim que a escolha aparece no terminal. O maestro disparou três subagentes e a status line mostra, para cada um, qual modelo está rodando. Note o desenho: a frota de varredura em Haiku, o builder em Sonnet, e só o revisor de segurança em Opus — chefe caro, trabalhadores baratos.

claude code · auth-refactor · 3 subagentes ⏱ 00:31
● file-scoutHaiku
38k tok
● doc-summarizerHaiku
52k tok
● feature-builderSonnet
119k tok
● security-reviewerOpus
88k tok
2× Haiku + 1× Sonnet + 1× Opus · só o trabalho que pensa fundo paga o tier caro
maestro · Opus
seu contexto
14%

↑ Recriação ilustrativa do terminal (não é screenshot real). A status line revela o modelo de cada subagente — e a frota barata carrega o grosso do trabalho.

🎯

Exercício: atribua o modelo a 6 tarefas

Para cada uma das 6 tarefas abaixo, escolha o tier — Haiku, Sonnet ou Opus — e escreva uma frase justificando. Use a tabela de decisão como guia.

As 6 tarefas

  1. Buscar em quais dos 300 arquivos do projeto a função parseToken é chamada.
  2. Decidir como reorganizar a arquitetura de pastas de um monorepo que cresceu demais.
  3. Implementar a máscara de telefone num campo de formulário, seguindo o padrão do projeto.
  4. Resumir um log de build de 4.000 linhas nos 5 erros que importam.
  5. Auditar um endpoint de pagamento em busca de falha de autorização.
  6. Revisar um diff de 60 linhas que adiciona um botão e ajusta um CSS.

✅ Critério de verificação — gabarito comentado

Confira a sua resposta contra este gabarito. Acertar o tier importa, mas acertar a razão importa mais — é ela que você vai reusar em tarefas novas.

  • 1.Haiku — é "ache e relate" puro, alto volume, zero raciocínio profundo.
  • 2.Opus — arquitetura: decisão de longo alcance, cara de errar.
  • 3.Sonnet — construir código bem-definido seguindo um padrão: o operário.
  • 4.Haiku — resumir um log é compressão de leitura, descartável e rápida.
  • 5.Opus — segurança em pagamento: pensar como atacante, erro caríssimo.
  • 6.Sonnet — revisar um diff trivial: trabalho de revisão padrão, sem risco alto.

Placar de tiers: Haiku ×2 · Sonnet ×2 · Opus ×2. Se você jogou tudo no Opus, releia o tópico 3 — Opus é a minoria.

Exemplo resolvido

Tarefa: "buscar onde parseToken é chamada nos 300 arquivos". Tier: Haiku. Razão: é uma varredura de "ache e relate" — alto volume, leitura descartável, nenhuma decisão difícil; pagar Sonnet ou Opus aqui seria queimar dinheiro.

Resumo do módulo

Haiku — barato e rápido; escanear, buscar, resumir, ler docs. O trabalho braçal descartável.
Sonnet — médio; construir e revisar. O default sensato quando você está em dúvida.
Opus — caro e profundo; arquitetura, segurança, raciocínio difícil. Exceção justificada, não default.
Três eixos — raciocínio, custo e latência sobem juntos; pague só pelo que a tarefa usa.
Começa em branco — o subagente reúne contexto sozinho; essa fase é leitura barata, não raciocínio caro.
Grande × 30s + inherit — subagente vale pra tarefa grande, desperdiça pra microtarefa; sem motivo, herde o modelo do pai.

Próximo módulo:

3.2 — A economia real. Chefe inteligente + frota Haiku, CLAUDE_CODE_SUBAGENT_MODEL, maxTurns e por que multiagente custa ~15× — e quando isso vale.