Pense numa oficina mecânica. Pra trocar um pneu você não chama o engenheiro-chefe — manda o ajudante, é rápido e barato. Pra remontar o motor, aí sim o mestre entra. Modelos de IA funcionam igual: existe um tier baixo (rápido, barato, ótimo pra trabalho braçal), um tier médio (o operário competente que constrói e revisa) e um tier alto (o mestre que você só aciona quando o problema exige raciocínio de verdade). No Claude Code esses três são Haiku, Sonnet e Opus — e cada subagente pode rodar o seu.
↑ A escada de tiers: cada degrau pra cima ganha raciocínio, mas paga em custo e latência. Suba só o quanto a tarefa exige.
Conteúdo detalhado
⚡ Haiku — o trabalhador braçal
Haiku é o tier barato e rápido. Ele brilha no trabalho mecânico de alto volume: escanear uma pasta inteira, buscar uma string em centenas de arquivos, resumir um log gigante, ler documentação e devolver os 5 pontos que importam. Tarefas onde a resposta é "ache e relate", não "pense fundo".
🔎 O ponto-doce do Haiku
Quando o subagente vai gerar uma parede de leitura que ninguém vai reler — só interessa a conclusão — você quer o tier mais barato que faça o serviço. Pagar caro por isso é queimar dinheiro num trabalho que não pede inteligência:
- •Escanear — varrer arquivos/diretórios atrás de um padrão.
- •Buscar — localizar onde algo aparece num repositório grande.
- •Resumir — comprimir um log, um PDF, uma transcrição.
- •Ler docs — trazer os fatos de uma página, sem colar a página.
O tier de menor custo e menor latência. Pensa raso, mas executa rápido e em volume — ideal para o trabalho de "garimpo" que alimenta o resto.
A maior parte do que um subagente faz é leitura bruta descartável. Rodar isso em Haiku derruba a conta sem mexer na qualidade do resultado final.
Barato · rápido · alto volume · "ache e relate" · trabalho mecânico descartável.
🔧 Sonnet — o operário competente
Sonnet é o tier médio — o cavalo de batalha do dia a dia. Ele constrói (escreve código, monta arquivos, implementa um passo de um plano) e revisa (lê um diff e aponta bugs). É inteligente o bastante para a maioria das tarefas reais e ainda assim muito mais barato que o tier alto. Quando você está em dúvida, Sonnet costuma ser o default seguro.
Recebe uma tarefa concreta
Construir ou revisar algo bem-definido.
"Implemente a validação de e-mail neste formulário" ou "revise este diff e aponte bugs e testes faltando".
Executa com competência
Bom raciocínio, custo razoável.
Entende o intento, escreve um código correto, segue o padrão do projeto. Não precisa do raciocínio de fronteira do Opus para isso.
Entrega no ritmo certo
Equilíbrio qualidade × preço.
O resultado é sólido sem inflar a conta. É por isso que Sonnet é o tier "padrão" de quem constrói e revisa o dia inteiro.
📊 O default sensato
Se você não consegue justificar por que a tarefa precisa de Opus, ela quase sempre cabe em Sonnet. E se ela é só "ache e relate", desça pra Haiku. O exercício mental é sempre: quão fundo essa tarefa precisa pensar?
🧠 Opus — o mestre que você só chama quando precisa
Opus é o tier caro e mais lento, reservado para o que realmente exige raciocínio profundo: decisões de arquitetura, análise de segurança, planejamento delicado, depuração de um problema que ninguém entende. Aqui o custo extra se paga: um erro de arquitetura sai muito mais caro que alguns tokens a mais.
Arquitetura
Decisões de longo alcance
"Como estruturar este módulo?" — uma escolha que vai pesar por meses.
Segurança
Onde o erro custa caro
Achar uma falha de injeção ou um vazamento exige pensar como atacante.
Raciocínio difícil
Problema emaranhado
Um bug que cruza cinco arquivos e não tem causa óbvia.
Planejamento
Plano que outros seguem
Quebrar um trabalho grande em passos que vários subagentes vão executar.
Trade-offs
Pesar opções a fundo
Comparar duas abordagens e justificar a escolha com nuance.
O custo se paga
Em tarefas raras e de alto risco, o tier caro é o investimento mais barato que existe.
💡 Opus é exceção, não default
O instinto de iniciante é "use o melhor modelo em tudo". Errado. Opus deve ser a minoria dos seus subagentes — só aqueles cuja decisão é cara de errar. Para o resto, Haiku e Sonnet entregam o mesmo resultado por uma fração do preço.
📐 Os três eixos: raciocínio × custo × latência
Subir de tier não é só "ficar mais esperto". São três dials que se movem juntos: mais raciocínio vem com mais custo e mais latência (demora mais para responder). Escolher modelo é decidir de quanto de cada um a tarefa precisa — e parar de pagar pelo que ela não usa.
✓ Subir de tier faz sentido quando…
- ✓A tarefa exige raciocínio que o tier abaixo erra
- ✓O erro é caro (arquitetura, segurança)
- ✓A decisão vale por muito tempo
- ✓Você consegue justificar o custo extra
✗ Subir de tier é desperdício quando…
- ✗É só escanear, buscar ou resumir
- ✗A saída é descartável (ninguém relê)
- ✗Você roda isso centenas de vezes
- ✗A latência importa (você quer rápido)
⏱️ A latência também conta
Num fan-out com 30 subagentes de busca, um modelo lento multiplica a espera por 30. Haiku não é só mais barato — é mais rápido, e isso muda a sensação de usar o sistema. Tier alto numa tarefa trivial te faz esperar à toa.
🪤 A armadilha: o subagente começa em branco
Eis o detalhe que pega muita gente. O subagente não herda a sua conversa — ele começa do zero, com a janela vazia. Antes de produzir qualquer coisa, ele precisa reunir o contexto sozinho: ler os arquivos, entender o terreno. Isso muda a conta: parte do trabalho dele é só "se situar", e esse trabalho de leitura é exatamente o que um tier barato faz bem.
# o maestro já conversou com você por 1h.
# o subagente NÃO sabe nada disso. ele nasce assim:
contexto: (vazio)
tarefa: "ache onde o login quebra nos 40 arquivos de /auth"
# 1º ele GASTA tokens só pra se situar:
# - lista a pasta /auth
# - abre os 40 arquivos
# - mapeia o fluxo de login
# SÓ DEPOIS ele começa a raciocinar sobre o bug.
# lição: essa fase de "reunir contexto" é leitura bruta
# → é trabalho de Haiku, não de Opus.
⚠️ Por que isso é uma armadilha de custo
Se você joga essa tarefa inteira no Opus, está pagando o tier mais caro para uma fase que é pura leitura (listar pasta, abrir arquivo). O ideal muitas vezes é separar: um Haiku reúne e resume o contexto, e só o raciocínio final — se for difícil — sobe de tier. Não pague Opus para abrir arquivos.
⚖️ Tarefa grande vale, tarefa de 30s desperdiça
Há um custo fixo em disparar um subagente: ele nasce em branco, reúne contexto, depois trabalha. Para uma tarefa grande, esse custo se dilui — vale a pena. Para uma microtarefa de 30 segundos, a sobrecarga de "se situar" é maior que o trabalho em si: é desperdício. E para o caso comum, existe o atalho honesto — herdar o modelo do pai.
✓ Vale o subagente (tarefa grande)
- ✓Ler e cruzar dezenas de arquivos
- ✓Pesquisa pesada que gera parede de output
- ✓Trabalho que roda em paralelo (fan-out)
- ✓O custo de se situar se dilui no tamanho
✗ Desperdício (tarefa de 30 segundos)
- ✗Trocar uma linha que você já tem na frente
- ✗Responder algo que o maestro já sabe
- ✗Tarefa onde "reunir contexto" > o trabalho
- ✗Edição rápida no meio da conversa
🧬 inherit-from-parent — o default honesto
Se você não declarar model no subagente, ele costuma herdar o modelo do pai
(o maestro). É o comportamento padrão e quase sempre razoável: você só fixa um modelo quando tem um motivo claro
para desviar do pai.
- →Herdar — deixar sem
model: o subagente roda no modelo do maestro. Default seguro. - →Forçar pra baixo —
model: haikunum agente de busca, mesmo com maestro no Opus: economia. - →Forçar pra cima —
model: opusnum revisor de segurança, mesmo com maestro no Sonnet: qualidade onde dói.
A tabela de decisão: Modelo × Raciocínio × Custo × Quando usar
Esta é a tabela canônica do curso para escolher modelo. Leia da esquerda para a direita: cada tier tem um nível de raciocínio, um custo relativo, uma latência — e um conjunto de tarefas onde é a escolha certa. Guarde-a; ela volta na Trilha 4 quando compararmos modelos de outros provedores.
| Modelo | Raciocínio | Custo | Latência | Quando usar |
|---|---|---|---|---|
|
Haiku
o ajudante
|
Raso ache & relate |
$ o mais barato |
Baixa o mais rápido |
Escanear, buscar, resumir, ler docs, varreduras, reunir contexto bruto. |
|
Sonnet
o operário
|
Bom constrói & revisa |
$$ médio |
Média equilibrada |
Construir código, implementar passos, revisar diffs. Default quando em dúvida. |
|
Opus
o mestre
|
Profundo pensa fundo |
$$$ o mais caro |
Alta o mais lento |
Arquitetura, segurança, planejamento, depuração difícil. Exceção justificada. |
|
inherit
herda do pai
|
= do maestro o que o pai usa |
= do maestro | = do maestro | Quando não há motivo para desviar. Omita o campo model e pronto. |
💡 Como ler a tabela na prática
Comece de baixo: a tarefa é "ache e relate"? Haiku. Não? Ela "constrói ou revisa"? Sonnet. Só sobe pra Opus se você conseguir dizer em voz alta por que o raciocínio precisa ser o melhor possível. Não souber justificar? Não suba.
Exemplo real: três agentes, três modelos
A escolha de modelo mora no campo model do frontmatter. Veja três subagentes de um mesmo
projeto, cada um no tier justificado pela sua tarefa — e leia o comentário que explica
por quê cada um está onde está.
# ── 1) file-scout.md ── varre o repo atrás de um padrão
---
name: file-scout
description: Varre o repositório atrás de onde um símbolo
ou string aparece e devolve só os caminhos + linhas.
tools: Read, Grep, Glob # só leitura
model: haiku # ← é "ache e relate": tier barato basta
---
You are a fast code scout. Liste apenas os arquivos e linhas
onde o alvo aparece. Não explique, não opine. Só o mapa.
# ── 2) feature-builder.md ── implementa um passo do plano
---
name: feature-builder
description: Implementa um passo bem-definido de um plano
(uma função, uma validação, um endpoint) e roda os testes.
tools: Read, Edit, Write, Bash
model: sonnet # ← constrói código: o operário competente
---
You are a focused implementer. Implemente exatamente o passo
pedido, siga o padrão do projeto e rode os testes ao final.
# ── 3) security-reviewer.md ── caça falha de segurança
---
name: security-reviewer
description: Revisa o diff em busca de falhas de segurança
(injeção, vazamento, authz). Use após mexer em auth/pagamentos.
tools: Read, Grep, Glob # read-only: revisor não edita
model: opus # ← raciocínio de segurança: o erro é caro
---
You are a senior security reviewer. Pense como atacante.
Aponte cada risco com arquivo:linha e a gravidade. Não conserte.
Só localiza e lista. Zero raciocínio profundo → o tier mais barato e rápido é o certo.
Escreve código correto seguindo um plano. Trabalho de construção real → o default médio.
Caçar uma falha exige pensar fundo, e errar custa caro → o tier alto se justifica aqui.
Prompts prontos (copie e cole)
Três prompts para mandar o maestro casar modelo com tarefa. Repare no padrão: você diz o tier e a razão — e deixa o trabalho barato no Haiku, o caro no Opus.
Use um subagente em Haiku pra escanear /auth e me
trazer só os trechos que tocam o login. Depois,
com esse resumo, use Opus só pra decidir onde está
o bug. Não rode o Opus na varredura.
Crie um subagente "doc-summarizer" read-only com
model: haiku — a tarefa é só ler docs e resumir,
então quero o tier mais barato e rápido.
Esse é um revisor de segurança: coloque model: opus.
O erro aqui é caro, então quero o raciocínio máximo,
mesmo custando mais. Mantenha o agente read-only.
Tela simulada: o modelo de cada subagente
É assim que a escolha aparece no terminal. O maestro disparou três subagentes e a status line mostra, para cada um, qual modelo está rodando. Note o desenho: a frota de varredura em Haiku, o builder em Sonnet, e só o revisor de segurança em Opus — chefe caro, trabalhadores baratos.
↑ Recriação ilustrativa do terminal (não é screenshot real). A status line revela o modelo de cada subagente — e a frota barata carrega o grosso do trabalho.
Exercício: atribua o modelo a 6 tarefas
Para cada uma das 6 tarefas abaixo, escolha o tier — Haiku, Sonnet ou Opus — e escreva uma frase justificando. Use a tabela de decisão como guia.
As 6 tarefas
- Buscar em quais dos 300 arquivos do projeto a função
parseTokené chamada. - Decidir como reorganizar a arquitetura de pastas de um monorepo que cresceu demais.
- Implementar a máscara de telefone num campo de formulário, seguindo o padrão do projeto.
- Resumir um log de build de 4.000 linhas nos 5 erros que importam.
- Auditar um endpoint de pagamento em busca de falha de autorização.
- Revisar um diff de 60 linhas que adiciona um botão e ajusta um CSS.
✅ Critério de verificação — gabarito comentado
Confira a sua resposta contra este gabarito. Acertar o tier importa, mas acertar a razão importa mais — é ela que você vai reusar em tarefas novas.
- 1.Haiku — é "ache e relate" puro, alto volume, zero raciocínio profundo.
- 2.Opus — arquitetura: decisão de longo alcance, cara de errar.
- 3.Sonnet — construir código bem-definido seguindo um padrão: o operário.
- 4.Haiku — resumir um log é compressão de leitura, descartável e rápida.
- 5.Opus — segurança em pagamento: pensar como atacante, erro caríssimo.
- 6.Sonnet — revisar um diff trivial: trabalho de revisão padrão, sem risco alto.
Placar de tiers: Haiku ×2 · Sonnet ×2 · Opus ×2. Se você jogou tudo no Opus, releia o tópico 3 — Opus é a minoria.
Exemplo resolvido
Tarefa: "buscar onde parseToken é chamada nos 300 arquivos". Tier: Haiku. Razão: é uma varredura de "ache e relate" — alto volume, leitura descartável, nenhuma decisão difícil; pagar Sonnet ou Opus aqui seria queimar dinheiro.
✅ Resumo do módulo
Próximo módulo:
3.2 — A economia real. Chefe inteligente + frota Haiku, CLAUDE_CODE_SUBAGENT_MODEL, maxTurns e por que multiagente custa ~15× — e quando isso vale.