Imagine uma oficina mecĂąnica. VocĂȘ nĂŁo usa a chave de impacto pneumĂĄtica para apertar um parafuso de Ăłculos, nem uma chave de fenda para soltar a roda de um caminhĂŁo. Cada serviço tem a ferramenta certa â e usar a cara demais Ă© desperdĂcio, usar a fraca demais Ă© retrabalho. Com uma frota de subagentes Ă© igual: o papel do agente decide o modelo. Quem escaneia 200 arquivos quer velocidade e baixo custo; quem raciocina sobre uma decisĂŁo irreversĂvel quer o motor mais forte. O mapa abaixo Ă© o coração deste mĂłdulo: uma matriz papel Ă modelo.
â A matriz papel Ă modelo: cada papel cai na coluna do motor certo. PĂlula em destaque = padrĂŁo recomendado; tracejada = 2Âș olhar de outro provedor.
ConteĂșdo detalhado
đȘ Opus, Sonnet e Haiku â uma escada de papĂ©is
A famĂlia Claude vem em trĂȘs tamanhos, e cada um tem um ponto doce. Haiku Ă© o operĂĄrio veloz: escaneia, busca, resume, lĂȘ documentação. Sonnet Ă© o profissional do dia a dia: constrĂłi cĂłdigo e revisa. Opus Ă© o arquiteto: raciocina sobre decisĂ”es difĂceis, analisa segurança, pensa fundo. NĂŁo Ă© "Opus Ă© melhor logo uso Opus em tudo" â Ă© "o papel pede tal motor".
đ§ A regra da oficina
O motor certo Ă© o mais barato que ainda dĂĄ conta do papel. Subir de modelo sem necessidade Ă© queimar dinheiro e tempo; descer demais Ă© receber trabalho ruim. Pense em trĂȘs faixas:
- âąHaiku â papĂ©is mecĂąnicos e volumosos: varrer, grep, listar, resumir docs longos.
- âąSonnet â papĂ©is de ofĂcio: escrever cĂłdigo, refatorar, revisar um diff, gerar testes.
- âąOpus â papĂ©is de juĂzo: arquitetura, segurança, decisĂ”es irreversĂveis, planos complexos.
Os trĂȘs nĂveis da famĂlia Claude organizados por papel, nĂŁo por "qual Ă© o melhor". Cada nĂvel troca custo e latĂȘncia por profundidade de raciocĂnio.
Frota inteira em Opus estoura o orçamento e fica lenta; frota inteira em Haiku entrega anĂĄlise rasa onde precisava de juĂzo. A escada evita os dois extremos.
Papel Ă motor · "o mais barato que dĂĄ conta" · escada Haiku â Sonnet â Opus.
đ GPT e Codex â o segundo provedor
A frota nĂŁo precisa ser de uma famĂlia sĂł. Os modelos GPT e o ambiente Codex (CLI da OpenAI, visto no mĂłdulo 4.2) entram como um segundo olhar: um revisor que pensa diferente do construtor. FamĂlias distintas erram de jeitos distintos â entĂŁo um achado que dois provedores confirmam Ă© bem mais confiĂĄvel.
vocĂȘ > O Sonnet acabou de escrever este mĂłdulo de auth.
Peça a um revisor em GPT/Codex pra refutar:
onde isso quebra? SĂł os furos, sem reescrever.
# construtor (Sonnet) e revisor (outra famĂlia) erram
# de formas diferentes â a divergĂȘncia Ă© o valor.
# o que os DOIS apontam é o que merece atenção.
đ°ïž Por que misturar provedores
Um viĂ©s compartilhado Ă© o inimigo: se construtor e revisor sĂŁo o mesmo modelo, eles tendem a "concordar com o prĂłprio erro". Trocar de famĂlia no papel de revisor Ă© a forma barata de comprar independĂȘncia â o tema da verificação adversarial do mĂłdulo 4.1.
đ Outros provedores â pensar por capacidade, nĂŁo por marca
AlĂ©m de Anthropic e OpenAI, hĂĄ um mercado inteiro â Google (Gemini), modelos abertos rodando localmente, provedores especializados. O erro Ă© decorar nomes; o certo Ă© pensar por capacidade. Para a sua matriz, todo modelo cai numa de trĂȘs classes, e vocĂȘ encaixa o papel na classe â nĂŁo na marca da semana.
Classe "rĂĄpido & barato"
Haiku · modelos pequenos/locais
Alto volume, baixa exigĂȘncia de juĂzo: varrer, classificar, extrair, resumir.
Classe "equilĂbrio"
Sonnet · GPT de uso geral · Gemini Pro
O cavalo de batalha: construir, revisar, a maioria das tarefas de ofĂcio.
Classe "raciocĂnio profundo"
Opus · GPT de raciocĂnio · Gemini de ponta
DecisĂ”es caras e irreversĂveis: arquitetura, segurança, planos longos.
đ Pense em slots, nĂŁo em nomes
Modelos novos saem toda hora. Se a sua matriz Ă© por classe (rĂĄpido / equilĂbrio / raciocĂnio), trocar o modelo de uma cĂ©lula Ă© sĂł substituir o ocupante do slot â a arquitetura da frota nĂŁo muda. Isso Ă© o que mantĂ©m o sistema vivo por meses, nĂŁo dias.
âïž RaciocĂnio profundo Ă barato e rĂĄpido
Aqui estĂĄ a tensĂŁo central. Modelo forte pensa mais fundo, mas custa mais e demora mais. Modelo leve Ă© barato e instantĂąneo, mas raso. NĂŁo existe almoço grĂĄtis: vocĂȘ escolhe onde gastar profundidade. A pergunta operacional Ă© simples â o custo de errar este papel Ă© alto? Se for, suba. Se nĂŁo, desça.
â Suba o modelo quandoâŠ
- âO erro Ă© caro ou irreversĂvel (segurança, dinheiro, arquitetura)
- âA tarefa exige juĂzo e sĂntese, nĂŁo sĂł execução
- âO contexto Ă© ambĂguo e precisa de interpretação fina
- âĂ um passo Ășnico e decisivo, nĂŁo 200 repetiçÔes
â Desça o modelo quandoâŠ
- âA tarefa Ă© mecĂąnica e bem definida (grep, listar, extrair)
- âO volume Ă© alto e cada passo Ă© barato de checar
- âA latĂȘncia importa (vocĂȘ espera o resultado agora)
- âErro Ă© fĂĄcil de detectar e corrigir depois
đ Quando trocar de modelo ou provedor por papel
Trocar de modelo tem um preço escondido: cada subagente começa do zero e precisa reunir o contexto de novo. Por isso a troca compensa em tarefas grandes, nĂŁo em recados de 30 segundos. E hĂĄ dois eixos de troca: trocar de nĂvel (HaikuâSonnetâOpus) por profundidade, e trocar de provedor (ClaudeâGPT) por independĂȘncia.
O papel mudou de natureza
De executar para decidir (ou vice-versa).
O agente que varria agora precisa concluir qual caminho seguir. Subiu de "execução" para "juĂzo" â suba o modelo.
VocĂȘ quer um olhar independente
Revisar o que outro modelo construiu.
O construtor é Claude; o revisor vira GPT/Codex. Troca de provedor no papel de revisor para fugir do viés compartilhado.
O custo ou a latĂȘncia apertaram
A conta subiu ou a espera incomoda.
Aquele papel volumoso rodando em Sonnet poderia ser Haiku? Se o erro Ă© barato de checar, desça e economize â sem dĂł.
â ïž A armadilha do "subagente começa em branco"
Cada subagente reĂșne o contexto do zero. Trocar para um modelo caro num papel pequeno faz o custo de "reunir contexto" engolir o ganho. Troca de modelo rende quando a tarefa Ă© grande o bastante para amortizar essa partida fria â caso contrĂĄrio, Ă© desperdĂcio disfarçado de cuidado.
đ Frota heterogĂȘnea â o triĂąngulo custo · latĂȘncia · qualidade
O destino Ă© uma frota heterogĂȘnea: vĂĄrios subagentes apontando para modelos diferentes, cada um no seu papel. NĂŁo Ă© um sistema homogĂȘneo "tudo Opus" nem "tudo Haiku" â Ă© uma mistura desenhada. E toda mistura vive sob trĂȘs forças que puxam em direçÔes opostas: custo, latĂȘncia e qualidade. VocĂȘ nĂŁo maximiza as trĂȘs; vocĂȘ as equilibra por papel.
| Papel | Modelo tĂpico | Custo | LatĂȘncia | Qualidade exigida |
|---|---|---|---|---|
| đ escanear | haiku | baixo | baixĂssima | rasa basta |
| đ§ buscar | haiku | baixo | baixa | rasa basta |
| đš construir | sonnet | mĂ©dio | mĂ©dia | de ofĂcio |
| đ revisar | sonnet / GPT | mĂ©dio | mĂ©dia | crĂtica |
| đ§ raciocĂnio | opus | alto | alta | mĂĄxima |
| đĄïž segurança | opus + GPT | alto | alta | mĂĄxima |
â A mesma matriz, agora com o trade-off explĂcito por linha. Repare: onde a qualidade exigida sobe, custo e latĂȘncia sobem junto â e isso Ă© aceitĂĄvel sĂł nos papĂ©is crĂticos.
đĄ "Escolha 2 de 3" â por papel
Custo baixo, latĂȘncia baixa e qualidade mĂĄxima ao mesmo tempo nĂŁo existem. Um papel de varredura aceita "barato + rĂĄpido" e abre mĂŁo de profundidade; um papel de segurança aceita "caro + lento" para comprar qualidade. A frota heterogĂȘnea Ă© justamente fazer essa escolha papel a papel, em vez de uma escolha Ășnica para tudo.
Exemplo real: uma frota heterogĂȘnea em arquivos
Uma frota heterogĂȘnea nĂŁo Ă© um arquivo sĂł â Ă© um conjunto de subagentes, cada um com seu campo
model apontando para o motor do seu papel. Abaixo, quatro
.md recortados lado a lado: repare como o papel
(na description) e o modelo andam juntos.
# ââ file-scanner.md â papel: ESCANEAR (volumoso, raso) ââ
name: file-scanner
description: Varre o repo e lista arquivos/sĂmbolos
relevantes. Use para mapear antes de qualquer leitura.
tools: Grep, Glob # sĂł localizar
model: haiku # barato + rĂĄpido
# ââ builder.md â papel: CONSTRUIR (de ofĂcio) ââââââââââ
name: builder
description: Implementa a mudança descrita no plano.
tools: Read, Edit, Write, Bash
model: sonnet # equilĂbrio
# ââ arch-thinker.md â papel: RACIOCĂNIO (juĂzo) ââââââââ
name: arch-thinker
description: Decide a arquitetura e os trade-offs de
uma mudança grande. Use ANTES de construir.
tools: Read, Grep
model: opus # raciocĂnio profundo
# ââ cross-reviewer.md â papel: REVISAR (2Âș olhar) ââââââ
name: cross-reviewer
description: Refuta o trabalho do builder buscando
furos. Use apĂłs qualquer mudança sensĂvel.
tools: Read, Grep
model: gpt-codex # OUTRA famĂlia = independĂȘncia
đ§© O que muda de arquivo para arquivo
- description â declara o papel (escanear / construir / raciocinar / revisar).
- model â segue o papel: papel raso â haiku, juĂzo â opus.
- tools â papĂ©is de juĂzo/revisĂŁo ficam read-only (Read, Grep).
- provedor â o revisor troca de famĂlia de propĂłsito.
đŻ Por que isto Ă© "heterogĂȘneo"
- Quatro agentes, trĂȘs motores diferentes + um provedor externo.
- O custo total cai: o trabalho volumoso roda em haiku.
- A qualidade sobe onde importa: opus no raciocĂnio.
- A revisĂŁo Ă© independente: outra famĂlia erra diferente.
Prompts prontos (copie e cole)
TrĂȘs prompts para o maestro distribuir modelos por papel. O padrĂŁo Ă© sempre nomear o papel e justificar o motor â barato onde dĂĄ, forte onde precisa, independente na revisĂŁo.
Para este job, monte uma frota por papel: use Haiku pra
escanear e buscar, Sonnet pra construir e revisar, e Opus
sĂł pro raciocĂnio de arquitetura. Justifique cada escolha
em uma linha (custo/latĂȘncia/qualidade).
O builder (Sonnet) terminou. Agora rode um revisor em
outro provedor (GPT/Codex) sĂł pra refutar: liste os furos
que um modelo da MESMA famĂlia talvez nĂŁo veja. NĂŁo
reescreva â sĂł aponte.
Revise minha frota: que papéis hoje em Sonnet poderiam
cair pra Haiku sem risco (erro barato de checar)? E que
papéis merecem subir pra Opus porque o erro seria caro?
Devolva sĂł a matriz papel â modelo ajustada.
Tela simulada: a frota heterogĂȘnea rodando
Ă assim que a frota heterogĂȘnea aparece no terminal: cada subagente roda no modelo do seu papel, e a coluna do meio mostra qual motor cada um estĂĄ usando. Repare no custo relativo Ă direita â os papĂ©is volumosos em Haiku custam quase nada; sĂł o raciocĂnio em Opus pesa.
â Recriação ilustrativa do terminal (nĂŁo Ă© screenshot real). Cada subagente no motor do seu papel; o custo concentra-se sĂł no Opus do raciocĂnio.
ExercĂcio â monte a sua matriz papel Ă modelo
Pegue um job real seu (um projeto, uma investigação, uma migração) e desenhe a frota: para cada um dos seis papĂ©is â escanear, buscar, construir, revisar, raciocĂnio, segurança â escolha um modelo e justifique pelo triĂąngulo custo · latĂȘncia · qualidade.
Como fazer
- Liste os seis papéis (use a matriz do topo como gabarito de partida).
- Para cada papel, escolha o modelo:
haiku,sonnet,opusou outro provedor. - Escreva uma linha por papel justificando: o erro aqui Ă© caro? o volume Ă© alto? a latĂȘncia importa?
- Marque pelo menos um papel que ganha um 2Âș olhar de outro provedor (e diga por quĂȘ).
| Papel | Seu modelo | Justificativa (1 linha) |
|---|---|---|
| đ escanear | ______ | _______________________________ |
| đ§ buscar | ______ | _______________________________ |
| đš construir | ______ | _______________________________ |
| đ revisar | ______ | _______________________________ |
| đ§ raciocĂnio | ______ | _______________________________ |
| đĄïž segurança | ______ | _______________________________ |
â CritĂ©rio de verificação â como saber que acertou
A sua matriz estĂĄ bem montada se ela passar nestes quatro testes:
- âNĂŁo Ă© homogĂȘnea: aparecem pelo menos dois modelos diferentes (se deu tudo Opus ou tudo Haiku, refaça).
- âOs papĂ©is crĂticos sobem: raciocĂnio e segurança usam o motor mais forte da sua matriz.
- âOs papĂ©is volumosos descem: escanear e buscar usam o motor mais barato/rĂĄpido.
- âHĂĄ um 2Âș olhar: pelo menos um papel de revisĂŁo/segurança ganha um provedor diferente do construtor.
Cada justificativa deve citar ao menos um vĂ©rtice do triĂąngulo (custo, latĂȘncia ou qualidade). Justificativa "porque Ă© melhor" nĂŁo conta.
Exemplo resolvido (uma linha)
Papel: đĄïž segurança · Modelo: opus + 2Âș olhar em GPT/Codex. Justificativa: o erro de segurança Ă© caro e irreversĂvel (qualidade mĂĄxima vale custo e latĂȘncia altos); o 2Âș provedor compra independĂȘncia contra viĂ©s compartilhado. Passa nos quatro testes.
â Resumo do mĂłdulo
PrĂłximo mĂłdulo:
4.4 â Segurança. Baixar .md de terceiros, prompt injection e o subagente verificador read-only.