MÓDULO 4.3 · Trilha 4 · Avançado & cross-ambiente

đŸŽ›ïž Comparando modelos por papel

Cada papel da frota pede um cĂ©rebro diferente. Quem sĂł escaneia arquivos nĂŁo precisa do mesmo motor de quem decide arquitetura. VocĂȘ vai aprender a montar uma matriz papel × modelo e a equilibrar o triĂąngulo de ferro: custo · latĂȘncia · qualidade.

6
TĂłpicos
~30
Minutos
Avançado
NĂ­vel
Estratégia
Tipo

Imagine uma oficina mecĂąnica. VocĂȘ nĂŁo usa a chave de impacto pneumĂĄtica para apertar um parafuso de Ăłculos, nem uma chave de fenda para soltar a roda de um caminhĂŁo. Cada serviço tem a ferramenta certa — e usar a cara demais Ă© desperdĂ­cio, usar a fraca demais Ă© retrabalho. Com uma frota de subagentes Ă© igual: o papel do agente decide o modelo. Quem escaneia 200 arquivos quer velocidade e baixo custo; quem raciocina sobre uma decisĂŁo irreversĂ­vel quer o motor mais forte. O mapa abaixo Ă© o coração deste mĂłdulo: uma matriz papel × modelo.

Haiku barato · rĂĄpido Sonnet equilĂ­brio Opus raciocĂ­nio GPT/Codex 2Âș olhar 🔍 escanear 🧭 buscar 🔹 construir 🔎 revisar 🧠 raciocĂ­nio đŸ›Ąïž segurança ideal ideal ideal ideal 2Âș olhar ideal ideal cross papĂ©is simples ↑ · papĂ©is crĂ­ticos ↓ → motor mais forte →

↑ A matriz papel × modelo: cada papel cai na coluna do motor certo. PĂ­lula em destaque = padrĂŁo recomendado; tracejada = 2Âș olhar de outro provedor.

ConteĂșdo detalhado

1

đŸȘœ Opus, Sonnet e Haiku — uma escada de papĂ©is

A famĂ­lia Claude vem em trĂȘs tamanhos, e cada um tem um ponto doce. Haiku Ă© o operĂĄrio veloz: escaneia, busca, resume, lĂȘ documentação. Sonnet Ă© o profissional do dia a dia: constrĂłi cĂłdigo e revisa. Opus Ă© o arquiteto: raciocina sobre decisĂ”es difĂ­ceis, analisa segurança, pensa fundo. NĂŁo Ă© "Opus Ă© melhor logo uso Opus em tudo" — Ă© "o papel pede tal motor".

🔧 A regra da oficina

O motor certo Ă© o mais barato que ainda dĂĄ conta do papel. Subir de modelo sem necessidade Ă© queimar dinheiro e tempo; descer demais Ă© receber trabalho ruim. Pense em trĂȘs faixas:

  • ‱Haiku — papĂ©is mecĂąnicos e volumosos: varrer, grep, listar, resumir docs longos.
  • ‱Sonnet — papĂ©is de ofĂ­cio: escrever cĂłdigo, refatorar, revisar um diff, gerar testes.
  • ‱Opus — papĂ©is de juĂ­zo: arquitetura, segurança, decisĂ”es irreversĂ­veis, planos complexos.
O que Ă©:

Os trĂȘs nĂ­veis da famĂ­lia Claude organizados por papel, nĂŁo por "qual Ă© o melhor". Cada nĂ­vel troca custo e latĂȘncia por profundidade de raciocĂ­nio.

Por que aprender:

Frota inteira em Opus estoura o orçamento e fica lenta; frota inteira em Haiku entrega anålise rasa onde precisava de juízo. A escada evita os dois extremos.

Conceitos-chave:

Papel × motor · "o mais barato que dĂĄ conta" · escada Haiku → Sonnet → Opus.

⚡
Haiku
escanear · buscar · resumir
🔹
Sonnet
construir · revisar
🧠
Opus
raciocínio · segurança
2

🔀 GPT e Codex — o segundo provedor

A frota nĂŁo precisa ser de uma famĂ­lia sĂł. Os modelos GPT e o ambiente Codex (CLI da OpenAI, visto no mĂłdulo 4.2) entram como um segundo olhar: um revisor que pensa diferente do construtor. FamĂ­lias distintas erram de jeitos distintos — entĂŁo um achado que dois provedores confirmam Ă© bem mais confiĂĄvel.

no seu chat 2Âș olhar cross-provedor
vocĂȘ > O Sonnet acabou de escrever este mĂłdulo de auth.
        Peça a um revisor em GPT/Codex pra refutar:
        onde isso quebra? SĂł os furos, sem reescrever.

# construtor (Sonnet) e revisor (outra famĂ­lia) erram
# de formas diferentes — a divergĂȘncia Ă© o valor.
# o que os DOIS apontam é o que merece atenção.

đŸ›°ïž Por que misturar provedores

Um viĂ©s compartilhado Ă© o inimigo: se construtor e revisor sĂŁo o mesmo modelo, eles tendem a "concordar com o prĂłprio erro". Trocar de famĂ­lia no papel de revisor Ă© a forma barata de comprar independĂȘncia — o tema da verificação adversarial do mĂłdulo 4.1.

O que Ă©: usar modelos de outra famĂ­lia (GPT/Codex) em papĂ©is especĂ­ficos — tipicamente revisĂŁo e contraponto.
Por que aprender: independĂȘncia entre construtor e revisor reduz o ponto cego compartilhado e eleva a confiança no achado.
Conceitos-chave: segundo provedor · viĂ©s compartilhado · revisor cross-famĂ­lia · confirmação por divergĂȘncia.
3

🌐 Outros provedores — pensar por capacidade, não por marca

AlĂ©m de Anthropic e OpenAI, hĂĄ um mercado inteiro — Google (Gemini), modelos abertos rodando localmente, provedores especializados. O erro Ă© decorar nomes; o certo Ă© pensar por capacidade. Para a sua matriz, todo modelo cai numa de trĂȘs classes, e vocĂȘ encaixa o papel na classe — nĂŁo na marca da semana.

đŸŽïž

Classe "rĂĄpido & barato"

Haiku · modelos pequenos/locais

Alto volume, baixa exigĂȘncia de juĂ­zo: varrer, classificar, extrair, resumir.

⚖

Classe "equilĂ­brio"

Sonnet · GPT de uso geral · Gemini Pro

O cavalo de batalha: construir, revisar, a maioria das tarefas de ofĂ­cio.

đŸ›ïž

Classe "raciocĂ­nio profundo"

Opus · GPT de raciocínio · Gemini de ponta

DecisÔes caras e irreversíveis: arquitetura, segurança, planos longos.

📌 Pense em slots, não em nomes

Modelos novos saem toda hora. Se a sua matriz Ă© por classe (rĂĄpido / equilĂ­brio / raciocĂ­nio), trocar o modelo de uma cĂ©lula Ă© sĂł substituir o ocupante do slot — a arquitetura da frota nĂŁo muda. Isso Ă© o que mantĂ©m o sistema vivo por meses, nĂŁo dias.

O que Ă©: o universo de modelos alĂ©m das duas famĂ­lias principais, organizado em trĂȘs classes de capacidade.
Por que aprender: raciocinar por classe (nĂŁo por marca) deixa a frota durĂĄvel: trocar de modelo vira trocar o ocupante de um slot.
Conceitos-chave: capacidade × marca · trĂȘs classes · slot substituĂ­vel · durabilidade da arquitetura.
4

⚖ RaciocĂ­nio profundo × barato e rĂĄpido

Aqui estĂĄ a tensĂŁo central. Modelo forte pensa mais fundo, mas custa mais e demora mais. Modelo leve Ă© barato e instantĂąneo, mas raso. NĂŁo existe almoço grĂĄtis: vocĂȘ escolhe onde gastar profundidade. A pergunta operacional Ă© simples — o custo de errar este papel Ă© alto? Se for, suba. Se nĂŁo, desça.

↑ Suba o modelo quando


  • ↑O erro Ă© caro ou irreversĂ­vel (segurança, dinheiro, arquitetura)
  • ↑A tarefa exige juĂ­zo e sĂ­ntese, nĂŁo sĂł execução
  • ↑O contexto Ă© ambĂ­guo e precisa de interpretação fina
  • ↑É um passo Ășnico e decisivo, nĂŁo 200 repetiçÔes

↓ Desça o modelo quando


  • ↓A tarefa Ă© mecĂąnica e bem definida (grep, listar, extrair)
  • ↓O volume Ă© alto e cada passo Ă© barato de checar
  • ↓A latĂȘncia importa (vocĂȘ espera o resultado agora)
  • ↓Erro Ă© fĂĄcil de detectar e corrigir depois
raciocínio profundo forte · caro · lento barato & råpido leve · raso · instantùneo o fiel da balança = o custo de errar este papel
O que Ă©: o trade-off fundamental — profundidade de raciocĂ­nio comprada com custo e latĂȘncia.
Por que aprender: toda escolha de modelo Ă©, no fundo, decidir onde vale gastar profundidade — e a rĂ©gua Ă© o custo de errar.
Conceitos-chave: sem almoço grĂĄtis · custo de errar · subir × descer o modelo · profundidade como recurso escasso.
5

🔁 Quando trocar de modelo ou provedor por papel

Trocar de modelo tem um preço escondido: cada subagente começa do zero e precisa reunir o contexto de novo. Por isso a troca compensa em tarefas grandes, nĂŁo em recados de 30 segundos. E hĂĄ dois eixos de troca: trocar de nĂ­vel (Haiku↔Sonnet↔Opus) por profundidade, e trocar de provedor (Claude↔GPT) por independĂȘncia.

1

O papel mudou de natureza

De executar para decidir (ou vice-versa).

O agente que varria agora precisa concluir qual caminho seguir. Subiu de "execução" para "juízo" → suba o modelo.

2

VocĂȘ quer um olhar independente

Revisar o que outro modelo construiu.

O construtor é Claude; o revisor vira GPT/Codex. Troca de provedor no papel de revisor para fugir do viés compartilhado.

3

O custo ou a latĂȘncia apertaram

A conta subiu ou a espera incomoda.

Aquele papel volumoso rodando em Sonnet poderia ser Haiku? Se o erro Ă© barato de checar, desça e economize — sem dĂł.

⚠ A armadilha do "subagente começa em branco"

Cada subagente reĂșne o contexto do zero. Trocar para um modelo caro num papel pequeno faz o custo de "reunir contexto" engolir o ganho. Troca de modelo rende quando a tarefa Ă© grande o bastante para amortizar essa partida fria — caso contrĂĄrio, Ă© desperdĂ­cio disfarçado de cuidado.

O que Ă©: os gatilhos concretos para trocar de nĂ­vel (profundidade) ou de provedor (independĂȘncia) num papel.
Por que aprender: troca cega custa caro; saber quando trocar Ă© o que transforma a matriz num sistema econĂŽmico, nĂŁo num enfeite.
Conceitos-chave: troca de nĂ­vel × troca de provedor · partida fria · amortizar o contexto · tarefa grande compensa.
6

🚁 Frota heterogĂȘnea — o triĂąngulo custo · latĂȘncia · qualidade

O destino Ă© uma frota heterogĂȘnea: vĂĄrios subagentes apontando para modelos diferentes, cada um no seu papel. NĂŁo Ă© um sistema homogĂȘneo "tudo Opus" nem "tudo Haiku" — Ă© uma mistura desenhada. E toda mistura vive sob trĂȘs forças que puxam em direçÔes opostas: custo, latĂȘncia e qualidade. VocĂȘ nĂŁo maximiza as trĂȘs; vocĂȘ as equilibra por papel.

Papel Modelo tĂ­pico Custo LatĂȘncia Qualidade exigida
🔍 escanear haiku baixo baixíssima rasa basta
🧭 buscar haiku baixo baixa rasa basta
🔹 construir sonnet mĂ©dio mĂ©dia de ofĂ­cio
🔎 revisar sonnet / GPT mĂ©dio mĂ©dia crĂ­tica
🧠 raciocínio opus alto alta máxima
đŸ›Ąïž segurança opus + GPT alto alta mĂĄxima

↑ A mesma matriz, agora com o trade-off explĂ­cito por linha. Repare: onde a qualidade exigida sobe, custo e latĂȘncia sobem junto — e isso Ă© aceitĂĄvel sĂł nos papĂ©is crĂ­ticos.

💡 "Escolha 2 de 3" — por papel

Custo baixo, latĂȘncia baixa e qualidade mĂĄxima ao mesmo tempo nĂŁo existem. Um papel de varredura aceita "barato + rĂĄpido" e abre mĂŁo de profundidade; um papel de segurança aceita "caro + lento" para comprar qualidade. A frota heterogĂȘnea Ă© justamente fazer essa escolha papel a papel, em vez de uma escolha Ășnica para tudo.

O que Ă©: uma frota com modelos misturados, equilibrando custo, latĂȘncia e qualidade em cada papel.
Por que aprender: Ă© o estado final da maestria: a frota inteira fica barata e rĂĄpida onde dĂĄ, e forte sĂł onde precisa.
Conceitos-chave: frota heterogĂȘnea · triĂąngulo custo/latĂȘncia/qualidade · "escolha 2 de 3" · mistura desenhada.
📄

Exemplo real: uma frota heterogĂȘnea em arquivos

Uma frota heterogĂȘnea nĂŁo Ă© um arquivo sĂł — Ă© um conjunto de subagentes, cada um com seu campo model apontando para o motor do seu papel. Abaixo, quatro .md recortados lado a lado: repare como o papel (na description) e o modelo andam juntos.

.claude/agents/ — quatro arquivos da frota Markdown + YAML
# ── file-scanner.md ─ papel: ESCANEAR (volumoso, raso) ──
name: file-scanner
description: Varre o repo e lista arquivos/sĂ­mbolos
  relevantes. Use para mapear antes de qualquer leitura.
tools: Grep, Glob                # sĂł localizar
model: haiku                      # barato + rĂĄpido

# ── builder.md ─ papel: CONSTRUIR (de ofício) ──────────
name: builder
description: Implementa a mudança descrita no plano.
tools: Read, Edit, Write, Bash
model: sonnet                     # equilĂ­brio

# ── arch-thinker.md ─ papel: RACIOCÍNIO (juízo) ────────
name: arch-thinker
description: Decide a arquitetura e os trade-offs de
  uma mudança grande. Use ANTES de construir.
tools: Read, Grep
model: opus                       # raciocĂ­nio profundo

# ── cross-reviewer.md ─ papel: REVISAR (2Âș olhar) ──────
name: cross-reviewer
description: Refuta o trabalho do builder buscando
  furos. Use após qualquer mudança sensível.
tools: Read, Grep
model: gpt-codex     # OUTRA famĂ­lia = independĂȘncia

đŸ§© O que muda de arquivo para arquivo

  • description — declara o papel (escanear / construir / raciocinar / revisar).
  • model — segue o papel: papel raso → haiku, juĂ­zo → opus.
  • tools — papĂ©is de juĂ­zo/revisĂŁo ficam read-only (Read, Grep).
  • provedor — o revisor troca de famĂ­lia de propĂłsito.

🎯 Por que isto Ă© "heterogĂȘneo"

  • Quatro agentes, trĂȘs motores diferentes + um provedor externo.
  • O custo total cai: o trabalho volumoso roda em haiku.
  • A qualidade sobe onde importa: opus no raciocĂ­nio.
  • A revisĂŁo Ă© independente: outra famĂ­lia erra diferente.
⌚

Prompts prontos (copie e cole)

TrĂȘs prompts para o maestro distribuir modelos por papel. O padrĂŁo Ă© sempre nomear o papel e justificar o motor — barato onde dĂĄ, forte onde precisa, independente na revisĂŁo.

Prompt 1 — atribuir modelo a cada papel monta a frota
Para este job, monte uma frota por papel: use Haiku pra
escanear e buscar, Sonnet pra construir e revisar, e Opus
sĂł pro raciocĂ­nio de arquitetura. Justifique cada escolha
em uma linha (custo/latĂȘncia/qualidade).
Prompt 2 — segundo olhar cross-provedor compra independĂȘncia
O builder (Sonnet) terminou. Agora rode um revisor em
outro provedor (GPT/Codex) sĂł pra refutar: liste os furos
que um modelo da MESMA famĂ­lia talvez nĂŁo veja. NĂŁo
reescreva — só aponte.
Prompt 3 — cortar custo sem perder qualidade otimiza o triñngulo
Revise minha frota: que papéis hoje em Sonnet poderiam
cair pra Haiku sem risco (erro barato de checar)? E que
papéis merecem subir pra Opus porque o erro seria caro?
Devolva só a matriz papel → modelo ajustada.
đŸ–„ïž

Tela simulada: a frota heterogĂȘnea rodando

É assim que a frota heterogĂȘnea aparece no terminal: cada subagente roda no modelo do seu papel, e a coluna do meio mostra qual motor cada um estĂĄ usando. Repare no custo relativo Ă  direita — os papĂ©is volumosos em Haiku custam quase nada; sĂł o raciocĂ­nio em Opus pesa.

claude code · refatorar-auth · frota heterogĂȘnea ⏱ 01:12
● file-scannerHaiku
$ ·
● grep-symbolsHaiku
$ ·
● builderSonnet
$$ ··
● arch-thinkerOpus
$$$ ···
● cross-reviewerGPT/Codex
$$ ··
5 subagentes · 3 motores + 1 provedor externo · síntese após os relatórios
maestro · Opus
custo da frota
38% do teto

↑ Recriação ilustrativa do terminal (nĂŁo Ă© screenshot real). Cada subagente no motor do seu papel; o custo concentra-se sĂł no Opus do raciocĂ­nio.

🎯

Exercício — monte a sua matriz papel × modelo

Pegue um job real seu (um projeto, uma investigação, uma migração) e desenhe a frota: para cada um dos seis papĂ©is — escanear, buscar, construir, revisar, raciocĂ­nio, segurança — escolha um modelo e justifique pelo triĂąngulo custo · latĂȘncia · qualidade.

Como fazer

  1. Liste os seis papéis (use a matriz do topo como gabarito de partida).
  2. Para cada papel, escolha o modelo: haiku, sonnet, opus ou outro provedor.
  3. Escreva uma linha por papel justificando: o erro aqui Ă© caro? o volume Ă© alto? a latĂȘncia importa?
  4. Marque pelo menos um papel que ganha um 2Âș olhar de outro provedor (e diga por quĂȘ).
Papel Seu modelo Justificativa (1 linha)
🔍 escanear_____________________________________
🧭 buscar_____________________________________
🔹 construir_____________________________________
🔎 revisar_____________________________________
🧠 raciocínio_____________________________________
đŸ›Ąïž segurança_____________________________________

✅ CritĂ©rio de verificação — como saber que acertou

A sua matriz estĂĄ bem montada se ela passar nestes quatro testes:

  • →NĂŁo Ă© homogĂȘnea: aparecem pelo menos dois modelos diferentes (se deu tudo Opus ou tudo Haiku, refaça).
  • →Os papĂ©is crĂ­ticos sobem: raciocĂ­nio e segurança usam o motor mais forte da sua matriz.
  • →Os papĂ©is volumosos descem: escanear e buscar usam o motor mais barato/rĂĄpido.
  • →HĂĄ um 2Âș olhar: pelo menos um papel de revisĂŁo/segurança ganha um provedor diferente do construtor.

Cada justificativa deve citar ao menos um vĂ©rtice do triĂąngulo (custo, latĂȘncia ou qualidade). Justificativa "porque Ă© melhor" nĂŁo conta.

Exemplo resolvido (uma linha)

Papel: đŸ›Ąïž segurança · Modelo: opus + 2Âș olhar em GPT/Codex. Justificativa: o erro de segurança Ă© caro e irreversĂ­vel (qualidade mĂĄxima vale custo e latĂȘncia altos); o 2Âș provedor compra independĂȘncia contra viĂ©s compartilhado. Passa nos quatro testes.

✅ Resumo do módulo

✓
Escada de papĂ©is — Haiku escaneia/busca, Sonnet constrĂłi/revisa, Opus raciocina/cuida de segurança. O papel pede o motor.
✓
GPT / Codex — segundo provedor como revisor independente: famílias diferentes erram diferente.
✓
Outros provedores — pense por classe (rĂĄpido/equilĂ­brio/raciocĂ­nio), nĂŁo por marca; o slot Ă© substituĂ­vel.
✓
O trade-off — profundidade custa dinheiro e tempo; a rĂ©gua Ă© o custo de errar o papel.
✓
Quando trocar — por nĂ­vel (profundidade) ou por provedor (independĂȘncia); sĂł compensa em tarefa grande (partida fria).
✓
Frota heterogĂȘnea — modelos misturados por papel, equilibrando o triĂąngulo custo · latĂȘncia · qualidade ("escolha 2 de 3").

PrĂłximo mĂłdulo:

4.4 — Segurança. Baixar .md de terceiros, prompt injection e o subagente verificador read-only.