Imagine pedir para o mesmo engenheiro que escreveu o código revisá-lo. Ele sabe o que quis dizer, então lê o que imaginou escrever — não o que escreveu de fato. O mesmo acontece com um LLM: se ele construiu o resultado numa sessão, carrega o raciocínio daquela sessão. Um segundo agente, com contexto fresco, enxerga o que o primeiro normalizou ou ignorou. Esse é o princípio do revisor imparcial.
↑ Builder acumula contexto (e viés). Reviewer começa limpo — julga o produto, não o esforço.
Conteúdo detalhado
🧠 Contexto fresco = sem viés
Um agente que construiu algo internalizou o raciocínio que levou ao resultado. Quando pedimos para ele revisar, ele não lê o resultado com olhos novos — ele lê com os olhos de quem já sabe a intenção. Gaps ficam invisíveis porque foram preenchidos mentalmente durante a construção. Um segundo agente não tem esse contexto: ele vê apenas o artefato final.
💡 O efeito do "conhecimento maldito"
Em psicologia cognitiva, o curse of knowledge é a dificuldade de imaginar não saber algo que você já sabe. Um builder com muita informação acumulada sofre exatamente isso: não consegue mais ver o resultado como um estranho veria. O revisor, começando do zero, é esse estranho.
- •Builder — conhece o caminho; pode não ver que a chegada é confusa.
- •Reviewer — só vê a chegada; reporta o que está faltando sem desculpas.
- •Contexto fresco — a propriedade mais valiosa do revisor. Não tente "passar contexto" extra para ele antes.
✓ Revisor eficaz
- ✓Recebe só o artefato final
- ✓Não sabe como o builder chegou lá
- ✓Aplica critérios explícitos de qualidade
- ✓Reporta falhas sem "dar o benefício da dúvida"
✗ Anti-padrão
- ✗Pedir ao builder que "releia o que fez"
- ✗Dar ao revisor todo o histórico da conversa
- ✗Pedir revisão no mesmo turno que a construção
- ✗Instruir o revisor a "entender o contexto antes"
A propriedade de iniciar uma avaliação sem o raciocínio que produziu o artefato avaliado — eliminando o viés de autoria.
Sem entender esse princípio, o desenvolvedor tenta economizar chamadas usando o mesmo agente para construir e revisar — e obtém o pior dos dois mundos.
viés de autoria · curse of knowledge · contexto como ativo (e como passivo) · separação de papéis.
⚖️ Julga o resultado, não o processo
O revisor não sabe — e não precisa saber — quantas iterações o builder fez, quais alternativas considerou, ou que pressão de tempo existia. Ele recebe o artefato e aplica critérios objetivos: o código compila? os testes passam? o plano tem premissas verificáveis? Isso elimina o efeito esforço: a tendência de julgar um resultado como bom porque o processo foi trabalhoso.
Builder entrega o artefato
Código, plano, resumo de pesquisa — qualquer saída que possa ser julgada.
Revisor recebe só o artefato + critérios
Sem histórico, sem "contexto do porquê". Apenas: "avalie isto com estes critérios".
Veredito separado do esforço
O revisor não sabe se o builder sofreu. Isso é uma feature, não um bug.
📊 O efeito prático
Em code review humano, estudos mostram que revisores que sabem "quantas horas" foram gastas tendem a aprovar código com mais falhas — o esforço percebido infla a avaliação. Separar builder de reviewer elimina essa variável.
Para LLMs, o efeito é ainda mais direto: um modelo que construiu algo em 50 turnos de raciocínio tem um viés de consistência interna — tende a validar o que produziu.
A regra de ouro do revisor: avaliar o artefato pelos seus méritos, independentemente do processo que o gerou.
Sem essa clareza, os critérios de revisão se misturam com a história de como foi feito — e o veredito perde objetividade.
efeito esforço · critérios explícitos · veredito orientado a artefato · separação processo / produto.
✍️ Quem constrói escreve, quem valida verifica
Este é o princípio dos quatro olhos transposto para subagentes. O builder tem permissão de escrever, criar, modificar. O revisor tem permissão de ler, analisar, reportar — nunca de editar diretamente. Essa separação de ferramentas no frontmatter do agente é o que garante que o revisor não "consertar enquanto revisa" e encobrir os problemas encontrados.
💡 Por que bloquear Edit no revisor
Se o revisor pode editar, ele tende a "resolver enquanto revisa" — o problema some do relatório final, mas o fix introduzido não foi revisado por ninguém. A separação tools=Read força o revisor a reportar; quem decide se e como consertar é o orquestrador.
A divisão formal de permissões de ferramentas entre o agente que produz e o agente que avalia.
Ferramentas no frontmatter são a única barreira confiável — não instruções de texto que o modelo pode ignorar sob pressão.
princípio dos quatro olhos · tools=Read · relatório vs. diff · separação de permissões.
💻 Aplicar a código
O code-reviewer é o caso mais claro. O agente builder escreve o diff; o code-reviewer recebe o diff e aplica critérios de correção, segurança e cobertura de testes — sem saber quantas versões o builder descartou. A saída é um relatório de achados, não uma reescrita.
⚡ O que o code-reviewer checa
- • bugs lógicos
- • edge cases ignorados
- • tratamento de erro ausente
- • inputs não sanitizados
- • secrets em código
- • SQL/command injection
- • cobertura de happy path
- • testes de caso negativo
- • mocks ausentes
Usar um agente revisor especializado para avaliar código produzido por outro agente, com critérios explícitos de qualidade.
Código gerado por LLM tem padrões de erro específicos (tratamento silencioso de exceções, mocks que nunca falham) que o mesmo modelo tende a repetir e não detectar na autoprodução.
code-reviewer · diff como input · relatório de achados · critérios de correção / segurança / testes.
📋 Aplicar a plano — o plan-roaster
Um plano de implementação tem um problema diferente do código: ele é internamente coerente por construção. Quem planejou eliminou as contradições no processo — mas pode ter inserido premissas falsas ou deixado perguntas sem resposta. O plan-roaster é um revisor que recebe o plano e faz exatamente as perguntas incômodas que o autor não quis se fazer.
Premissas explícitas?
"Este plano assume que X está disponível. Se não estiver, a fase 2 falha."
Estimativas verificáveis?
"'2 dias' para migrar o banco — com base em quê? Tamanho da tabela? Downtime tolerado?"
Riscos sem mitigação?
"A task 3 depende da task 7, mas a task 7 tem dependência externa não controlada."
Rollback definido?
"Se a fase 2 falhar na metade, há como reverter sem impacto no prod?"
Um agente revisor especializado em questionar planos, não em aprová-los — seu papel é encontrar lacunas antes de elas virarem problemas de execução.
Planos gerados por LLM são fluentes e coerentes na forma, o que esconde premissas ocultas. Um revisor externo força a explicitação dessas premissas.
plan-roaster · premissas ocultas · perguntas incômodas · coerência interna vs. correção externa.
🔬 Aplicar a pesquisa
Pesquisa feita por subagente sofre de viés de confirmação acelerado: o agente busca fontes e, à medida que acumula evidências, tende a reforçar a hipótese que emergiu cedo. Um revisor de pesquisa não questiona se o texto é bonito — questiona se as afirmações são verificáveis e se existem contradições nas fontes que o builder pode ter minimizado.
Afirmações têm fonte?
Cada claim deve ser rastreável. "LLMs alcançam 95% de precisão" — em qual benchmark, qual data?
Contradições suprimidas?
Existem fontes que contradizem a conclusão? O resumo as menciona ou as ignorou?
Escopo correto?
A pesquisa responde à pergunta original ou deriva para um tema relacionado mas diferente?
Revisão de pesquisa focada em verificabilidade, cobertura de contradições e aderência ao escopo — não em estilo ou fluência.
Pesquisa de subagente é persuasiva pela qualidade do texto; só um revisor com critérios objetivos detecta quando a persuasão está cobrindo lacunas factuais.
viés de confirmação · verificabilidade de claims · contradições suprimidas · aderência ao escopo.
🚀 O maior unlock de qualidade
Adicionar um revisor imparcial ao final de qualquer pipeline de subagentes é a mudança de maior impacto por menor custo. Um agente Haiku como revisor — que custa fração do builder — pode detectar erros que o modelo mais caro não detectaria em si mesmo. A assimetria é brutal: revisar é mais barato que construir, mas tem valor de seguro sobre todo o trabalho anterior.
⚡ A equação do revisor
Um revisor Haiku sobre um pipeline Opus revisa tudo por centavos. Se pegar um único bug crítico ou premissa falsa em um plano, pagou todo o curso.
✓ Sempre revisar quando
- ✓O resultado vai para produção
- ✓O plano envolve decisões irreversíveis
- ✓A pesquisa embasará uma decisão estratégica
- ✓O pipeline tem mais de 2 subagentes
○ Opcional quando
- ○É um rascunho descartável
- ○Você vai revisar manualmente de qualquer forma
- ○O output é só para referência interna
O padrão de adicionar sistematicamente um revisor de baixo custo ao final de pipelines para detectar falhas antes da entrega.
É a mudança com maior ROI em qualquer sistema de subagentes — detecta erros que o builder nunca encontraria em si mesmo, por fração do custo.
assimetria custo/valor · revisor de baixo custo · valor de seguro · padrão de qualidade sistêmica.
Exemplo real: code-reviewer e plan-roaster
Dois arquivos .md que implementam o padrão do revisor imparcial.
Note como ambos usam tools: Read, Grep, Glob — sem permissão de escrita —
e instruem explicitamente a reportar, não consertar.
---
name: code-reviewer
description: Revisa o diff atual em busca de bugs,
falhas de segurança e testes ausentes. Use após
qualquer mudança de código — especialmente antes
de commitar.
tools: Read, Grep, Glob # apenas leitura
model: haiku # custo baixo, revisão precisa
---
You are an impartial senior code reviewer.
You have no knowledge of how this code was written.
Steps:
1. Run git diff HEAD to see the current changes.
2. Read each changed file completely.
3. Check for: correctness bugs, security issues,
missing tests, and unhandled edge cases.
Output: A numbered list of findings, severity
(critical/major/minor), and the exact line.
Rules:
- Do NOT edit, fix, or rewrite anything.
- Report only — the orchestrator decides what to fix.
- If nothing is wrong, say so explicitly.
---
name: plan-roaster
description: Questiona planos de implementação com
ceticismo construtivo. Use SEMPRE antes de aprovar
qualquer plano técnico ou de produto.
tools: Read # só lê o plano
model: sonnet # precisa raciocinar sobre premissas
---
You are a skeptical senior engineer who has seen
many plans fail. You know nothing about how this
plan was created.
For each plan section, ask:
1. What hidden assumptions does this make?
2. What is the single most likely failure point?
3. Is there a missing dependency or external risk?
4. Is the rollback defined if this fails mid-way?
Output: A structured critique. For each issue,
state: what is assumed, why it might not hold,
and what question the author should answer.
Rules:
- Do NOT rewrite or "improve" the plan.
- Be adversarial but constructive.
- Prioritize: what will actually fail first?
Prompts prontos (copie e cole)
Três prompts para acionar o padrão do revisor imparcial no seu trabalho real. O segundo é o mais poderoso: pede explicitamente a perspectiva de um engenheiro externo.
Use o code-reviewer para revisar o que acabei de fazer.
Não quero que ele edite nada — só um relatório de
achados com severidade (crítico / maior / menor).
Abra um subagente com contexto fresco e peça para ele
revisar criticamente este resultado como um engenheiro
externo que nunca viu o projeto. Ele deve apontar o
que parece errado, incompleto ou arriscado — sem levar
em conta o esforço que custou.
Use o plan-roaster neste plano. Quero as 3 premissas
mais perigosas que estão implícitas e a pergunta
que eu precisaria responder antes de aprovar cada fase.
Tela simulada: builder + revisor em sequência
É assim que o padrão aparece no terminal: o builder termina e devolve um diff; em seguida o code-reviewer entra com contexto zero, lê o diff e emite o relatório. Note que o contexto do maestro permanece baixo durante todo o processo.
↑ Recriação ilustrativa do terminal. O builder rodou em contexto separado; o revisor iniciou fresco. Maestro usou apenas 9% do contexto.
Exercício
Escolha um trabalho seu recente — um pedaço de código, um plano, ou um resumo — e rode um revisor imparcial sobre ele. Use o Prompt 2 desta página. Depois compare: o revisor encontrou algo que você não havia notado?
Como fazer
- Abra o Claude Code numa sessão nova.
- Cole o artefato (código, plano ou resumo) ou aponte o caminho do arquivo.
- Use o Prompt 2: peça revisão com contexto fresco, perspectiva de engenheiro externo.
- Leia o relatório e anote: quantos achados são coisas que você "sabia mas não escreveu"?
✅ Critério de verificação — como saber que acertou
O exercício foi bem-sucedido se você conseguir marcar ao menos uma das seguintes:
- →O revisor encontrou algo novo — algo que você não havia detectado na sua própria leitura.
- →O revisor nomeou uma premissa implícita — algo que você sabia mas não havia escrito no artefato.
- →O revisor não encontrou nada crítico — e você consegue explicar por quê (bom sinal de qualidade do artefato).
Variação avançada
Se você já tem o code-reviewer.md ou o plan-roaster.md criados, instrua o maestro a usar o agente nomeado. Compare: o revisor via nome vs. via prompt ad-hoc produz achados mais precisos?
✅ Resumo do módulo
Próximo módulo:
3.5 — Workflows dinâmicos. Quando o orquestrador decide em tempo de execução quais subagentes acionar — e como construir esse roteamento.