Aula 10 — Caveman + Spec-Kit: Comunicação Enxuta no Desenvolvimento com IA¶

Data: 11/05/2026 | Horário: 11h00 | Local: Sala 207

Introdução¶

Na Aula 09, trabalhamos com Spec-Driven Development para reduzir ambiguidade antes de pedir código a um agente de IA. A ideia era simples: se a especificação é melhor, o código gerado tende a ser mais previsível. Hoje vamos adicionar uma camada operacional ao fluxo: usar Caveman para revisar, resumir e controlar a verbosidade do agente em cada fase do Spec-Kit.

Agentes de IA costumam ser verbosos. Eles explicam demais, pedem desculpas, repetem contexto, antecipam riscos genéricos e misturam o que importa com texto de transição. Em uma conversa curta isso parece inofensivo. Em uma sprint real, com várias iterações, revisões de PR, specs, logs e mensagens de erro, essa verbosidade consome tempo, tokens e atenção.

O repositório Caveman, de Julius Brussee, transforma essa observação em uma ferramenta: um skill/plugin para agentes como Claude Code, Codex, Gemini, Cursor, Windsurf, Cline, Copilot e outros, cujo objetivo é comprimir a saída do agente mantendo a informação técnica essencial. O projeto relata reduções médias de saída próximas de 65% em benchmarks próprios, com variação por tipo de tarefa.

Nesta aula, vamos usar o Caveman como objeto de estudo para discutir economia de tokens, legibilidade, revisão técnica e qualidade da comunicação com agentes dentro de um fluxo real de SDD. A pergunta principal não é "como deixar a IA engraçada?", mas sim: como revisar specs, plans, tasks e código gerado com menos ruído e mais ação?

Materiais de Apoio¶

Leitura recomendada

Antes da aula, abra o README do Caveman e observe duas coisas: quais tipos de resposta ele tenta encurtar e quais recursos ele oferece além do modo de fala curta, como compressão de arquivos de memória, commits concisos e revisões de PR em uma linha.

Discovery do Projeto¶

O problema: excesso de texto também é custo¶

Quando falamos de custo em IA, normalmente pensamos em dinheiro. Mas, em um projeto de software, existem pelo menos quatro custos ligados à verbosidade:

Custo financeiro — mais tokens de saída significam mais consumo em ferramentas pagas por uso.
Custo de tempo — respostas longas demoram mais para serem geradas e revisadas.
Custo cognitivo — o time precisa separar sinal de ruído a cada interação.
Custo de contexto — conversas longas ocupam mais janela de contexto e aumentam a chance de o agente perder informações importantes.

Esse problema aparece com força em três momentos do curso:

ao revisar specs geradas pelo Spec-Kit
ao pedir explicação de bugs ou decisões técnicas
ao transformar feedback de revisão em mudanças pequenas de código

Em todos esses casos, uma resposta mais curta pode ajudar, desde que ela preserve o essencial: causa, decisão, consequência e próximo passo.

O que é o Caveman¶

O Caveman é um plugin/skill open source em licença MIT que instrui agentes de IA a responderem de forma comprimida. A proposta do projeto é reduzir palavras de ligação, justificativas genéricas e texto ornamental, mantendo precisão técnica.

Na prática, ele oferece:

modo de resposta curta, acionado por comando ou regra do agente
níveis de compressão, como lite, full e ultra
comandos auxiliares para commits e reviews mais concisos
compressão de arquivos de memória, como CLAUDE.md ou notas de projeto
um middleware chamado caveman-shrink, voltado a comprimir descrições de ferramentas MCP
suporte a vários agentes, incluindo Claude Code, Codex, Gemini, Cursor, Windsurf, Cline e Copilot

O ponto pedagógico importante: Caveman não muda a capacidade de raciocínio do modelo. Ele muda o formato da resposta. A ferramenta é uma camada de comunicação, não uma garantia de qualidade.

Instalação e uso básico¶

O README do projeto apresenta uma instalação por script:

# macOS / Linux / WSL / Git Bash
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

No Windows PowerShell:

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

Para instalação manual em vários agentes, o projeto também usa npx skills add JuliusBrussee/caveman -a <agente>. No Codex, o acionamento pode aparecer como $caveman; em outros agentes, como /caveman ou por instruções do tipo "responda em modo caveman".

Cuidado antes de rodar scripts remotos

Mesmo quando o repositório parece confiável, nunca execute curl | bash sem ler o script ou entender o que ele altera. Nesta aula, a instalação é opcional. Quem não quiser instalar pode simular o comportamento com prompts de concisão e ainda participar de todas as tarefas.

Como usar na prática¶

Depois de instalado, o uso básico é conversar com o agente normalmente, mas ativando o modo de resposta curta antes da tarefa. A forma exata depende do agente:

Ambiente	Como acionar
Claude Code	`/caveman`, `/caveman lite`, `/caveman full`, `/caveman ultra`
Codex	`$caveman` ou pedido em linguagem natural, dependendo da instalação
Gemini CLI	`/caveman` ou comando equivalente da extensão
Cursor, Windsurf, Cline, Copilot	regra instalada no projeto ou pedido manual de concisão
Sem instalar	prompt manual pedindo resposta curta com preservação de causa, ação, risco e teste

Fluxo recomendado para os grupos:

Ativar concisão antes da tarefa: /caveman lite ou $caveman.
Fazer um pedido concreto: "revise este trecho", "resuma esta spec", "explique este erro".
Verificar se perdeu informação: causa, ação, teste e risco continuam claros?
Pedir expansão pontual apenas do que ficou ambíguo.
Registrar a versão final no MkDocs, issue, PR ou commit.

Exemplo de ativação:

/caveman lite
Revise este tasks.md e liste apenas inconsistências entre tarefas, dependências e critérios da spec.
Formato: arquivo/linha — problema — correção sugerida.

No Codex, se o comando disponível for $caveman, o mesmo pedido ficaria assim:

$caveman
Revise este tasks.md e liste apenas inconsistências entre tarefas, dependências e critérios da spec.
Formato: arquivo/linha — problema — correção sugerida.

Sem instalar nada, dá para simular:

Responda de forma concisa.
Preserve: causa, ação, teste e risco.
Remova: cortesia, repetição, contexto óbvio e explicação genérica.

Tarefa: revise este tasks.md e liste inconsistências com a spec.

Caveman no fluxo do Spec-Kit¶

O Caveman não substitui nenhum comando do Spec-Kit. Ele entra como uma camada de revisão e síntese ao redor dos comandos /speckit.*.

Fase do Spec-Kit	O que o Spec-Kit gera	Como usar Caveman
`/speckit.constitution`	princípios do projeto	resumir princípios inegociáveis e detectar conflitos
`/speckit.specify`	`spec.md`	verificar escopo, ambiguidades e requisitos inventados
`/speckit.clarify`	perguntas e respostas	reduzir dúvidas a decisões objetivas
`/speckit.plan`	arquitetura, contratos, modelo de dados	listar trade-offs, riscos e decisões técnicas
`/speckit.tasks`	tarefas ordenadas	encontrar lacunas, dependências erradas e tarefas fora de escopo
`/speckit.implement`	código	revisar bugs, testes faltantes e divergências com a spec

Fluxo recomendado:

/speckit.specify
/caveman full
Revise o spec.md gerado.
Formato: problema — impacto — correção.

Depois:

/speckit.plan
/caveman lite
Resuma o plano técnico em:
Decisões:
Contratos:
Dados:
Riscos:
Dúvidas:

Depois:

/speckit.tasks
/caveman full
Compare tasks.md com spec.md e plan.md.
Liste apenas:
- tarefa faltante
- tarefa fora de escopo
- dependência errada
- teste ausente

E após implementar:

/speckit.implement
/caveman-review
Revise o código gerado contra spec.md.
Formato: arquivo:linha — divergência — correção.

O ganho está no controle humano. O Spec-Kit gera artefatos detalhados; o Caveman ajuda o grupo a revisar esses artefatos sem se afogar em explicação.

Comandos úteis¶

O Caveman traz comandos e habilidades auxiliares. Nem todos funcionam em todos os agentes, então a regra é conferir a matriz do README antes de usar em produção.

Comando/Recurso	Para que serve	Exemplo de uso
`/caveman lite`	Reduz enrolação, mantendo escrita profissional	explicação curta para o grupo
`/caveman full`	Resposta fragmentada e direta	depuração, revisão, próximos passos
`/caveman ultra`	Máxima compressão	checklist rápido ou diagnóstico simples
`/caveman-commit`	Sugere mensagem de commit curta	`fix: block duplicate cpf`
`/caveman-review`	Produz comentários curtos de PR	`UserForm.tsx:42 — CPF sem validação. Adicionar schema.`
`/caveman-stats`	Mostra economia de tokens em ambientes suportados	acompanhar redução de saída
`/caveman:compress <arquivo>`	Comprime arquivo de memória ou notas	reduzir tamanho de `CLAUDE.md`
`caveman-shrink`	Comprime descrições de ferramentas MCP	diminuir custo de contexto de ferramentas

Para a aula, os comandos principais são os três níveis de resposta (lite, full, ultra) e a simulação manual por prompt. Os recursos de commit, review, stats e compressão entram como extensão para quem quiser experimentar no projeto.

Níveis de concisão¶

O Caveman organiza a concisão em níveis. Para a aula, vamos usar estes três:

Lite — remove enrolação, mas mantém gramática normal. Bom para respostas profissionais.
Full — usa frases curtas e fragmentos. Bom para depuração rápida e revisão técnica.
Ultra — resposta telegráfica. Bom para comandos, diagnósticos simples e listas de ação.

O desafio é perceber que "mais curto" não é sempre "melhor". Uma resposta ultra curta pode ser excelente para um bug óbvio e ruim para uma decisão arquitetural com trade-offs.

Concisão não é superficialidade¶

Uma resposta curta de boa qualidade precisa preservar quatro elementos:

Fato — o que está acontecendo?
Causa — por que está acontecendo?
Ação — o que fazer agora?
Risco — o que pode dar errado se a ação for incompleta?

Compare:

Ruim:
Erro no login. Corrigir auth.

Melhor:
Token expira, mas middleware aceita `exp == now`. Trocar `<=` por `<`. Testar token expirado e token válido.

A segunda resposta é curta, mas ainda dá diagnóstico, mudança e teste. Esse é o tipo de concisão que nos interessa.

Exemplos de uso¶

Exemplo 1 — Explicação de bug¶

Pedido:

/caveman full
Explique por que este componente React está renderizando muitas vezes e sugira correção.

Resposta longa típica:

O componente provavelmente está renderizando muitas vezes porque você está criando um novo objeto dentro do corpo do componente a cada renderização. Como objetos em JavaScript são comparados por referência, o React entende que a prop mudou mesmo quando os valores internos são iguais. Uma forma de resolver isso é memorizar o objeto com useMemo ou mover a criação para fora do componente, dependendo do caso.

Resposta concisa:

Objeto novo a cada render. Prop compara por referência. React vê mudança sempre. Use `useMemo` ou mova objeto para fora.

O que foi preservado:

causa: objeto novo a cada render
mecanismo: comparação por referência
ação: useMemo ou mover objeto

O que foi cortado:

introdução
repetição
explicação genérica sobre JavaScript

Exemplo 2 — Revisão de PR¶

Pedido:

/caveman-review
Revise este PR procurando bugs de validação e segurança.

Saída esperada:

UserController.cs:38 — senha aceita vazia. Validar antes de criar usuário.
AuthService.cs:52 — token expirado passa no limite. Usar `expiresAt <= now`.
PedidoForm.tsx:91 — valor negativo permitido. Bloquear no schema e no input.

Por que funciona:

aponta arquivo e linha
descreve o problema
indica correção
evita comentários genéricos como "melhore a segurança"

Exemplo 3 — Commit¶

Pedido:

/caveman-commit
Gere uma mensagem Conventional Commit para esta mudança:
- adiciona validação de CPF duplicado
- cria teste para cadastro com CPF repetido
- ajusta mensagem de erro no formulário

Saída possível:

fix: block duplicate cpf signup

Versão com corpo, se o time quiser registrar contexto:

fix: block duplicate cpf signup

Adds database constraint, form validation, and regression test.

Exemplo 4 — Resumo de spec¶

Pedido:

/caveman lite
Resuma esta spec em até 8 linhas.
Formato:
Objetivo:
Atores:
Fluxo:
Regras:
Dados:
Riscos:

Saída possível:

Objetivo: permitir que pescador registre pedido e acompanhe status.
Atores: pescador, comprador, administrador.
Fluxo: criar pedido, validar dados, salvar, atualizar status, notificar usuário.
Regras: pedido exige item, quantidade, preço e contato.
Dados: usuário, pedido, item, status, histórico.
Riscos: conexão instável, pedido duplicado, status divergente.

Uso pedagógico: esse resumo ajuda o grupo a revisar a spec antes de pedir /speckit.plan.

Exemplo 5 — Quando pedir mais detalhe¶

Resposta curta recebida:

Use fila para processar notificações. Evita travar checkout.

Boa continuação:

Expanda apenas os trade-offs dessa decisão.
Compare fila assíncrona vs envio síncrono.
Inclua riscos, custo de implementação e impacto na UX.

Aqui a concisão ajudou a chegar rápido na decisão, mas a decisão arquitetural ainda precisa de explicação antes de virar plano técnico.

Relação com SDD¶

Na Aula 09, vimos que specs extensas podem virar um novo tipo de ruído. O time ganha rastreabilidade, mas passa a revisar muitos arquivos Markdown. O Caveman entra como contraponto: ele força a pergunta "qual é a menor quantidade de texto que ainda mantém a decisão verificável?"

Aplicado ao SDD, isso pode aparecer em três práticas:

Pedir ao agente um resumo executivo da spec em até 10 linhas.
Pedir uma lista de divergências entre spec.md, plan.md e tasks.md, sem explicações longas.
Pedir comentários de revisão no formato arquivo:linha — problema — correção.

Assim, a concisão vira ferramenta de revisão, não apenas economia de tokens.

Prompts prontos para Spec-Kit + Caveman¶

Use estes prompts depois de cada fase do Spec-Kit.

Revisar constitution¶

/caveman lite
Revise .specify/memory/constitution.md.
Liste apenas:
- princípio ambíguo
- princípio impossível de verificar
- conflito entre princípios
- princípio faltante para este projeto
Formato: problema — correção sugerida.

Revisar spec¶

/caveman full
Compare spec.md com o backlog/epic original.
Liste apenas divergências.
Formato:
Tipo: inventado | faltante | ambíguo | fora de escopo
Item:
Correção:

Revisar plano técnico¶

/caveman lite
Revise plan.md.
Separe:
Decisões técnicas:
Trade-offs:
Riscos:
Dependências externas:
Perguntas antes de codar:

Revisar tasks¶

/caveman full
Compare tasks.md com spec.md e plan.md.
Liste:
- tasks faltantes
- tasks fora de escopo
- tasks sem teste
- dependências em ordem errada
- tarefas que podem ser paralelas
Não explique além do necessário.

Revisar implementação¶

/caveman-review
Compare o código implementado com spec.md.
Formato: arquivo:linha — divergência — teste necessário.
Priorize bugs e critérios de aceitação não atendidos.

Relatório final da feature¶

/caveman ultra
Gere relatório final da feature.
Formato:
Feito:
Faltando:
Riscos:
Testes:
Próximo passo:

Quando usar e quando evitar¶

Use respostas curtas quando:

a tarefa é operacional
o time já conhece o contexto
a saída esperada é lista de ação
você está revisando PR, commit, bug ou checklist
o objetivo é decidir o próximo passo

Evite compressão extrema quando:

o tema é novo para a equipe
há trade-offs importantes
a decisão envolve segurança, privacidade, acessibilidade ou dados sensíveis
o grupo precisa aprender o raciocínio, não apenas aplicar a resposta
a resposta precisa ser auditável por alguém que não participou da conversa

Regra prática

Use concisão para executar melhor. Use explicação longa para aprender melhor. Em projeto real, as duas coisas se alternam o tempo todo.

Diagrama do fluxo de trabalho¶

flowchart TD
    A[Pedido ao agente] --> B{Tipo de tarefa}
    B -->|Aprender conceito novo| C[Resposta explicativa]
    B -->|Revisar ou executar| D[Resposta concisa]
    D --> E[Lista de ação]
    E --> F[Implementar ou revisar]
    F --> G{Faltou contexto?}
    G -->|Sim| H[Pedir expansão pontual]
    G -->|Não| I[Registrar decisão]
    H --> F

O ponto central é o ajuste de granulação. Não precisamos escolher entre "resposta enorme" e "resposta mínima" para sempre. Podemos pedir concisão primeiro e expandir apenas os pontos ambíguos.

Leitura Pedagógica da Aula

O objetivo não é transformar todo agente em modo comprimido permanente. É ensinar o grupo a controlar densidade de informação: curto quando a equipe precisa agir, detalhado quando a equipe precisa entender.

Tarefas¶

Tarefa 1 — Diagnóstico de Verbosidade no Spec-Kit¶

Duração estimada: 20 min Formato: Grupos

Cada grupo deve escolher uma saída real do Spec-Kit gerada na Aula 09 ou na tarefa de casa. Pode ser:

.specify/memory/constitution.md
spec.md
plan.md
tasks.md
resposta do /speckit.implement

Copiem o trecho escolhido e marquem:

trechos que ajudaram a tomar decisão
trechos que eram apenas transição, cortesia ou repetição
trechos que pareciam úteis, mas não eram acionáveis
informações que precisariam ficar mesmo em uma versão curta

Entregável: artefato do Spec-Kit anotado, com pelo menos cinco marcações de corte ou preservação.

Tarefa 2 — Reescrever o Artefato em Três Níveis¶

Duração estimada: 25 min Formato: Grupos

Usando o mesmo trecho da Tarefa 1, reescrevam o conteúdo em três versões:

Lite: profissional, sem enrolação, mas ainda explicativo.
Full: frases curtas, foco em diagnóstico e ação.
Ultra: máximo de concisão, apenas pontos necessários para agir.

Quem tiver instalado o Caveman pode usar /caveman lite, /caveman full e /caveman ultra ou o comando equivalente do agente. Quem não instalou pode pedir manualmente:

Reescreva esta resposta em modo conciso.
Preserve causa, ação, risco e teste.
Remova cortesia, justificativa genérica e repetição.

Entregável: três versões da mesma resposta, com contagem aproximada de palavras ou tokens em cada uma.

Tarefa 3 — Revisar o Ciclo Spec-Kit com Caveman¶

Duração estimada: 30 min Formato: Grupos

Cada grupo deve escolher duas fases do Spec-Kit e aplicar Caveman ou a simulação manual:

Spec: revisar spec.md contra o epic/backlog original.
Plan: resumir decisões, riscos e dúvidas de plan.md.
Tasks: comparar tasks.md com spec.md e plan.md.
Implement: revisar código gerado contra critérios de aceitação.

Prompts sugeridos:

/caveman full
Compare spec.md com o epic original.
Liste apenas requisitos inventados, faltantes, ambíguos ou fora de escopo.

/caveman lite
Resuma plan.md em:
Decisões:
Contratos:
Dados:
Riscos:
Dúvidas:

/caveman full
Compare tasks.md com spec.md e plan.md.
Liste tasks faltantes, fora de escopo, sem teste ou em ordem errada.

/caveman-review
Compare o código implementado com spec.md.
Formato: arquivo:linha — divergência — teste necessário.

Entregável: duas revisões reais do fluxo Spec-Kit com: pedido feito, resposta concisa e decisão do grupo.

Tarefa 4 — Teste de Perda de Informação¶

Duração estimada: 20 min Formato: Troca entre grupos

Um grupo entrega sua versão ultra para outro grupo, sem mostrar a resposta original. O grupo receptor deve responder:

qual problema está sendo tratado?
qual ação precisa ser feita?
quais testes ou validações são necessários?
qual risco ficou claro?
que informação faltou?

Depois, os grupos comparam a interpretação com a resposta original.

Entregável: uma tabela curta com duas colunas: informação preservada e informação perdida.

Tarefa 5 — Aplicar no Fluxo do Projeto¶

Duração estimada: 25 min Formato: Grupos

Cada grupo deve aplicar concisão ao fluxo inteiro de uma feature:

escolher uma feature especificada com Spec-Kit
gerar um resumo curto de spec.md
gerar uma revisão curta de plan.md
gerar uma revisão curta de tasks.md
gerar um checklist curto para validar /speckit.implement

Formato sugerido para saída:

Spec:
Plano:
Tasks:
Implementação:
Riscos:
Próximo passo:

Exemplo:

Spec: cadastro exige CPF único e senha mínima.
Plano: validar CPF no front e garantir unicidade no banco.
Tasks: falta teste de CPF duplicado na API.
Implementação: revisar migration antes do deploy.
Riscos: dados existentes duplicados quebram constraint.
Próximo passo: criar teste de integração e rodar migration local.

Entregável: relatório conciso da feature e uma nota dizendo onde Caveman ajudou ou atrapalhou a revisão.

Encerramento¶

Nesta aula usamos o Caveman dentro do fluxo do Spec-Kit. O ponto não foi deixar o agente "falar bonito e curto", mas tornar mais fácil revisar constitution.md, spec.md, plan.md, tasks.md e o código gerado. Vimos que respostas concisas podem acelerar revisão, reduzir tokens, melhorar leitura e tornar decisões mais visíveis. Também vimos o limite: compressão demais pode apagar contexto, trade-offs e justificativas importantes.

A prática recomendada para as próximas sprints é simples: usar Spec-Kit para gerar artefatos rastreáveis e Caveman para revisar esses artefatos em formato acionável. Quando o grupo estiver aprendendo, tomando decisões arquiteturais ou lidando com risco alto, peça expansão pontual.

Tarefa de Casa — Guia de Comunicação com IA

Para a próxima aula, cada grupo deve criar uma seção no MkDocs chamada Guia Spec-Kit + Caveman do Grupo contendo:

quando usar Caveman em spec.md, plan.md, tasks.md e implementação
quando pedir explicação detalhada
formato padrão para revisar divergências entre spec e código
formato padrão para revisar tasks
três exemplos reais do projeto: saída original do Spec-Kit, versão Caveman e decisão do grupo

Aula 10 — Caveman + Spec-Kit: Comunicação Enxuta no Desenvolvimento com IA¶

Introdução¶

Materiais de Apoio¶

Discovery do Projeto¶

O problema: excesso de texto também é custo¶

O que é o Caveman¶

Instalação e uso básico¶

Como usar na prática¶

Caveman no fluxo do Spec-Kit¶

Comandos úteis¶

Níveis de concisão¶

Concisão não é superficialidade¶

Exemplos de uso¶

Exemplo 1 — Explicação de bug¶

Exemplo 2 — Revisão de PR¶

Exemplo 3 — Commit¶

Exemplo 4 — Resumo de spec¶

Exemplo 5 — Quando pedir mais detalhe¶

Relação com SDD¶

Prompts prontos para Spec-Kit + Caveman¶

Revisar constitution¶

Revisar spec¶

Revisar plano técnico¶

Revisar tasks¶

Revisar implementação¶

Relatório final da feature¶

Quando usar e quando evitar¶

Diagrama do fluxo de trabalho¶

Tarefas¶

Tarefa 1 — Diagnóstico de Verbosidade no Spec-Kit¶

Tarefa 2 — Reescrever o Artefato em Três Níveis¶

Tarefa 3 — Revisar o Ciclo Spec-Kit com Caveman¶

Tarefa 4 — Teste de Perda de Informação¶

Tarefa 5 — Aplicar no Fluxo do Projeto¶

Encerramento¶

Referências¶