Caveman Prompting: Ahorra un 70% en Tokens con la Técnica Cavernícola
¿Qué es Caveman Prompting? La técnica viral para reducir tokens en ChatGPT, Claude y Copilot. Con ejemplos reales, comparativas de coste y cuándo usarla.
Tabla de contenidos
Tu agente de IA hace 200 llamadas por tarea. Cada prompt tiene 500 tokens de instrucciones. En un día, has quemado 100.000 tokens solo en decirle cosas que ya entiende sin artículos ni preposiciones.
La comunidad lo llama Caveman Prompting (Técnica Cavernícola) y es la forma más fácil de reducir tu factura de tokens entre un 50% y un 70%.
¿Qué es Caveman Prompting?
Escribes prompts como un cavernícola: sin artículos, sin preposiciones innecesarias, sin formalidades. Solo la información esencial.
Prompt normal vs Caveman
Prompt normal (47 tokens):
Por favor, analiza el siguiente código JavaScript y encuentra todos los posibles
errores de rendimiento. Dame una lista ordenada de los problemas encontrados con
su explicación detallada y la solución recomendada para cada uno de ellos.
Caveman Prompt (19 tokens):
analiza código JS. busca errores rendimiento. lista problemas + explicación + solución
Misma respuesta. 60% menos tokens.
El truco es que los LLMs son modelos estadísticos de lenguaje — entienden contexto incluso con gramática rota. Las palabras “por favor”, “el siguiente”, “de los”, “para cada uno de ellos” no aportan información semántica al modelo.
Comparativa real de ahorro
Medí el consumo de tokens en 50 prompts reales de desarrollo con GPT-4.1 mini:
| Tipo de prompt | Tokens promedio | Coste por 10K llamadas | Ahorro |
|---|---|---|---|
| Normal (redactado) | 145 tokens | $0.93 | — |
| Caveman (mínimo) | 52 tokens | $0.33 | 64% |
| Mixto (caveman + código) | 89 tokens | $0.57 | 39% |
Nota: El ahorro es solo en tokens de input. El output del modelo no cambia. Para modelos caros como Claude Opus 4 ($15/M input), la diferencia es aún mayor.
Reglas del Caveman Prompting
1. Elimina artículos y preposiciones
// ❌ Normal
"Necesito que me crees una función que calcule el total de una factura
incluyendo el IVA correspondiente"
// ✅ Caveman
"función calcular total factura con IVA"
2. Usa abreviaturas comunes
// ❌ Normal
"Crea una interfaz de TypeScript para el objeto de respuesta de la API"
// ✅ Caveman
"interfaz TS respuesta API"
3. Separa instrucciones con puntos o saltos de línea
// ❌ Normal
"Primero analiza el error, después busca la causa raíz,
y finalmente dame la solución con un ejemplo de código"
// ✅ Caveman
"1. analiza error
2. causa raíz
3. solución + código"
4. Mantén los tecnicismos intactos
Los nombres de tecnologías, funciones y conceptos técnicos NO se simplifican:
// ❌ Demasiado caveman (pierde contexto)
"arregla cosa que no va en servidor"
// ✅ Caveman correcto (mantiene tecnicismos)
"fix CORS error express middleware. req desde localhost:3000 a API :8080"
5. El código nunca se comprime
El código fuente se pasa tal cual. Caveman es solo para las instrucciones, no para el código que analizas:
// ✅ Instrucción caveman + código completo
refactora. reduce complejidad ciclomática.
function processOrder(order) {
// ... código completo sin comprimir ...
}
Caveman Prompting en agentes y flujos automáticos
Donde más impacto tiene es en system prompts de agentes que se repiten miles de veces:
System prompt normal (210 tokens):
Eres un asistente experto en desarrollo web full-stack. Tu objetivo es ayudar
al desarrollador a resolver problemas de código. Cuando el usuario te pida ayuda,
debes analizar el problema cuidadosamente, considerar las mejores prácticas,
y proporcionar una solución clara con código funcional. Siempre explica tu
razonamiento paso a paso. Si no estás seguro de algo, indícalo claramente
en vez de inventar una respuesta.
System prompt caveman (62 tokens):
experto dev web fullstack. analiza problemas código. da solución con código funcional.
explica razonamiento. si no seguro → dilo, no inventar.
148 tokens ahorrados por llamada. Si tu agente hace 1.000 llamadas/día:
| Modelo | Ahorro diario | Ahorro mensual |
|---|---|---|
| GPT-4.1 | $0.30/día | $9/mes |
| GPT-4.1 mini | $0.06/día | $1.80/mes |
| Claude Sonnet 4 | $0.44/día | $13.20/mes |
| Claude Opus 4 | $2.22/día | $66.60/mes |
Con Claude Opus en flujos automatizados, caveman prompting puede ahorrarte $66/mes solo optimizando el system prompt.
Combinando Caveman con otras técnicas de ahorro
Caveman Prompting es la capa más fácil de aplicar, pero se multiplica con otras optimizaciones:
1. Caveman + Modelo barato para tareas simples
// Triage: modelo nano para clasificar, modelo potente solo cuando hace falta
const triage = await openai.chat.completions.create({
model: 'gpt-4.1-nano', // $0.10/M tokens
messages: [{ role: 'user', content: 'clasifica intención: bug, feature, pregunta. input: "no me funciona el login"' }],
});
if (triage.includes('bug')) {
// Solo aquí usamos el modelo caro
await openai.chat.completions.create({
model: 'gpt-4.1',
messages: [{ role: 'user', content: 'debug login. error: ...' }],
});
}
Para una comparativa completa de precios por modelo, consulta la calculadora de precios de IA.
2. Caveman + Prompt Caching
El prompt caching de OpenAI y Anthropic cachea el prefijo estático de tus mensajes. Si tu system prompt caveman se repite idéntico, consigues hasta un 90% de descuento en esos tokens. Más detalles en el artículo de prompt caching en OpenAI y Claude.
3. Caveman + RAG (solo contexto relevante)
No envíes todo el documento — solo los fragmentos relevantes, y escribe la instrucción en caveman:
responde pregunta usando SOLO este contexto. no inventar.
contexto: {fragmentos_relevantes}
pregunta: {pregunta_usuario}
Para implementar RAG desde cero, sigue el tutorial de cómo crear un chatbot RAG con OpenAI.
¿Cuándo NO usar Caveman Prompting?
| Escenario | ¿Caveman? | Por qué |
|---|---|---|
| System prompts de agentes | ✅ Sí | Se repiten miles de veces |
| Clasificación / triage | ✅ Sí | Instrucciones simples, alta frecuencia |
| Prompts de usuario final | ❌ No | El usuario escribe como quiere |
| Prompts con matices legales/médicos | ⚠️ Con cuidado | La ambigüedad puede ser peligrosa |
| Código a analizar | ❌ Nunca | El código va completo siempre |
| Few-shot examples | ⚠️ Parcial | Reduce la instrucción, mantén los ejemplos |
Caveman en editores de código (Copilot, Cursor)
Si usas Cursor, Copilot o Windsurf, los prompts en el chat inline también consumen tokens de tu cuota:
// ❌ En el chat de Cursor
"¿Podrías por favor crear una función de TypeScript que reciba un array de
objetos de tipo Product y devuelva solo los que tengan un precio mayor a
un valor dado como parámetro?"
// ✅ Caveman en Cursor
"fn TS: filtra Product[] por precio > parámetro"
En Cursor ($20/mes con límite de peticiones premium), cada prompt optimizado te deja hacer más consultas antes de agotar la cuota. Si buscas una alternativa más barata, Aider funciona directamente desde la terminal con tu propia API key.
Herramienta: comprime tus prompts automáticamente
Si no quieres comprimir manualmente, puedes crear un compresor simple:
function cavemanify(prompt) {
// Eliminar artículos y preposiciones comunes en español
const stopWords = new Set([
'el', 'la', 'los', 'las', 'un', 'una', 'unos', 'unas',
'de', 'del', 'en', 'por', 'para', 'con', 'que', 'al',
'es', 'son', 'está', 'están', 'fue', 'ser', 'como',
'su', 'sus', 'este', 'esta', 'ese', 'esa', 'mi', 'tu',
'me', 'te', 'se', 'lo', 'le', 'nos', 'les',
'muy', 'más', 'ya', 'también', 'pero', 'sin embargo',
'por favor', 'necesito que', 'quiero que', 'podrías',
]);
return prompt
.toLowerCase()
.split(/\s+/)
.filter(word => !stopWords.has(word))
.join(' ')
.replace(/\s+/g, ' ')
.trim();
}
console.log(cavemanify(
'Por favor analiza el siguiente código JavaScript y encuentra los errores'
));
// → "analiza siguiente código javascript encuentra errores"
Importante: Esto es una simplificación. Para producción, usa esto como primer paso y revisa manualmente que no se pierda contexto clave.
Comparativa final: impacto real en costes
Para un flujo de agente que procesa 500 tareas/día con 5 llamadas cada una (2.500 llamadas/día):
| Configuración | Tokens/día | Coste mensual (GPT-4.1 mini) | Coste mensual (Claude Sonnet 4) |
|---|---|---|---|
| Prompts normales | 725K | $8.70 | $65.25 |
| Caveman Prompting | 260K | $3.12 | $23.40 |
| Caveman + modelo nano para triage | 180K | $1.62 | $16.20 |
| Caveman + caching + triage | 95K | $0.57 | $4.28 |
De $65/mes a $4/mes con Claude Sonnet. Un ahorro del 93% combinando las técnicas.
Si quieres usar APIs sin gastar nada para probar estas técnicas, revisa las APIs de IA gratuitas disponibles. Y para escribir prompts más efectivos (caveman o no), consulta los mejores prompts para programar con IA.
Conclusión
Caveman Prompting no es un hack — es sentido común aplicado a tokens:
- Elimina palabras que no aportan información al modelo
- Mantén tecnicismos y código intactos
- Aplícalo en system prompts y flujos automáticos donde se repite miles de veces
- Combínalo con caching y triage para multiplicar el ahorro
Es la optimización con mejor ratio esfuerzo/resultado: cambias cómo escribes prompts y ahorras un 70% desde el primer día.