Usar la API de ChatGPT y Claude Gratis en 2026
Usa la API de GPT-4.1 y Claude sin pagar: créditos gratis, Groq, Google AI Studio y Ollama. Con código JavaScript listo para copiar.
Tabla de contenidos
Sí, puedes usar las APIs de los mejores modelos de IA sin gastar dinero (o gastando céntimos). Aquí te explico todas las opciones reales en 2026.
Créditos gratis al registrarte
| Proveedor | Créditos gratis | Validez | Qué necesitas |
|---|---|---|---|
| OpenAI | $5 | 3 meses | Solo registrarte |
| Anthropic | $5 | - | Registrarte + tarjeta |
| Google AI Studio | Gratis ilimitado* | Indefinido | Cuenta de Google |
| Groq | Gratis (rate limited) | Indefinido | Solo registrarte |
| Together AI | $5 | - | Solo registrarte |
| Fireworks AI | $1 | - | Solo registrarte |
| Mistral | Tier gratis | Indefinido | Solo registrarte |
*Google AI Studio es gratis para uso personal con rate limits (15 RPM para Gemini 2.5 Pro).
Opción 1: Google AI Studio (100% gratis)
La opción más generosa. Gemini 2.5 Pro y Flash son gratis para uso personal:
import { GoogleGenAI } from '@google/genai';
const ai = new GoogleGenAI({ apiKey: 'tu-api-key' });
const response = await ai.models.generateContent({
model: 'gemini-2.5-pro',
contents: '¿Cuál es la mejor forma de ordenar un array en JavaScript?'
});
console.log(response.text);
Límites gratis: 15 requests/minuto, 1M tokens/día. Más que suficiente para proyectos personales. Si superas estos límites, recibirás un error 429; consulta cómo solucionar el error 429 Too Many Requests en APIs de IA.
Opción 2: Groq (ultra rápido y gratis)
Groq ejecuta modelos open-source (Llama 4, Mixtral) en hardware especializado. Es gratis con rate limits:
import Groq from 'groq-sdk';
const groq = new Groq({ apiKey: 'tu-api-key' });
const completion = await groq.chat.completions.create({
messages: [{ role: 'user', content: 'Explica async/await en JS' }],
model: 'llama-4-maverick-17b-128e',
});
console.log(completion.choices[0].message.content);
Ventaja: Respuestas en < 500ms. Ideal para apps que necesitan velocidad.
Opción 3: OpenAI con modelos baratos
Si necesitas la API de OpenAI, usa los modelos más económicos:
import OpenAI from 'openai';
const openai = new OpenAI({ apiKey: 'tu-api-key' });
// GPT-4.1 nano: $0.10 input / $0.40 output por millón de tokens
const response = await openai.chat.completions.create({
model: 'gpt-4.1-nano',
messages: [{ role: 'user', content: 'Resume este texto en 3 puntos...' }],
max_tokens: 500, // Limitar output ahorra dinero
});
Coste real: Con GPT-4.1 nano, 1000 peticiones de ~500 tokens cuestan $0.05. Prácticamente gratis.
Tabla de costes reales por uso
| Uso | Modelo | Tokens/petición | 1000 peticiones |
|---|---|---|---|
| Chatbot simple | GPT-4.1 nano | ~800 | $0.04 |
| Resúmenes | GPT-4o mini | ~1500 | $0.10 |
| Código complejo | GPT-4.1 | ~3000 | $0.72 |
| Análisis largo | Claude Sonnet 4 | ~5000 | $1.20 |
Opción 4: Modelos open-source (gratis total)
Ejecutar modelos en tu máquina = $0 para siempre:
Con Ollama (la forma más fácil)
# Instalar Ollama
curl -fsSL https://ollama.ai/install.sh | sh
# Descargar y ejecutar Llama 4
ollama run llama4
# Usar como API local
curl http://localhost:11434/api/generate \
-d '{"model": "llama4", "prompt": "Qué es una API REST?"}'
Modelos recomendados para local
| Modelo | RAM mínima | Calidad código | Velocidad |
|---|---|---|---|
| Llama 4 Scout | 16GB | ⭐⭐⭐⭐ | Rápido |
| Qwen 2.5 Coder 32B | 24GB | ⭐⭐⭐⭐⭐ | Medio |
| DeepSeek Coder V3 | 16GB | ⭐⭐⭐⭐ | Rápido |
| Phi-4 | 8GB | ⭐⭐⭐ | Muy rápido |
| Mistral Small | 16GB | ⭐⭐⭐⭐ | Rápido |
Opción 5: Claude con uso inteligente
Anthropic no tiene tier gratis ilimitado, pero con $5 de créditos iniciales puedes hacer mucho si usas Claude Haiku 3.5:
import Anthropic from '@anthropic-ai/sdk';
const anthropic = new Anthropic({ apiKey: 'tu-api-key' });
const message = await anthropic.messages.create({
model: 'claude-3-5-haiku-20241022',
max_tokens: 1024,
messages: [{ role: 'user', content: 'Revisa este código por bugs:\n...' }],
});
Coste: $0.80/$4.00 por millón de tokens. Los $5 gratis te dan unas 6000 peticiones con Haiku.
Trucos para gastar menos
1. Cachear respuestas repetidas
const cache = new Map();
async function askAI(prompt) {
const key = prompt.trim().toLowerCase();
if (cache.has(key)) return cache.get(key);
const response = await openai.chat.completions.create({
model: 'gpt-4.1-nano',
messages: [{ role: 'user', content: prompt }],
});
const result = response.choices[0].message.content;
cache.set(key, result);
return result;
}
2. Usar system prompt corto
Cada token en el system prompt se cobra en cada petición. Un system prompt de 500 tokens × 1000 peticiones = 500K tokens extra.
// ❌ Malo: system prompt de 500 tokens
system: "Eres un asistente experto... [párrafo largo]..."
// ✅ Bueno: system prompt de 30 tokens
system: "Eres un dev senior. Responde en español. Sé conciso."
3. Limitar max_tokens
// Solo pides lo que necesitas
max_tokens: 200, // para respuestas cortas
max_tokens: 1000, // para código
// No pongas 4096 "por si acaso" — pagas por output generado
4. Usar streaming para UX sin esperar
const stream = await openai.chat.completions.create({
model: 'gpt-4.1-nano',
messages: [{ role: 'user', content: prompt }],
stream: true,
});
for await (const chunk of stream) {
process.stdout.write(chunk.choices[0]?.delta?.content || '');
}
No ahorra dinero, pero mejora la experiencia y puedes cortar early si la respuesta no va bien.
Para una implementación completa de streaming con SSE hasta el navegador (incluyendo manejo de errores, reconexión y efecto typewriter), consulta el tutorial de streaming SSE con ChatGPT y Claude en Node.js. Y si necesitas que la respuesta sea JSON estructurado, revisa cómo parsear JSON de IA sin errores.
Comparativa: ¿cuál es la opción más barata para cada caso?
| Caso de uso | Mejor opción gratis |
|---|---|
| Chatbot personal | Google Gemini (gratis) |
| App con pocas peticiones | OpenAI GPT-4.1 nano ($5 créditos) |
| Prototipo rápido | Groq + Llama 4 (gratis) |
| Producción con tráfico | Ollama local ($0) |
| Máxima calidad | Claude Haiku 3.5 ($5 créditos) |
| Código / debugging | Google Gemini 2.5 Pro (gratis) |
Conclusión
No necesitas gastar $20/mes en ChatGPT Plus para usar IA en tus proyectos. La API es mucho más barata y te da más control. Empezá con Google AI Studio (gratis) o Groq, y solo pagá cuando tu proyecto lo justifique.
Cuando empieces a pagar por API, usa prompt caching para ahorrar hasta un 90% y caveman prompting para reducir un 70% los tokens de input.
Para comparar todos los precios por token en detalle, consulta mi calculadora de precios de IA. Si no quieres usar APIs y prefieres herramientas con interfaz, mira las mejores alternativas gratis a ChatGPT.
¿Listo para construir algo con estas APIs? Sigue mi tutorial para crear un agente de IA con LangChain. O si quieres conectar la IA con tus propias APIs y bases de datos, aprende a usar function calling en OpenAI y Claude.
¿Quieres ver proyectos que usan estas APIs? En mi portfolio muestro apps reales construidas con IA y sus stacks.