Qué es un LLM
LLM (Large Language Model) es un tipo de modelo de inteligencia artificial entrenado con cantidades masivas de texto (cientos de miles de millones de palabras de internet, libros, artículos) que puede:
- Generar texto natural en cualquier idioma
- Responder preguntas
- Resumir documentos
- Traducir
- Escribir código
- Razonar (con limitaciones)
LLMs más conocidos en 2026
OpenAI
- GPT-4 / GPT-4o
- GPT-5 (lanzado 2025)
- API y ChatGPT
Anthropic
- Claude 4.5 / Claude 4.6 / Claude 4.7
- API y Claude.ai
- Gemini 2.5 Pro / Flash
- API y gemini.google.com
Meta
- Llama 4 (open source)
Mistral / Mixtral
- Modelos europeos, open source
Otros
- Cohere (foco empresarial)
- xAI Grok (Twitter/X)
- DeepSeek (China)
Cómo se entrenan (resumido)
- Pre-training: entrenar con texto masivo predecir la siguiente palabra
- Fine-tuning: ajustar con datos específicos
- RLHF (Reinforcement Learning from Human Feedback): humanos califican respuestas para mejorar el modelo
Coste de entrenamiento: 10-100 millones de dólares para modelos top.
Limitaciones importantes
1. Alucinaciones
Los LLMs inventan información que parece real pero es falsa. Especialmente:
- Datos numéricos específicos
- Citas de fuentes
- Nombres de personas/empresas
- Fechas
Nunca confiar al 100% en datos generados sin verificar.
2. Fecha de corte de conocimiento
Cada LLM tiene una fecha tras la cual no conoce eventos. GPT-5 cutoff típicamente 2024-2025. Si preguntas por algo de 2026, no lo sabe (salvo que tenga acceso a web search).
3. No razonan profundamente
Aunque parecen razonar, los LLMs hacen predicción de tokens, no razonamiento simbólico. Fallan en:
- Matemáticas complejas
- Lógica multi-paso compleja
- Razonamiento espacial
Modelos “razonadores” (GPT-o1, Claude 4.6 Sonnet con thinking) mejoran esto pero no son perfectos.
4. Sesgos
Reproducen sesgos de los datos de entrenamiento (raciales, de género, culturales).
Casos de uso típicos en empresa
- Asistente de atención al cliente (con RAG sobre tus datos)
- Resúmenes de reuniones / documentos
- Generación de borradores (emails, propuestas, contratos)
- Traducción
- Análisis de sentimiento en reseñas
- Generación de código
- Cualificación inicial de leads
Coste de uso
API de los principales LLMs cobran por tokens:
- GPT-5: ~5-20$ por 1M tokens (depende variante)
- Claude 4.7 Sonnet: ~3-15$ por 1M tokens
- Gemini 2.5 Flash: ~0,15-0,60$ por 1M tokens
- Open source self-hosted: solo coste de hardware
Una conversación típica usa 500-2000 tokens. Una atención al cliente activa con 100 conversaciones/día = 200k tokens/día = ~1-5$/día.
LLM vs RAG
LLM solo: sabe lenguaje en general. RAG (LLM + tus datos): sabe lenguaje + TU negocio específico.
Para empresa, RAG es mucho más útil que un LLM puro. Lee RAG.