LLM · qué es | Glosario IMPERO

Qué es un LLM

LLM (Large Language Model) es un tipo de modelo de inteligencia artificial entrenado con cantidades masivas de texto (cientos de miles de millones de palabras de internet, libros, artículos) que puede:

Generar texto natural en cualquier idioma
Responder preguntas
Resumir documentos
Traducir
Escribir código
Razonar (con limitaciones)

LLMs más conocidos en 2026

OpenAI

GPT-4 / GPT-4o
GPT-5 (lanzado 2025)
API y ChatGPT

Anthropic

Claude 4.5 / Claude 4.6 / Claude 4.7
API y Claude.ai

Google

Gemini 2.5 Pro / Flash
API y gemini.google.com

Mistral / Mixtral

Modelos europeos, open source

Otros

Cohere (foco empresarial)
xAI Grok (Twitter/X)
DeepSeek (China)

Cómo se entrenan (resumido)

Pre-training: entrenar con texto masivo predecir la siguiente palabra
Fine-tuning: ajustar con datos específicos
RLHF (Reinforcement Learning from Human Feedback): humanos califican respuestas para mejorar el modelo

Coste de entrenamiento: 10-100 millones de dólares para modelos top.

Limitaciones importantes

1. Alucinaciones

Los LLMs inventan información que parece real pero es falsa. Especialmente:

Datos numéricos específicos
Citas de fuentes
Nombres de personas/empresas
Fechas

Nunca confiar al 100% en datos generados sin verificar.

2. Fecha de corte de conocimiento

Cada LLM tiene una fecha tras la cual no conoce eventos. GPT-5 cutoff típicamente 2024-2025. Si preguntas por algo de 2026, no lo sabe (salvo que tenga acceso a web search).

3. No razonan profundamente

Aunque parecen razonar, los LLMs hacen predicción de tokens, no razonamiento simbólico. Fallan en:

Matemáticas complejas
Lógica multi-paso compleja
Razonamiento espacial

Modelos “razonadores” (GPT-o1, Claude 4.6 Sonnet con thinking) mejoran esto pero no son perfectos.

4. Sesgos

Reproducen sesgos de los datos de entrenamiento (raciales, de género, culturales).

Casos de uso típicos en empresa

Asistente de atención al cliente (con RAG sobre tus datos)
Resúmenes de reuniones / documentos
Generación de borradores (emails, propuestas, contratos)
Traducción
Análisis de sentimiento en reseñas
Generación de código
Cualificación inicial de leads

Coste de uso

API de los principales LLMs cobran por tokens:

GPT-5: ~5-20$ por 1M tokens (depende variante)
Claude 4.7 Sonnet: ~3-15$ por 1M tokens
Gemini 2.5 Flash: ~0,15-0,60$ por 1M tokens
Open source self-hosted: solo coste de hardware

Una conversación típica usa 500-2000 tokens. Una atención al cliente activa con 100 conversaciones/día = 200k tokens/día = ~1-5$/día.

LLM vs RAG

LLM solo: sabe lenguaje en general. RAG (LLM + tus datos): sabe lenguaje + TU negocio específico.

Para empresa, RAG es mucho más útil que un LLM puro. Lee RAG.

LLM (LLM)

Qué es un LLM

LLMs más conocidos en 2026

OpenAI

Anthropic

Google

Meta

Mistral / Mixtral

Otros

Cómo se entrenan (resumido)

Limitaciones importantes

1. Alucinaciones

2. Fecha de corte de conocimiento

3. No razonan profundamente

4. Sesgos

Casos de uso típicos en empresa

Coste de uso

LLM vs RAG

RAG (RAG)

Embedding

Prompt engineering

Fine-tuning

AUDITORÍA GRATUITA
SIN COMPROMISO.

LLM (LLM)

Qué es un LLM

LLMs más conocidos en 2026

OpenAI

Anthropic

Google

Meta

Mistral / Mixtral

Otros

Cómo se entrenan (resumido)

Limitaciones importantes

1. Alucinaciones

2. Fecha de corte de conocimiento

3. No razonan profundamente

4. Sesgos

Casos de uso típicos en empresa

Coste de uso

LLM vs RAG

RAG (RAG)

Embedding

Prompt engineering

Fine-tuning

AUDITORÍA GRATUITASIN COMPROMISO.

AUDITORÍA GRATUITA
SIN COMPROMISO.