¿Qué es un modelo de lenguaje grande?

Las herramientas de IA ahora están en todas partes. Para alguien completamente nuevo en ellas, la primera reacción suele ser: ¿por dónde empiezo? Este capítulo primero explica qué es un modelo de lenguaje grande (LLM) y luego analiza cómo usarlo.

¿Qué entendemos por IA?

Si has estado escuchando a amigos charlar recientemente, ocho de cada diez frases podrían ser sobre “IA”. ¿Pero sabías? La IA de la que todos hablan ahora no es la misma que la IA de hace unos años.

La IA que actualmente está arrasando en internet tiene un nombre profesional: IA Generativa.

¿Qué significa eso? En pocas palabras: Le das una frase y puede generar un artículo para ti; le das una idea y puede generar una imagen; le das un requisito y puede escribir un fragmento de código.

Es como un asistente increíblemente inteligente. Dices “escríbeme una carta de renuncia” y efectivamente la escribe; dices “dibuja un gato con traje” y efectivamente lo dibuja. Esta capacidad de “crear contenido de la nada” es el núcleo de “generativo”.

Los que escuchamos a menudo —ChatGPT, Claude, DeepSeek— todos pertenecen a esta categoría. Su esencia es un Modelo de Lenguaje Grande (LLM), que aprende a entender y generar lenguaje humano entrenándose con cantidades masivas de datos textuales.

Pero aquí hay un secreto importante:

La IA en realidad no “entiende” lo que dices; solo está “calculando probabilidades”.

Esto puede sonar contraintuitivo, pero déjame explicarte:

Cuando le preguntas a la IA “¿De qué color es el cielo?”, en realidad no mira hacia el cielo, ni entiende realmente los conceptos de “cielo” y “color”. Así es como funciona:

Basándose en los cientos de millones de artículos que ha leído, cuando el texto anterior es “¿De qué color es el cielo”, la probabilidad de que la siguiente palabra sea “azul” es del 82%, “gris” del 10%, “rojo” del 5%… y luego elige la palabra con mayor probabilidad.

Aquí hay un ejemplo más vívido:

Preguntas: “¿Cuánto es 1+1?”

La IA no está “haciendo matemáticas”; descubre que en todo el texto que ha visto, “1+1 es igual a” va seguido de “2” el 99.9% de las veces.
Así que responde “2”.

Preguntas: “Recomiéndame una buena película.”

La IA en realidad no ha visto películas; analiza que en los textos que ha aprendido, “buenas películas” suelen ir seguidas de palabras como “Cadena perpetua”, “Titanic”, etc.
Recomienda las que tienen alta probabilidad.

Es como un superdotado que ha leído todos los libros del mundo, pero:

Puede decirte “París es la capital de Francia” (porque los libros lo dicen).
Pero nunca ha estado en París, y ni siquiera sabe lo que significa “capital”.
Solo recuerda que cuando dices “París es”, la continuación más frecuente es “la capital de Francia”.

Por lo tanto, la IA puede tener algunos problemas extraños:

A veces “habla tonterías con confianza” (inventa hechos inexistentes).
Puede equivocarse en problemas matemáticos simples (porque realmente no está calculando).
Puede dar respuestas contradictorias (cálculos de probabilidad inconsistentes).

Este fenómeno de “hablar tonterías con confianza” tiene un término técnico: Alucinación. Al igual que los humanos sueñan, la IA “sueña” cosas que no existen y las dice con gran confianza.

Cómo resolver la alucinación con razonamiento

Dado que la IA es tan propensa a errores, ¿qué podemos hacer? Los científicos idearon una solución: Dejar que la IA “piense” antes de responder.

Esta técnica se llama “Pensamiento” o “Cadena de Pensamiento”.

Cómo funciona la IA tradicional:

Haces una pregunta → La IA escupe inmediatamente una respuesta.
Como un estudiante que ve un problema y suelta la respuesta sin resolverlo en papel borrador.

IA con razonamiento:

Haces una pregunta → La IA primero calcula y piensa en “papel borrador” → luego te da la respuesta.
Como un estudiante que primero enumera pasos, los verifica y luego escribe la respuesta final.

Un ejemplo práctico:

Preguntas: “Xiao Ming tiene 15 manzanas. Le da 3 a Xiao Hong y luego compra 8 más. ¿Cuántas tiene ahora?”

La IA tradicional podría:

Ver los números “15, 3, 8”.
Basándose en la probabilidad, pensar que deben sumarse.
Responder: “26” (¡incorrecto!)

La IA con razonamiento haría:

Primero analizar: “Xiao Ming inicialmente tiene 15.”
“Da 3 a Xiao Hong, entonces 15-3=12.”
“Compra 8 más, entonces 12+8=20.”
Finalmente responder: “20” (¡correcto!)

Beneficios del razonamiento:

Reduce las alucinaciones - Porque la IA “verifica” sus propios pensamientos, es menos probable que diga tonterías.
Lógica más rigurosa - Deriva paso a paso, sin saltarse pasos.
Explicable - Puedes ver cómo piensa la IA (aunque la mayor parte del tiempo este proceso de pensamiento está oculto).
Maneja problemas complejos - La precisión mejora significativamente para problemas que requieren razonamiento de múltiples pasos.

Pero el razonamiento también tiene costos:

Velocidad más lenta (porque necesita “pensar”).
Mayor costo (más cómputo).
No todos los problemas necesitan razonamiento (por ejemplo, “hola” no necesita medio día de pensamiento).

Ahora la mayoría de las IAs han añadido esta capacidad de razonamiento. Por ejemplo, el modelo de pensamiento de ChatGPT, el modo de pensamiento profundo de DeepSeek.

Un resumen rápido:

IA normal = un estudiante que suelta respuestas rápidamente (puede estar equivocado).
IA con razonamiento = un estudiante que trabaja cuidadosamente en papel borrador (mayor precisión).

Esto no significa que la IA pueda realmente “pensar”; solo añade algunos pasos de verificación antes del cálculo de probabilidad. Pero el efecto es claro: menos alucinaciones, respuestas más fiables.

Para usar la analogía más adecuada: La IA Generativa es como un “super estudiante de letras” que ha leído innumerables libros y visto el mundo. Puedes preguntarle cualquier cosa, y puede charlar contigo y ayudarte a escribir cosas. Sin embargo, responde “memorizando el banco de preguntas” en lugar de entender realmente el conocimiento. Las nuevas versiones están empezando a aprender a “trabajar en papel borrador”.

En realidad, la familia de la IA es enorme

Mucha gente piensa que la IA es solo ChatGPT, pero no es así. La familia de la IA tiene muchos miembros:

1. IA de reconocimiento - La que ve con claridad

Reconocimiento facial (desbloqueo de teléfono, pago facial)
Reconocimiento de imágenes (identificar flores por foto, reconocer texto)
Reconocimiento de voz (Siri, Xiao Ai entendiendo tu habla)
Estas IAs se especializan en “reconocer”, no en “crear”.

2. IA de recomendación - La que mejor conoce tu mente

Douyin (TikTok) te recomienda videos.
Taobao recomienda productos.
NetEase Cloud Music recomienda canciones.
Se destacan en “adivinar lo que te gusta”, pero no generan contenido nuevo.

3. IA de decisión - La que es buena en ajedrez y juegos

AlphaGo (jugando Go)
IA de juegos (como el oponente informático en StarCraft)
Se centran en “tomar decisiones”, superando a los humanos en dominios específicos.

4. IA Generativa - La ola caliente actual

Generación de texto: ChatGPT, Claude, DeepSeek
Generación de imágenes: Midjourney, Stable Diffusion, DALL-E
Generación de video: Sora, Runway
Generación de música: Suno, Udio

Resumen

Un resumen rápido: Si comparamos la IA con una caja de herramientas, la IA de reconocimiento es una “lupa”, la IA de recomendación es una “brújula”, la IA de decisión es un “manual de ajedrez”, y la IA generativa es una “varita mágica”—puede hacer aparecer lo que quieras.

Pero esta “varita mágica” es en realidad una “calculadora de probabilidades”. Es poderosa, pero no omnipotente. Y este tutorial trata principalmente sobre cómo usar bien esta “varita mágica”.