O que é um Modelo de Linguagem de Grande Escala?

Ferramentas de IA estão por toda parte agora. Para alguém completamente novo nelas, a primeira reação costuma ser: por onde começar? Este capítulo primeiro explica o que é um modelo de linguagem de grande escala (LLM) e depois discute como usá-lo.

O que Queremos Dizer com IA?

Se você tem ouvido conversas de amigos recentemente, oito em cada dez frases podem ser sobre “IA”. Mas você sabia? A IA que todo mundo está falando agora não é a mesma IA de alguns anos atrás.

A IA que está atualmente dominando a internet tem um nome profissional: IA Generativa.

O que isso significa? De forma simples: Você dá uma frase para ela, e ela pode gerar um artigo para você; você dá uma ideia, e ela pode gerar uma imagem; você dá um requisito, e ela pode escrever um pedaço de código.

É como um assistente incrivelmente inteligente. Você diz “escreva uma carta de demissão para mim”, e ela realmente escreve; você diz “desenhe um gato vestindo um terno”, e ela realmente desenha. Essa capacidade de “criar conteúdo do nada” é o núcleo de “generativo”.

Os que ouvimos falar com frequência — ChatGPT, Claude, DeepSeek — todos pertencem a essa categoria. A essência deles é um Modelo de Linguagem de Grande Escala (LLM), que aprende a entender e gerar linguagem humana treinando em quantidades massivas de dados textuais.

Mas aqui está um segredo importante:

A IA na verdade não “entende” o que você está dizendo; ela apenas “calcula probabilidades”.

Isso pode parecer contraintuitivo, mas deixe-me explicar:

Quando você pergunta à IA “Qual é a cor do céu?”, ela na verdade não olha para o céu, nem realmente entende os conceitos de “céu” e “cor”. Veja como funciona:

Com base nas centenas de milhões de artigos que leu, quando o texto anterior é “Qual é a cor do céu”, a probabilidade de a próxima palavra ser “azul” é 82%, “cinza” é 10%, “vermelho” é 5%… e então ela escolhe a palavra com a maior probabilidade.

Aqui está um exemplo mais vívido:

Você pergunta: “Quanto é 1+1?”

A IA não está “fazendo conta”; ela descobre que em todo o texto que já viu, “1+1 é igual a” é seguido por “2” 99,9% das vezes.
Então ela responde “2.”

Você pergunta: “Recomende um bom filme.”

A IA na verdade não assistiu a filmes; ela analisa que nos textos que aprendeu, “bons filmes” são frequentemente seguidos por palavras como “Um Sonho de Liberdade”, “Titanic”, etc.
Ela recomenda aqueles com alta probabilidade.

É como um super aluno que leu todos os livros do mundo, mas:

Ele pode te dizer “Paris é a capital da França” (porque os livros dizem isso).
Mas ele nunca esteve em Paris, e nem sabe o que “capital” significa.
Ele apenas lembra que quando você diz “Paris é”, a continuação mais frequente é “a capital da França”.

Então a IA pode ter alguns problemas estranhos:

Às vezes ela “fala bobagem com confiança” (inventa fatos inexistentes).
Pode errar problemas matemáticos simples (porque não está realmente calculando).
Pode dar respostas contraditórias (cálculos de probabilidade inconsistentes).

Esse fenômeno de “falar bobagem com confiança” tem um termo técnico: Alucinação. Assim como os humanos sonham, a IA “sonha” com coisas que não existem e as diz com grande confiança.

Como Resolver a Alucinação com Raciocínio

Já que a IA é tão propensa a erros, o que podemos fazer? Cientistas encontraram uma solução: Deixar a IA “pensar” antes de responder.

Essa técnica é chamada de “Pensamento” ou “Cadeia de Pensamento”.

Como a IA tradicional funciona:

Você faz uma pergunta → A IA imediatamente cospe uma resposta.
Como um aluno que vê um problema e diz a resposta sem fazer o cálculo no rascunho.

IA com raciocínio:

Você faz uma pergunta → A IA primeiro calcula e pensa no “rascunho” → depois te dá a resposta.
Como um aluno que primeiro lista os passos, verifica e depois escreve a resposta final.

Um exemplo prático:

Você pergunta: “João tem 15 maçãs. Ele dá 3 para Maria e depois compra mais 8. Quantas ele tem agora?”

IA tradicional pode:

Ver os números “15, 3, 8.”
Com base na probabilidade, achar que devem ser somados.
Responder: “26” (errado!)

IA com raciocínio faria:

Primeiro analisar: “João inicialmente tem 15.”
“Dá 3 para Maria, então 15-3=12.”
“Compra mais 8, então 12+8=20.”
Finalmente responder: “20” (correto!)

Benefícios do raciocínio:

Reduz alucinações - Porque a IA “verifica” seus próprios pensamentos, é menos provável que fale bobagem.
Lógica mais rigorosa - Deriva passo a passo, sem pular etapas.
Explicável - Você pode ver como a IA pensa (embora na maioria das vezes esse processo de pensamento esteja oculto).
Lida com problemas complexos - A precisão melhora significativamente para problemas que exigem raciocínio de múltiplas etapas.

Mas o raciocínio também tem custos:

Velocidade mais lenta (porque precisa “pensar”).
Custo mais alto (mais computação).
Nem todos os problemas precisam de raciocínio (por exemplo, “olá” não precisa de meio dia de pensamento).

Agora a maioria das IAs adicionou essa capacidade de raciocínio. Por exemplo, o modelo de pensamento do ChatGPT, o modo de pensamento profundo do DeepSeek.

Um resumo rápido:

IA comum = um aluno que fala respostas rapidamente (pode estar errado).
IA com raciocínio = um aluno que faz o rascunho cuidadosamente (maior precisão).

Isso não significa que a IA pode realmente “pensar”; ela apenas adiciona algumas etapas de verificação antes do cálculo de probabilidade. Mas o efeito é claro — menos alucinações, respostas mais confiáveis.

Para usar a analogia mais adequada: A IA Generativa é como um “super aluno de humanas” que leu inúmeros livros e viu o mundo. Você pode perguntar qualquer coisa, ela pode conversar com você e ajudar a escrever coisas. No entanto, ela responde “memorizando o banco de questões” em vez de realmente entender o conhecimento. As novas versões estão começando a aprender a “fazer o rascunho”.

Na Verdade, a Família da IA é Enorme

Muitas pessoas pensam que IA é só ChatGPT, mas não é. A família da IA tem muitos membros:

1. IA de Reconhecimento - A que vê claramente

Reconhecimento facial (desbloqueio de celular, pagamento por rosto)
Reconhecimento de imagem (identificar flores por foto, reconhecer texto)
Reconhecimento de fala (Siri, Xiao Ai entendendo sua fala)
Essas IAs são especializadas em “reconhecer”, não em “criar”.

2. IA de Recomendação - A que melhor conhece sua mente

Douyin (TikTok) recomenda vídeos para você.
Taobao recomenda produtos.
NetEase Cloud Music recomenda músicas.
Elas são excelentes em “adivinhar o que você gosta”, mas não geram novo conteúdo.

3. IA de Decisão - A que é ótima em xadrez e jogos

AlphaGo (jogando Go)
IA de jogos (como o oponente computadorizado no StarCraft)
Elas focam em “tomar decisões”, superando humanos em domínios específicos.

4. IA Generativa - A onda quente atual

Geração de texto: ChatGPT, Claude, DeepSeek
Geração de imagem: Midjourney, Stable Diffusion, DALL-E
Geração de vídeo: Sora, Runway
Geração de música: Suno, Udio

Resumo

Um resumo rápido: Se compararmos a IA a uma caixa de ferramentas, a IA de reconhecimento é uma “lupa”, a IA de recomendação é uma “bússola”, a IA de decisão é um “manual de xadrez” e a IA generativa é uma “varinha mágica” — ela pode fazer aparecer o que você quer.

Mas essa “varinha mágica” é na verdade uma “calculadora de probabilidades”. Ela é poderosa, mas não é onipotente. E este tutorial é principalmente sobre como usar bem essa “varinha mágica”.