RL RanceLee Tutorials
← Voltar aos tutoriais

O Método Karpathy: Construa uma Wiki Pessoal com LLMs

Recentemente, um Gist de Andrej Karpathy se espalhou pela comunidade tech. Depois de lê-lo, meu primeiro pensamento foi: essa ideia tem uma conexão mais profunda com o Obsidian do que a maioria das pessoas imagina. Este artigo é sobre isso.


Quem é Karpathy

Se você acompanha o mundo da IA, esse nome deve ser familiar. Mas se você não sabe muito sobre ele, acho que vale a pena explicar primeiro.

Karpathy não é aquele tipo de “líder de IA que gerencia produtos em uma grande empresa”; ele é verdadeiramente um dos próprios do campo do deep learning.

Ele fez seu doutorado em Stanford sob orientação de Fei-Fei Li — a pessoa que liderou o ImageNet e essencialmente lançou a visão computacional moderna. Depois de sair do grupo de Fei-Fei Li, Karpathy foi para a OpenAI como um dos cofundadores. Em 2017, a Tesla o contratou para liderar o sistema de percepção visual do Autopilot.

Durante seus anos na Tesla, muitas pessoas agora conhecem o resultado: a Tesla foi quase a única empresa de direção autônoma na época que insistiu em uma abordagem puramente visual — sem lidar, apenas câmeras + redes neurais. Essa abordagem foi fortemente criticada na época como radical demais. Os resultados depois ficaram claros para todos.

Ele saiu da Tesla em 2022, voltou brevemente para a OpenAI em 2023, depois saiu novamente para iniciar seu próprio projeto de educação em IA, karpathy.ai.

O que acho interessante nele não é apenas seu currículo, mas que ele mantém um estado raro: capaz de fazer engenharia de nível mundial, mas disposto a passar tempo escrevendo artigos e gravando cursos para explicar a lógica subjacente da tecnologia para pessoas comuns.

Seus nanoGPT e micrograd no GitHub são reimplementações mínimas de GPT e retropropagação, projetadas especificamente para que pessoas comuns realmente entendam. Seu curso CS231n no YouTube ensinou deep learning a inúmeras pessoas.

Então, quando ele escreveu um Gist no GitHub sobre “usar LLMs para gerenciar bases de conhecimento”, ele rapidamente se espalhou pela comunidade tech. Acho que vale uma leitura cuidadosa.

O que Ele Disse

O Gist se chama LLM Wiki: A pattern for building personal knowledge bases with LLMs. O link original:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Seu ponto de partida é um sentimento que muitos já tiveram: Sua base de conhecimento continua crescendo, mas o que você realmente consegue usar continua diminuindo.

Você marca artigos como favoritos, faz anotações de leitura no Notion, constrói uma pilha de notas no Obsidian, mas na próxima vez que precisar de um certo conhecimento, a probabilidade de encontrá-lo não é alta. Não é que você não consiga encontrar — é muito disperso, sem conexões entre eles. Mesmo se encontrar, são fragmentos que você precisa juntar sozinho.

Ele atribui esse problema às deficiências de duas soluções existentes:

Primeiro: A abordagem de favoritos.
Você joga o texto original lá, não faz nada, e depende inteiramente da busca. O problema é que a busca encontra documentos, não respostas. Você ainda precisa ler, entender e sintetizar por conta própria.

Segundo: A abordagem RAG (Retrieval-Augmented Generation).
Você fornece um monte de documentos para a IA, que recupera e gera respostas na hora. Isso é muito melhor que favoritos, mas é sempre temporário, começando do zero a cada vez, sem acúmulo.

O LLM Wiki que ele propõe é uma ideia diferente: Não deixe a IA organizar temporariamente durante a busca; em vez disso, deixe a IA manter continuamente uma Wiki que está sempre sendo atualizada.

Como o LLM Wiki Funciona

Toda a arquitetura tem três camadas:

Fontes Brutas
São as coisas que você normalmente lê: artigos, livros, legendas de vídeos, anotações de reuniões. Elas são armazenadas aqui como estão, como material bruto.

A Wiki
Um conjunto de arquivos Markdown, cada um correspondendo a um tópico, conceito ou entidade. Por exemplo, você pode ter uma página “Machine Learning - Overfitting”, uma página “Anotações de Leitura - Estar no Jogo” e uma página “Pessoas - Feynman”.

Esses arquivos não são escritos por você; eles são escritos e mantidos continuamente pela IA. Cada vez que um novo material chega, a IA atualiza as páginas relevantes; referências cruzadas são estabelecidas entre páginas; se surgirem contradições, elas são sinalizadas.

O Schema
Uma configuração que diz à IA “como essa Wiki deve ser”. Por exemplo, quais campos cada nota deve conter, como organizar, o que constitui uma nota órfã, quais conceitos precisam de sua própria página.

Depois, três operações principais:

Ingest
Cada vez que um novo material chega, a IA o lê e atualiza de 10 a 15 páginas da Wiki. Não apenas criando novas, mas também atualizando conteúdo existente, adicionando referências cruzadas e sinalizando áreas que precisam de mais confirmação.

Query
Você faz uma pergunta, e a IA sintetiza uma resposta a partir da Wiki. O ponto chave é: se a própria consulta produz novas integrações valiosas, a IA também as escreve de volta na Wiki. Em outras palavras, quanto mais você usa, mais rica a Wiki se torna.

Lint
Esta é uma operação que ele menciona especificamente, e acho que é a parte mais inteligente do esquema. A IA periodicamente realiza uma verificação de saúde em toda a Wiki:

  • Existem duas páginas com conteúdo contraditório?
  • Existem afirmações desatualizadas?
  • Existem páginas órfãs sem links de outras páginas?
  • Existem referências cruzadas obviamente ausentes?

Fazer essas coisas manualmente seria tedioso e quase impossível de sustentar. Mas para a IA, é puro trabalho braçal.

A divisão de trabalho é a seguinte:

Humanos são responsáveis por: curadoria (escolher o que vale a pena incluir), julgamento crítico (essa conclusão está correta?), supervisão (revisar periodicamente as atualizações da IA)
IA é responsável por: bookkeeping — referências cruzadas, manutenção de consistência, limpeza de nós órfãos, formatação

Ele usa o termo: bookkeeping. Essa palavra é bem escolhida. Não se trata de deixar a IA pensar por você, mas de entregar as tarefas de manutenção que você sabe que deveria fazer, mas continua adiando, para a IA.

Por Que Usuários do Obsidian Devem Prestar Atenção Especial

Notei algo recentemente: alguns amigos da comunidade de programação, que antes não se interessavam pelo Obsidian, começaram a usá-lo um após o outro.

Quando perguntados por quê, as respostas são quase as mesmas: porque é muito adequado para trabalhar com IA. Arquivos locais, Markdown puro, sem dependência — essas costumavam ser preferências de nicho, mas agora se tornaram vantagens. Ferramentas como Claude Code podem ler e escrever diretamente em um Vault do Obsidian sem nenhuma configuração extra; o que a IA pode fazer, ela faz diretamente.

O Gist do Karpathy, de certa forma, torna isso ainda mais claro.

Eu mesmo uso o Obsidian há um tempo, e depois de ler esse Gist, tive uma forte sensação:

A Wiki que ele descreve é essencialmente um Vault do Obsidian mantido ativamente por uma IA.

Pense bem: qual é o núcleo do Obsidian? Um monte de arquivos Markdown locais, conectados por links bidirecionais.

Qual é o núcleo do LLM Wiki? Um monte de arquivos Markdown, mais uma IA que ajuda você a criar e manter links, integrar conteúdo e realizar verificações de saúde.

O meio subjacente é exatamente o mesmo. Um Vault do Obsidian é quase a implementação mais natural de um LLM Wiki.

As coisas que você faz manualmente agora — criar links bidirecionais para notas, escrever Mapas de Conteúdo (MOCs), organizar e arquivar periodicamente — uma parte significativa disso pode ser feita pela IA como “trabalho de bookkeeping” no design do LLM Wiki.

Deixe-me dar um exemplo meu: depois que termino de escrever um artigo, a etapa de criar e organizar links bidirecionais agora é tratada por uma Skill. A IA escaneia meu vault de notas, encontra artigos relacionados e adiciona automaticamente links bidirecionais. Eu costumava procrastinar nessa etapa toda vez, mas agora quase não me preocupo com isso.

O LLM Wiki do Karpathy leva isso adiante: não apenas executar uma vez após escrever um artigo, mas manter toda a base de conhecimento em um estado continuamente mantido, com Ingest, Query e Lint automatizados.

Claro, também há vozes que acham que essa abordagem tem problemas.

Alguns na comunidade tech fizeram uma comparação com o Zettelkasten: o Zettelkasten tradicional enfatiza que o ato de escrever notas ativamente é em si o processo de entendimento — não coletar, mas construir conexões através da escrita. Se a IA resume e cria associações para você, esse processo de entendimento não desaparece? Você obtém uma base de conhecimento arrumada, mas não há nada no seu cérebro?

Essa é uma questão real, e acho que não há uma resposta padrão.

Mas para usuários do Obsidian, meu próprio julgamento é: essas duas coisas não são contraditórias, desde que você esclareça quais tarefas são “realmente precisam de pensamento” e quais são “bookkeeping chato”.

Por exemplo:

  • Ler um artigo, extrair ideias centrais, escrever seus próprios sentimentos e reflexões → isso é pensamento, deve ser feito por você
  • Verificar quais notas não foram linkadas nos últimos três meses → isso é bookkeeping, perfeitamente razoável delegar à IA
  • Sintetizar múltiplas fontes sob um conceito → pode ter um rascunho da IA, você revisa
  • Manter campos de frontmatter de um monte de notas → isso é puro trabalho braçal, a IA faz

O risco real não é que você pare de pensar por usar IA, mas que você equipare “ter a IA resumindo este artigo” com “eu li este artigo.”

Desde que você consiga distinguir isso, a abordagem LLM Wiki é, na verdade, uma extensão bastante valiosa para usuários do Obsidian.

Próximos Passos

O Gist do Karpathy está atualmente no estágio de “propor um bom padrão, mas não fornecer uma ferramenta pronta para uso.”

Algumas pessoas na comunidade começaram a implementar essa ideia em diferentes direções, mas ainda é muito cedo.

Eu pretendo atualizar seriamente minha própria configuração: primeiro reorganizar meu vault de notas do Obsidian de acordo com a abordagem LLM Wiki, depois levar minha Skill existente de links bidirecionais adiante, tentando adicionar lógica de Ingest e Lint para torná-la uma Skill mais completa.

Usando Claude Code + Obsidian Vault, vou executar todo o processo do início ao fim — ver o que funciona, quais são as armadilhas e o que precisa ser reprojetado. Se funcionar, vou empacotar tudo e compartilhar, para que outros possam usar diretamente sem construir do zero.

O próximo capítulo cobrirá esse processo prático.

Resumo

O que aprendemos hoje:

  1. Karpathy é um pesquisador de deep learning de Stanford, líder da abordagem puramente visual do Autopilot da Tesla e cofundador da OpenAI, atualmente focado em educação em IA.
  2. LLM Wiki é um padrão onde “a IA mantém ativamente a base de conhecimento”, em oposição à recuperação passiva no RAG.
  3. A arquitetura central tem três camadas: Fontes Brutas → Wiki (coleção de arquivos Markdown) → Schema (definição de estrutura).
  4. Três operações: Ingest (ingerir e atualizar) / Query (consultar e escrever de volta) / Lint (verificação de saúde).
  5. A divisão central do trabalho: humanos fazem curadoria e julgamento, IA faz “bookkeeping” — referências cruzadas, manutenção de consistência, limpeza de nós órfãos.

Principais conclusões:

  • Um Vault do Obsidian é em si uma coleção de arquivos Markdown, altamente consistente com o meio do LLM Wiki, tornando-o quase a implementação mais natural.
  • Os links bidirecionais e MOCs que você cria manualmente agora são exatamente as referências cruzadas mantidas automaticamente pela IA no LLM Wiki.
  • Preocupar-se com “a IA pensando por você” é razoável, mas isso é diferente de ter a IA fazendo “bookkeeping” — não confunda os dois.
  • Este padrão atualmente não tem uma ferramenta pronta para uso; você precisa construir a sua própria.
  • O próximo capítulo abordará uma implementação prática; se funcionar, será empacotado como uma Skill e compartilhado.