El Método Karpathy: Construye una Wiki Personal con LLMs

Recientemente, un Gist de Andrej Karpathy se ha estado difundiendo ampliamente en la comunidad tecnológica. Después de leerlo, mi primer pensamiento fue: esta idea tiene una conexión más profunda con Obsidian de lo que la mayoría de la gente cree. Este artículo trata sobre eso.

Quién es Karpathy

Si sigues el mundo de la IA, este nombre debería resultarte familiar. Pero si no sabes mucho sobre él, creo que vale la pena explicarlo primero.

Karpathy no es el típico “líder de IA que gestiona productos en una gran empresa”; es verdaderamente uno de los propios en el campo del aprendizaje profundo.

Hizo su doctorado en Stanford bajo la supervisión de Fei-Fei Li, la persona que lideró ImageNet y esencialmente lanzó la visión por computadora moderna. Después de dejar el grupo de Fei-Fei Li, Karpathy se fue a OpenAI como uno de sus cofundadores. En 2017, Tesla lo fichó para liderar el sistema de percepción visual de Autopilot.

Durante sus años en Tesla, mucha gente conoce ahora el resultado: Tesla fue casi la única empresa de conducción autónoma en ese momento que insistió en un enfoque puramente visual — sin lidar, solo cámaras + redes neuronales. Este enfoque fue muy criticado en su momento por considerarse demasiado radical. Los resultados después quedaron claros para todos.

Dejó Tesla en 2022, regresó brevemente a OpenAI en 2023, y luego se fue de nuevo para iniciar su propio proyecto de educación en IA, karpathy.ai.

Lo que me parece interesante de él no es solo su currículum, sino que mantiene un estado poco común: capaz de hacer ingeniería de clase mundial, pero dispuesto a dedicar tiempo a escribir artículos y grabar cursos para explicar la lógica subyacente de la tecnología a la gente común.

Sus nanoGPT y micrograd en GitHub son reimplementaciones mínimas de GPT y retropropagación, diseñadas específicamente para que la gente común realmente las entienda. Su curso CS231n en YouTube ha enseñado aprendizaje profundo a innumerables personas.

Así que cuando escribió un Gist en GitHub sobre “usar LLMs para gestionar bases de conocimiento”, se difundió rápidamente por la comunidad tecnológica. Creo que vale la pena leerlo con atención.

Lo que dijo

El Gist se titula LLM Wiki: A pattern for building personal knowledge bases with LLMs. El enlace original:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Su punto de partida es una sensación que muchos han tenido: Tu base de conocimiento sigue creciendo, pero lo que realmente puedes usar sigue reduciéndose.

Marcas artículos como favoritos, tomas notas de lectura en Notion, construyes un montón de notas en Obsidian, pero la próxima vez que necesites cierto conocimiento, la probabilidad de encontrarlo no es alta. No es que no puedas encontrarlo — está demasiado disperso, sin conexiones entre ellas. Incluso si las encuentras, son fragmentos que tienes que recomponer tú mismo.

Él atribuye este problema a las deficiencias de dos soluciones existentes:

Primera: El enfoque de marcadores.
Viertes el texto original, no haces nada, y confías completamente en la búsqueda. El problema es que la búsqueda encuentra documentos, no respuestas. Todavía tienes que leer, entender y sintetizar tú mismo.

Segunda: El enfoque RAG (Generación Aumentada por Recuperación).
Proporcionas un montón de documentos a la IA, que recupera y genera respuestas sobre la marcha. Esto es mucho mejor que los marcadores, pero siempre es temporal, empezando desde cero cada vez, sin acumulación.

Su propuesta de LLM Wiki es una idea diferente: No dejes que la IA organice temporalmente durante la búsqueda; en su lugar, deja que la IA mantenga continuamente una Wiki en constante actualización.

Cómo funciona LLM Wiki

Toda la arquitectura tiene tres capas:

Fuentes en bruto
Son las cosas que sueles leer: artículos, libros, subtítulos de videos, notas de reuniones. Se almacenan aquí tal cual, como material en bruto.

La Wiki
Un conjunto de archivos Markdown, cada uno correspondiente a un tema, concepto o entidad. Por ejemplo, podrías tener una página “Machine Learning - Overfitting”, una página “Notas de lectura - Estar en el juego”, y una página “Personas - Feynman”.

Estos archivos no están escritos por ti; están escritos y mantenidos continuamente por la IA. Cada vez que entra nuevo material, la IA actualiza las páginas relevantes; se establecen referencias cruzadas entre páginas; si surgen contradicciones, se señalan.

El Esquema
Una configuración que le dice a la IA “cómo debería ser esta Wiki”. Por ejemplo, qué campos debe contener cada nota, cómo organizarse, qué constituye una nota huérfana, qué conceptos necesitan su propia página.

Luego tres operaciones principales:

Ingest (Ingerir)
Cada vez que entra nuevo material, la IA lo lee y actualiza de 10 a 15 páginas de la Wiki. No solo crea nuevas, sino que también actualiza el contenido existente, añade referencias cruzadas y señala áreas que necesitan más confirmación.

Query (Consultar)
Haces una pregunta, y la IA sintetiza una respuesta a partir de la Wiki. La clave es: si la consulta en sí misma produce nuevas integraciones valiosas, la IA también las escribe de vuelta en la Wiki. En otras palabras, cuanto más la uses, más rica se vuelve la Wiki.

Lint (Revisar)
Esta es una operación que menciona específicamente, y creo que es la parte más inteligente del esquema. La IA realiza periódicamente una verificación de salud de toda la Wiki:

¿Hay dos páginas con contenido contradictorio?
¿Hay afirmaciones desactualizadas?
¿Hay páginas huérfanas sin que otras páginas enlacen a ellas?
¿Hay referencias cruzadas obviamente faltantes?

Hacer estas cosas manualmente sería tedioso y casi imposible de mantener. Pero para la IA, es puro trabajo pesado.

La división del trabajo es la siguiente:

Los humanos son responsables de: curación (elegir qué vale la pena incluir), juicio crítico (¿es correcta esta conclusión?), supervisión (revisar periódicamente las actualizaciones de la IA)
La IA es responsable de: bookkeeping — referencias cruzadas, mantenimiento de consistencia, limpieza de nodos huérfanos, formato

Él usa el término: bookkeeping. Esta palabra está bien elegida. No se trata de dejar que la IA piense por ti, sino de entregarle las tareas de mantenimiento que sabes que deberías hacer pero sigues posponiendo.

Por qué los usuarios de Obsidian deberían prestar especial atención

He notado algo recientemente: algunos de mis amigos en la comunidad de programación, que antes no estaban interesados en Obsidian, han empezado a usarlo uno tras otro.

Cuando les pregunté por qué, las respuestas son casi siempre las mismas: porque es muy adecuado para trabajar con IA. Archivos locales, Markdown plano, sin bloqueo — estas solían ser preferencias de nicho, pero ahora se han convertido en ventajas. Herramientas como Claude Code pueden leer y escribir directamente en un Vault de Obsidian sin configuración adicional; lo que la IA puede hacer, lo hace directamente.

El Gist de Karpathy, en cierto modo, lo deja aún más claro.

Yo mismo he estado usando Obsidian por un tiempo, y después de leer este Gist, tuve una fuerte sensación:

La Wiki que describe es esencialmente un Vault de Obsidian mantenido activamente por una IA.

Piénsalo: ¿cuál es el núcleo de Obsidian? Un montón de archivos Markdown locales, conectados por enlaces bidireccionales.

¿Cuál es el núcleo de LLM Wiki? Un montón de archivos Markdown, más una IA que te ayuda a crear y mantener enlaces, integrar contenido y realizar verificaciones de salud.

El medio subyacente es exactamente el mismo. Un Vault de Obsidian es casi la implementación más natural de una LLM Wiki.

Las cosas que haces manualmente ahora — crear enlaces bidireccionales para notas, escribir Mapas de Contenido (MOCs), organizar y archivar periódicamente — una parte significativa de ellas puede ser realizada por la IA como “trabajo de bookkeeping” en el diseño de LLM Wiki.

Déjame darte mi propio ejemplo: después de terminar de escribir un artículo, el paso de crear y organizar enlaces bidireccionales ahora lo maneja un Skill. La IA escanea mi vault de notas, encuentra artículos relacionados y añade automáticamente enlaces bidireccionales. Antes procrastinaba este paso cada vez, pero ahora apenas me preocupo.

El LLM Wiki de Karpathy lleva esto más allá: no solo ejecutarlo una vez después de escribir un artículo, sino mantener toda la base de conocimiento en un estado de actualización continua, con Ingest, Query y Lint automatizados.

Por supuesto, también hay voces que piensan que este enfoque tiene problemas.

Algunos en la comunidad tecnológica han hecho una comparación con Zettelkasten: el Zettelkasten tradicional enfatiza que el acto de escribir notas activamente es en sí mismo el proceso de comprensión — no recolectar, sino construir conexiones a través de la escritura. Si la IA resume y crea asociaciones por ti, ¿no desaparece ese proceso de comprensión? Obtienes una base de conocimiento ordenada, pero ¿no hay nada en tu cerebro?

Esta es una pregunta real, y creo que no hay una respuesta estándar.

Pero para los usuarios de Obsidian, mi propio juicio es: estas dos cosas no son contradictorias, siempre que aclares qué tareas son “realmente necesitan pensar” y cuáles son “bookkeeping molesto”.

Por ejemplo:

Leer un artículo, extraer ideas centrales, escribir tus propios sentimientos y reflexiones → esto es pensar, debe hacerlo uno mismo
Verificar qué notas no han sido enlazadas en tres meses → esto es bookkeeping, perfectamente razonable delegarlo a la IA
Sintetizar múltiples fuentes bajo un concepto → la IA puede hacer un borrador, tú lo revisas
Mantener los campos de frontmatter de un montón de notas → esto es puro trabajo pesado, lo hace la IA

El riesgo real no es que dejes de pensar porque usas IA, sino que equipares “hacer que la IA resuma este artículo” con “yo he leído este artículo”.

Mientras puedas distinguir esto, el enfoque LLM Wiki es en realidad una extensión bastante valiosa para los usuarios de Obsidian.

Próximos pasos

El Gist de Karpathy está actualmente en la etapa de “proponer un buen patrón, pero no proporcionar una herramienta lista para usar.”

Algunas personas en la comunidad han comenzado a implementar esta idea en diferentes direcciones, pero todavía es muy temprano.

Planeo mejorar seriamente mi propia configuración: primero reorganizar mi vault de notas de Obsidian según el enfoque LLM Wiki, luego llevar mi Skill de enlaces bidireccionales existente más allá, intentando añadir lógica de Ingest y Lint para convertirlo en un Skill más completo.

Usando Claude Code + Obsidian Vault, ejecutaré todo el proceso de principio a fin — para ver qué funciona, cuáles son los escollos y qué necesita rediseño. Si funciona, empaquetaré todo y lo compartiré, para que otros puedan usarlo directamente sin tener que construirlo desde cero.

El próximo capítulo cubrirá este proceso práctico.

Resumen

Lo que aprendimos hoy:

Karpathy es un investigador de aprendizaje profundo de Stanford, líder del enfoque de visión pura de Tesla para Autopilot, y cofundador de OpenAI, actualmente centrado en la educación en IA.
LLM Wiki es un patrón donde “la IA mantiene activamente la base de conocimiento”, en contraste con la recuperación pasiva en RAG.
La arquitectura central tiene tres capas: Fuentes en bruto → Wiki (colección de archivos Markdown) → Esquema (definición de estructura).
Tres operaciones: Ingest (ingerir y actualizar) / Query (consultar y escribir de vuelta) / Lint (verificación de salud).
La división central del trabajo: los humanos hacen curación y juicio, la IA hace “bookkeeping” — referencias cruzadas, mantenimiento de consistencia, limpieza de nodos huérfanos.

Conclusiones clave:

Un Vault de Obsidian es en sí mismo una colección de archivos Markdown, altamente consistente con el medio de LLM Wiki, lo que lo convierte en casi la implementación más natural.
Los enlaces bidireccionales y MOCs que creas manualmente ahora son exactamente las referencias cruzadas que la IA mantiene automáticamente en LLM Wiki.
Preocuparse por “la IA piensa por ti” es razonable, pero eso es diferente de que la IA haga “bookkeeping” — no los confundas.
Este patrón actualmente no tiene una herramienta lista para usar; necesitas construirla tú mismo.
El próximo capítulo recorrerá una implementación práctica; si funciona, se empaquetará como un Skill y se compartirá.