Die Karpathy-Methode: Erstelle ein persönliches Wiki mit LLMs

Kürzlich verbreitete sich ein Gist von Andrej Karpathy in der Tech-Community. Nachdem ich es gelesen hatte, war mein erster Gedanke: Diese Idee hat eine tiefere Verbindung zu Obsidian, als die meisten Menschen denken. Darum geht es in diesem Artikel.

Wer ist Karpathy

Wenn du die KI-Welt verfolgst, sollte dir dieser Name bekannt vorkommen. Falls du aber nicht viel über ihn weißt, halte ich es für sinnvoll, ihn kurz vorzustellen.

Karpathy ist nicht der Typ „KI-Führungskraft, die bei einem großen Unternehmen Produkte managt“; er ist wirklich einer der Eigenen im Bereich Deep Learning.

Er promovierte an der Stanford University bei Fei-Fei Li – der Person, die ImageNet ins Leben rief und im Wesentlichen die moderne Computer Vision begründete. Nach seiner Zeit in Fei-Fei Lis Gruppe ging Karpathy zu OpenAI, wo er einer der Mitbegründer war. 2017 holte Tesla ihn ab, um das visuelle Wahrnehmungssystem für Autopilot zu leiten.

Während seiner Jahre bei Tesla kennen viele heute das Ergebnis: Tesla war damals fast das einzige Unternehmen für autonomes Fahren, das auf einen reinen Vision-Ansatz setzte – kein Lidar, nur Kameras + neuronale Netze. Dieser Ansatz wurde damals heftig kritisiert, da er zu radikal sei. Die Ergebnisse wurden später für alle offensichtlich.

Er verließ Tesla 2022, kehrte kurz 2023 zu OpenAI zurück, um dann wieder zu gehen und sein eigenes KI-Bildungsprojekt karpathy.ai zu gründen.

Was ich an ihm interessant finde, ist nicht nur sein Lebenslauf, sondern dass er einen seltenen Zustand bewahrt: Er kann Weltklasse-Engineering betreiben und ist dennoch bereit, Zeit zu investieren, um Artikel zu schreiben und Kurse aufzuzeichnen, die die zugrunde liegende Logik der Technologie für normale Menschen erklären.

Seine nanoGPT und micrograd auf GitHub sind minimale Neuimplementierungen von GPT und Backpropagation, die speziell dafür entwickelt wurden, dass normale Menschen sie wirklich verstehen. Sein CS231n-Kurs auf YouTube hat unzähligen Menschen Deep Learning beigebracht.

Als er also einen Gist auf GitHub über „Nutzung von LLMs zur Verwaltung von Wissensdatenbanken“ schrieb, verbreitete sich dieser schnell in der Tech-Community. Ich denke, es lohnt sich, ihn genau zu lesen.

Was er sagte

Der Gist trägt den Titel LLM Wiki: A pattern for building personal knowledge bases with LLMs. Der ursprüngliche Link:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Sein Ausgangspunkt ist ein Gefühl, das viele Menschen teilen: Deine Wissensdatenbank wächst ständig, aber was du tatsächlich nutzen kannst, schrumpft immer weiter.

Du speicherst Artikel, machst Lese-Notizen in Notion, baust einen Notizhaufen in Obsidian auf, aber wenn du das nächste Mal ein bestimmtes Wissen brauchst, ist die Wahrscheinlichkeit, es zu finden, nicht hoch. Es liegt nicht daran, dass du es nicht findest – es ist zu verstreut, es gibt keine Verbindungen zwischen ihnen. Selbst wenn du sie findest, sind es Fragmente, die du selbst zusammenfügen musst.

Er führt dieses Problem auf die Schwächen zweier bestehender Lösungen zurück:

Erstens: Der Bookmark-Ansatz.
Du kippst den Originaltext hinein, tust nichts, und verlässt dich ganz auf die Suche. Das Problem: Die Suche findet Dokumente, nicht Antworten. Du musst trotzdem lesen, verstehen und selbst synthetisieren.

Zweitens: Der RAG-Ansatz (Retrieval-Augmented Generation).
Du gibst der KI einen Haufen Dokumente, die sie abruft und daraus spontan Antworten generiert. Das ist viel besser als Bookmarks, aber es ist immer temporär, beginnt jedes Mal von Null, keine Anhäufung.

Sein vorgeschlagenes LLM Wiki ist eine andere Idee: Lass die KI nicht während der Suche temporär organisieren, sondern lass die KI kontinuierlich ein sich ständig aktualisierendes Wiki pflegen.

Wie das LLM Wiki funktioniert

Die gesamte Architektur hat drei Schichten:

Rohquellen
Das sind die Dinge, die du normalerweise liest: Artikel, Bücher, Video-Untertitel, Besprechungsnotizen. Sie werden hier unverändert als Rohmaterial gespeichert.

Das Wiki
Eine Sammlung von Markdown-Dateien, jede entspricht einem Thema, Konzept oder einer Entität. Zum Beispiel könntest du eine Seite „Maschinelles Lernen – Überanpassung“ haben, eine Seite „Lese-Notizen – Im Spiel sein“ und eine Seite „Personen – Feynman“.

Diese Dateien werden nicht von dir geschrieben, sondern von der KI geschrieben und kontinuierlich gepflegt. Jedes Mal, wenn neues Material eingeht, aktualisiert die KI relevante Seiten; zwischen den Seiten werden Querverweise angelegt; falls Widersprüche auftauchen, werden sie markiert.

Das Schema
Eine Konfiguration, die der KI sagt, „wie dieses Wiki aussehen soll“. Zum Beispiel, welche Felder jede Notiz enthalten soll, wie organisiert wird, was eine verwaiste Notiz ist, welche Konzepte eine eigene Seite brauchen.

Dann drei Kernoperationen:

Ingest (Aufnahme)
Jedes Mal, wenn neues Material eingeht, liest die KI es und aktualisiert 10 bis 15 Wiki-Seiten. Nicht nur neue erstellen, sondern auch bestehende Inhalte aktualisieren, Querverweise hinzufügen und Bereiche markieren, die weitere Bestätigung benötigen.

Query (Abfrage)
Du stellst eine Frage, und die KI synthetisiert eine Antwort aus dem Wiki. Der Schlüssel: Wenn die Abfrage selbst wertvolle neue Integrationen hervorbringt, schreibt die KI diese auch zurück ins Wiki. Mit anderen Worten: Je mehr du es nutzt, desto reicher wird das Wiki.

Lint (Gesundheitscheck)
Dies ist eine Operation, die er speziell erwähnt, und ich finde, es ist der klügste Teil des Schemas. Die KI führt regelmäßig einen Gesundheitscheck des gesamten Wikis durch:

Gibt es zwei Seiten mit widersprüchlichem Inhalt?
Gibt es Aussagen, die veraltet sind?
Gibt es verwaiste Seiten, auf die keine andere Seite verweist?
Gibt es offensichtlich fehlende Querverweise?

Diese Dinge manuell zu tun, wäre mühsam und fast unmöglich durchzuhalten. Aber für die KI ist es reine Fleißarbeit.

Die Arbeitsteilung ist wie folgt:

Menschen sind verantwortlich für: Kuratierung (Auswahl, was aufgenommen werden soll), kritisches Urteilsvermögen (ist diese Schlussfolgerung richtig?), Überwachung (regelmäßiges Überprüfen der KI-Aktualisierungen)
KI ist verantwortlich für: Buchhaltung – Querverweise, Konsistenzwahrung, Bereinigung verwaister Knoten, Formatierung

Er verwendet den Begriff: bookkeeping. Dieses Wort ist gut gewählt. Es geht nicht darum, dass die KI für dich denkt, sondern darum, die Wartungsaufgaben, von denen du weißt, dass du sie tun solltest, die du aber immer wieder aufschiebst, an die KI zu übergeben.

Warum Obsidian-Nutzer besonders aufpassen sollten

Mir ist in letzter Zeit etwas aufgefallen: Einige meiner Freunde aus der Programmier-Community, die sich vorher nicht für Obsidian interessiert haben, haben begonnen, es nacheinander zu nutzen.

Auf die Frage, warum, sind die Antworten meist die gleichen: Weil es so geeignet für die Zusammenarbeit mit KI ist. Lokale Dateien, reines Markdown, keine Bindung – das waren früher Nischenpräferenzen, aber jetzt sind sie zu Vorteilen geworden. Tools wie Claude Code können direkt ein Obsidian Vault lesen und schreiben, ohne zusätzliche Konfiguration; was die KI tun kann, kann sie direkt tun.

Karpathys Gist macht dies in gewisser Weise noch deutlicher.

Ich selbst nutze Obsidian schon eine Weile, und nachdem ich diesen Gist gelesen hatte, hatte ich ein starkes Gefühl:

Das Wiki, das er beschreibt, ist im Wesentlichen ein Obsidian Vault, das aktiv von einer KI gepflegt wird.

Denk mal drüber nach: Was ist der Kern von Obsidian? Ein Haufen lokaler Markdown-Dateien, verbunden durch bidirektionale Links.

Was ist der Kern des LLM Wiki? Ein Haufen Markdown-Dateien, plus eine KI, die dir hilft, Links zu erstellen und zu pflegen, Inhalte zu integrieren und Gesundheitschecks durchzuführen.

Das zugrunde liegende Medium ist genau dasselbe. Ein Obsidian Vault ist fast die natürlichste Implementierung eines LLM Wiki.

Die Dinge, die du jetzt manuell erledigst – bidirektionale Links für Notizen erstellen, Maps of Content (MOCs) schreiben, regelmäßig organisieren und archivieren – ein erheblicher Teil davon kann von der KI als „Buchhaltungsarbeit“ im LLM-Wiki-Design erledigt werden.

Lass mich dir ein eigenes Beispiel geben: Nachdem ich einen Artikel fertig geschrieben habe, wird der Schritt des Erstellens und Organisierens von bidirektionalen Links jetzt von einem Skill erledigt. Die KI scannt meinen Notiz-Vault, findet verwandte Artikel und fügt automatisch bidirektionale Links hinzu. Früher habe ich diesen Schritt jedes Mal aufgeschoben, aber jetzt mache ich mir kaum noch Sorgen darum.

Karpathys LLM Wiki geht noch weiter: Nicht nur einmal nach dem Schreiben eines Artikels ausführen, sondern die gesamte Wissensdatenbank in einem kontinuierlich gepflegten Zustand halten, mit Ingest, Query und Lint automatisiert.

Natürlich gibt es auch Stimmen, die diesen Ansatz für problematisch halten.

Einige in der Tech-Community haben einen Vergleich zum Zettelkasten gezogen: Traditioneller Zettelkasten betont, dass der Akt des aktiven Notizen-Schreibens selbst der Prozess des Verstehens ist – nicht sammeln, sondern durch Schreiben Verbindungen aufbauen. Wenn die KI für dich zusammenfasst und Assoziationen erstellt, verschwindet dann nicht dieser Verstehensprozess? Du bekommst eine aufgeräumte Wissensdatenbank, aber ist da nichts in deinem Gehirn?

Das ist eine echte Frage, und ich denke, es gibt keine Standardantwort.

Aber für Obsidian-Nutzer ist mein eigenes Urteil: Diese beiden Dinge widersprechen sich nicht, vorausgesetzt du klärst, welche Aufgaben „wirklich Denken erfordern“ und welche „lästige Buchhaltung“ sind.

Zum Beispiel:

Einen Artikel lesen, Kernideen extrahieren, eigene Gefühle und Reflexionen schreiben → das ist Denken, sollte selbst gemacht werden
Überprüfen, welche Notizen seit drei Monaten nicht verlinkt wurden → das ist Buchhaltung, völlig in Ordnung, das an die KI zu delegieren
Mehrere Quellen unter einem Konzept synthetisieren → KI kann einen Entwurf erstellen, du prüfst
Frontmatter-Felder für einen Haufen Notizen pflegen → das ist reine Fleißarbeit, macht die KI

Das wirkliche Risiko ist nicht, dass du aufhörst zu denken, weil du KI nutzt, sondern dass du „die KI hat diesen Artikel für mich zusammengefasst“ mit „ich habe diesen Artikel gelesen“ gleichsetzt.

Solange du das unterscheiden kannst, ist der LLM-Wiki-Ansatz tatsächlich eine recht wertvolle Erweiterung für Obsidian-Nutzer.

Nächste Schritte

Karpathys Gist befindet sich derzeit in der Phase „ein gutes Muster vorschlagen, aber kein fertiges Werkzeug bereitstellen“.

Einige Leute in der Community haben begonnen, diese Idee in verschiedene Richtungen umzusetzen, aber es ist noch sehr früh.

Ich habe vor, meine eigene Einrichtung ernsthaft zu verbessern: zuerst mein Obsidian-Notiz-Vault nach dem LLM-Wiki-Ansatz neu organisieren, dann meinen bestehenden Skill für bidirektionale Links weiterentwickeln und versuchen, Ingest- und Lint-Logik hinzuzufügen, um einen vollständigeren Skill zu erhalten.

Mit Claude Code + Obsidian Vault werde ich den gesamten Prozess von Anfang bis Ende durchlaufen – sehen, was funktioniert, wo die Fallstricke liegen und was neu gestaltet werden muss. Wenn es klappt, werde ich das Ganze paketieren und teilen, damit andere es direkt nutzen können, ohne von Null anfangen zu müssen.

Das nächste Kapitel behandelt diesen praktischen Prozess.

Zusammenfassung

Was wir heute gelernt haben:

Karpathy ist ein Deep-Learning-Forscher von Stanford, der Leiter des reinen Vision-Ansatzes von Tesla für Autopilot und Mitbegründer von OpenAI, der sich derzeit auf KI-Bildung konzentriert.
LLM Wiki ist ein Muster, bei dem „die KI die Wissensdatenbank aktiv pflegt“, im Gegensatz zum passiven Abruf bei RAG.
Die Kernarchitektur hat drei Schichten: Rohquellen → Wiki (Sammlung von Markdown-Dateien) → Schema (Strukturdefinition).
Drei Operationen: Ingest (Aufnahme und Aktualisierung) / Query (Abfrage und Rückschreiben) / Lint (Gesundheitscheck).
Die Kernarbeitsteilung: Menschen machen Kuratierung und Urteilsvermögen, KI macht „Buchhaltung“ – Querverweise, Konsistenzwahrung, Bereinigung verwaister Knoten.

Wichtige Erkenntnisse:

Ein Obsidian Vault ist selbst eine Sammlung von Markdown-Dateien, hochgradig konsistent mit dem Medium des LLM Wiki, was es fast zur natürlichsten Implementierung macht.
Die bidirektionalen Links und MOCs, die du jetzt manuell erstellst, sind genau die Querverweise, die im LLM Wiki automatisch von der KI gepflegt werden.
Die Sorge, dass „die KI für dich denkt“, ist berechtigt, aber das ist etwas anderes, als die KI „Buchhaltung“ machen zu lassen – vermische das nicht.
Dieses Muster hat derzeit kein fertiges Werkzeug; du musst es selbst bauen.
Das nächste Kapitel wird eine praktische Umsetzung durchgehen; wenn es funktioniert, wird es als Skill paketiert und geteilt.