RL RanceLee Tutorials
← Kembali ke tutorial

Metode Karpathy: Membangun Wiki Pribadi dengan LLM

Baru-baru ini, sebuah Gist oleh Andrej Karpathy menyebar luas di komunitas teknologi. Setelah membacanya, pikiran pertama saya adalah: ide ini memiliki hubungan yang lebih dalam dengan Obsidian daripada yang disadari kebanyakan orang. Artikel ini membahas hal itu.


Siapa Karpathy

Jika Anda mengikuti dunia AI, nama ini seharusnya sudah tidak asing. Tapi jika Anda belum tahu banyak tentangnya, saya pikir perlu dijelaskan terlebih dahulu.

Karpathy bukanlah tipe “pemimpin AI yang mengelola produk di perusahaan besar”; dia benar-benar salah satu orang dalam di bidang deep learning.

Dia meraih PhD di Stanford di bawah bimbingan Fei-Fei Li—orang yang memimpin ImageNet dan pada dasarnya meluncurkan computer vision modern. Setelah meninggalkan kelompok Fei-Fei Li, Karpathy pergi ke OpenAI sebagai salah satu pendiri. Pada tahun 2017, Tesla merekrutnya untuk memimpin sistem persepsi visual untuk Autopilot.

Selama tahun-tahunnya di Tesla, banyak orang sekarang tahu hasilnya: Tesla hampir menjadi satu-satunya perusahaan mobil otonom pada saat itu yang bersikeras pada pendekatan pure vision—tanpa lidar, hanya kamera + jaringan saraf. Pendekatan ini banyak dikritik saat itu sebagai terlalu radikal. Hasilnya kemudian menjadi jelas bagi semua orang.

Dia meninggalkan Tesla pada tahun 2022, kembali sebentar ke OpenAI pada tahun 2023, lalu keluar lagi untuk memulai proyek pendidikan AI-nya sendiri, karpathy.ai.

Yang menarik bagi saya tentang dia bukan hanya resumenya, tetapi dia mempertahankan keadaan langka: mampu melakukan rekayasa kelas dunia, namun bersedia meluangkan waktu untuk menulis artikel dan merekam kursus untuk menjelaskan logika dasar teknologi kepada orang biasa.

nanoGPT dan micrograd miliknya di GitHub adalah implementasi ulang minimal dari GPT dan backpropagation, yang dirancang khusus agar orang biasa benar-benar memahaminya. Kursus CS231n-nya di YouTube telah mengajarkan deep learning kepada banyak orang.

Jadi ketika dia menulis Gist di GitHub tentang “menggunakan LLM untuk mengelola basis pengetahuan,” itu dengan cepat menyebar di komunitas teknologi. Saya pikir itu layak dibaca dengan saksama.

Apa yang Dia Katakan

Gist tersebut berjudul LLM Wiki: A pattern for building personal knowledge bases with LLMs. Tautan asli:

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Titik awalnya adalah perasaan yang pernah dialami banyak orang: Basis pengetahuan Anda terus bertambah, tetapi yang benar-benar bisa Anda gunakan terus menyusut.

Anda menandai artikel, mencatat bacaan di Notion, membangun tumpukan catatan di Obsidian, tetapi saat Anda membutuhkan pengetahuan tertentu di lain waktu, kemungkinan untuk menemukannya tidak tinggi. Bukan karena tidak bisa menemukannya—terlalu tersebar, tidak ada koneksi di antaranya. Bahkan jika Anda menemukannya, itu adalah fragmen yang harus Anda rakit sendiri.

Dia menghubungkan masalah ini dengan kekurangan dari dua solusi yang ada:

Pertama: Pendekatan bookmark.
Anda membuang teks asli di dalamnya, tidak melakukan apa pun, dan sepenuhnya mengandalkan pencarian. Masalahnya adalah pencarian menemukan dokumen, bukan jawaban. Anda masih harus membaca, memahami, dan mensintesis sendiri.

Kedua: Pendekatan RAG (Retrieval-Augmented Generation).
Anda memberikan banyak dokumen ke AI, yang mengambil dan menghasilkan jawaban secara langsung. Ini jauh lebih baik daripada bookmark, tetapi selalu bersifat sementara, mulai dari awal setiap kali, tanpa akumulasi.

LLM Wiki yang dia usulkan adalah ide yang berbeda: Jangan biarkan AI mengatur sementara saat pencarian; sebaliknya, biarkan AI terus memelihara Wiki yang terus diperbarui.

Cara Kerja LLM Wiki

Seluruh arsitektur memiliki tiga lapisan:

Sumber Mentah
Ini adalah hal-hal yang biasa Anda baca: artikel, buku, subtitle video, catatan rapat. Mereka disimpan di sini apa adanya, sebagai bahan mentah.

Wiki
Sekumpulan file Markdown, masing-masing sesuai dengan topik, konsep, atau entitas. Misalnya, Anda mungkin memiliki halaman “Machine Learning - Overfitting”, halaman “Catatan Bacaan - Being in the Game”, dan halaman “Tokoh - Feynman”.

File-file ini tidak ditulis oleh Anda; file-file ini ditulis dan terus dipelihara oleh AI. Setiap kali materi baru masuk, AI memperbarui halaman yang relevan; referensi silang dibuat antar halaman; jika ada kontradiksi, itu ditandai.

Skema
Konfigurasi yang memberi tahu AI “seperti apa seharusnya Wiki ini.” Misalnya, bidang apa yang harus dimiliki setiap catatan, bagaimana mengatur, apa yang dimaksud dengan catatan yatim, konsep mana yang membutuhkan halaman sendiri.

Kemudian tiga operasi inti:

Ingest
Setiap kali materi baru masuk, AI membacanya dan memperbarui 10 hingga 15 halaman Wiki. Tidak hanya membuat yang baru, tetapi juga memperbarui konten yang ada, menambahkan referensi silang, dan menandai area yang memerlukan konfirmasi lebih lanjut.

Query
Anda mengajukan pertanyaan, dan AI mensintesis jawaban dari Wiki. Kuncinya adalah: jika kueri itu sendiri menghasilkan integrasi baru yang berharga, AI juga menulisnya kembali ke Wiki. Dengan kata lain, semakin sering Anda menggunakannya, semakin kaya Wiki tersebut.

Lint
Ini adalah operasi yang secara khusus dia sebutkan, dan saya pikir ini adalah bagian paling cerdas dari skema ini. AI secara berkala melakukan pemeriksaan kesehatan pada seluruh Wiki:

  • Apakah ada dua halaman dengan konten yang saling bertentangan?
  • Apakah ada pernyataan yang sudah usang?
  • Apakah ada halaman yatim yang tidak ditautkan oleh halaman lain?
  • Apakah ada referensi silang yang jelas-jelas hilang?

Melakukan hal-hal ini secara manual akan membosankan dan hampir tidak mungkin dipertahankan. Tapi bagi AI, ini murni pekerjaan kasar.

Pembagian tugasnya adalah sebagai berikut:

Manusia bertanggung jawab untuk: kurasi (memilih apa yang layak disertakan), penilaian kritis (apakah kesimpulan ini benar?), pengawasan (secara berkala meninjau pembaruan AI)
AI bertanggung jawab untuk: bookkeeping—referensi silang, pemeliharaan konsistensi, pembersihan simpul yatim, pemformatan

Dia menggunakan istilah: bookkeeping. Kata ini dipilih dengan baik. Ini bukan tentang membiarkan AI berpikir untuk Anda, tetapi tentang menyerahkan tugas pemeliharaan yang Anda tahu harus Anda lakukan tetapi terus Anda tunda, kepada AI.

Mengapa Pengguna Obsidian Harus Memberi Perhatian Khusus

Saya baru-baru ini memperhatikan sesuatu: beberapa teman saya di komunitas pemrograman, yang sebelumnya tidak tertarik pada Obsidian, mulai menggunakannya satu per satu.

Ketika ditanya alasannya, jawabannya sebagian besar sama: karena sangat cocok untuk bekerja dengan AI. File lokal, Markdown biasa, tanpa lock-in—ini dulu adalah preferensi khusus, tetapi sekarang menjadi keunggulan. Alat seperti Claude Code dapat langsung membaca dan menulis Vault Obsidian tanpa konfigurasi tambahan; apa yang bisa dilakukan AI, bisa dilakukan secara langsung.

Gist Karpathy, dalam beberapa hal, membuat ini semakin jelas.

Saya sendiri sudah menggunakan Obsidian cukup lama, dan setelah membaca Gist ini, saya memiliki perasaan yang kuat:

Wiki yang dia gambarkan pada dasarnya adalah Vault Obsidian yang dipelihara secara aktif oleh AI.

Pikirkan: apa inti dari Obsidian? Sekumpulan file Markdown lokal, terhubung oleh tautan dua arah.

Apa inti dari LLM Wiki? Sekumpulan file Markdown, ditambah AI yang membantu Anda membuat dan memelihara tautan, mengintegrasikan konten, dan melakukan pemeriksaan kesehatan.

Media yang mendasarinya persis sama. Vault Obsidian hampir merupakan implementasi paling alami dari LLM Wiki.

Hal-hal yang Anda lakukan secara manual sekarang—membuat tautan dua arah untuk catatan, menulis Maps of Content (MOC), secara berkala mengatur dan mengarsipkan—sebagian besar dari ini dapat dilakukan oleh AI sebagai “pekerjaan bookkeeping” dalam desain LLM Wiki.

Biarkan saya memberi contoh saya sendiri: setelah saya selesai menulis artikel, langkah membuat dan mengatur tautan dua arah sekarang ditangani oleh sebuah Skill. AI memindai vault catatan saya, menemukan artikel terkait, dan secara otomatis menambahkan tautan dua arah. Saya dulu selalu menunda langkah ini, tetapi sekarang saya hampir tidak khawatir lagi.

LLM Wiki Karpathy hanya melangkah lebih jauh: tidak hanya menjalankannya sekali setelah menulis artikel, tetapi menjaga seluruh basis pengetahuan dalam keadaan yang terus dipelihara, dengan Ingest, Query, dan Lint semuanya otomatis.

Tentu saja, ada juga suara yang menganggap pendekatan ini bermasalah.

Beberapa di komunitas teknologi telah membuat perbandingan dengan Zettelkasten: Zettelkasten tradisional menekankan bahwa tindakan aktif menulis catatan adalah proses pemahaman itu sendiri—bukan mengumpulkan, tetapi membangun koneksi melalui menulis. Jika AI merangkum dan membuat asosiasi untuk Anda, bukankah proses pemahaman itu hilang? Anda mendapatkan basis pengetahuan yang rapi, tetapi apakah tidak ada apa pun di otak Anda?

Ini adalah pertanyaan nyata, dan saya pikir tidak ada jawaban standar.

Tapi bagi pengguna Obsidian, penilaian saya sendiri adalah: kedua hal ini tidak bertentangan, asalkan Anda memperjelas tugas mana yang “benar-benar perlu dipikirkan” dan mana yang “bookkeeping yang menjengkelkan.”

Misalnya:

  • Membaca artikel, mengekstrak ide inti, menulis perasaan dan refleksi Anda sendiri → ini adalah berpikir, harus dilakukan sendiri
  • Memeriksa catatan mana yang belum ditautkan selama tiga bulan → ini adalah bookkeeping, sangat masuk akal untuk didelegasikan ke AI
  • Mensintesis beberapa sumber di bawah satu konsep → bisa minta AI membuat draf, Anda meninjau
  • Memelihara bidang frontmatter untuk banyak catatan → ini murni pekerjaan kasar, AI yang melakukannya

Risiko sebenarnya bukanlah Anda berhenti berpikir karena menggunakan AI, tetapi Anda menyamakan “membuat AI merangkum artikel ini” dengan “saya telah membaca artikel ini.”

Selama Anda bisa membedakan ini, pendekatan LLM Wiki sebenarnya merupakan perluasan yang cukup berharga bagi pengguna Obsidian.

Langkah Selanjutnya

Gist Karpathy saat ini berada pada tahap “mengusulkan pola yang bagus, tetapi tidak menyediakan alat yang siap pakai.”

Beberapa orang di komunitas telah mulai mengimplementasikan ide ini ke arah yang berbeda, tetapi masih sangat awal.

Saya berencana untuk meningkatkan pengaturan saya sendiri secara serius: pertama-tama mengatur ulang vault catatan Obsidian saya sesuai dengan pendekatan LLM Wiki, kemudian mendorong Skill tautan dua arah saya yang sudah ada lebih jauh, mencoba menambahkan logika Ingest dan Lint untuk menjadikannya Skill yang lebih lengkap.

Menggunakan Claude Code + Vault Obsidian, saya akan menjalankan seluruh proses dari awal hingga akhir—lihat apa yang berhasil, apa kendalanya, dan apa yang perlu didesain ulang. Jika berhasil, saya akan mengemas semuanya dan membagikannya, sehingga orang lain bisa langsung menggunakannya tanpa harus membangun dari awal.

Bab berikutnya akan membahas proses praktis ini.

Ringkasan

Apa yang kita pelajari hari ini:

  1. Karpathy adalah peneliti deep learning dari Stanford, pemimpin pendekatan pure vision Tesla untuk Autopilot, dan salah satu pendiri OpenAI, saat ini fokus pada pendidikan AI.
  2. LLM Wiki adalah pola di mana “AI secara aktif memelihara basis pengetahuan,” sebagai lawan dari pengambilan pasif di RAG.
  3. Arsitektur inti memiliki tiga lapisan: Sumber Mentah → Wiki (kumpulan file Markdown) → Skema (definisi struktur).
  4. Tiga operasi: Ingest (memasukkan dan memperbarui) / Query (menanyakan dan menulis kembali) / Lint (pemeriksaan kesehatan).
  5. Pembagian tugas inti: manusia melakukan kurasi dan penilaian, AI melakukan “bookkeeping”—referensi silang, pemeliharaan konsistensi, pembersihan simpul yatim.

Poin-poin penting:

  • Vault Obsidian adalah kumpulan file Markdown, sangat konsisten dengan media LLM Wiki, menjadikannya hampir implementasi paling alami.
  • Tautan dua arah dan MOC yang Anda buat secara manual sekarang adalah referensi silang yang secara otomatis dipelihara oleh AI di LLM Wiki.
  • Kekhawatiran tentang “AI berpikir untuk Anda” adalah wajar, tetapi itu berbeda dengan membiarkan AI melakukan “bookkeeping”—jangan mencampuradukkannya.
  • Pola ini saat ini belum memiliki alat siap pakai; Anda harus membangunnya sendiri.
  • Bab berikutnya akan memandu implementasi praktis; jika berhasil, akan dikemas sebagai Skill dan dibagikan.