RL RanceLee Tutorials
← Kembali ke tutorial

Mengapa Memaksa LLM Lebih Keras Justru Bisa Berhasil

Saya sudah lama memikirkan cara menggunakan AI untuk penghasilan sampingan. Saya mencoba menulis akun publik WeChat, tapi jujur saja, pendapatannya bahkan tidak bisa menutupi biaya langganan AI bulanan. Saya juga menyusun kerangka novel, tapi tidak puas dengan bab pertamanya. Lalu saya berpikir, kenapa tidak mencoba menggunakan AI untuk membantu trading saham? Dan dari situlah pengalaman hari ini dimulai.

Biarkan saya perjelas: Saya tidak mengatakan bahwa trading saham dengan AI itu berhasil, dan saya juga tidak merekomendasikan metode ini. Saya baru saja membeli Claude Max hari ini dan ingin memanfaatkan kuota yang melimpah untuk membangun sistem berbasis AI yang lengkap, dengan pembuatan grafik sebagai salah satu bagiannya. Apakah sistem ini benar-benar bisa membantu saya menghasilkan uang dari saham—jika saya tiba-tiba kaya, kita akan bahas lagi kerangka ini nanti.

Tapi saya terjebak pada sebuah bug: titik ujung “goresan” dalam Teori Chan harus sejajar persis dengan titik tertinggi dan terendah dari kandil, tetapi grafik yang digambar AI selalu meleset.

Saya memintanya untuk memperbaiki tiga kali, dan setiap kali AI mengatakan “sudah diperbaiki”, tetapi saat saya membuka grafik, masih saja salah.

Lalu saya teringat sebuah Skill bernama PUA yang pernah saya lihat sebelumnya, bahkan direkomendasikan oleh Kashen. Saya pikir itu hanya lelucon—menggunakan “tekanan kerja perusahaan besar” untuk mem-PUA AI? Terdengar konyol.

Tapi saya coba saja, sebagai jalan terakhir.

Dan langsung berhasil dalam satu kali percobaan!


Pertama, Lihat Hasilnya

Pertama, lihat grafik sebelum perbaikan. Perhatikan adanya pergeseran yang jelas antara ujung goresan dan titik tertinggi/terendah kandil:

Setelah menggunakan Skill PUA, AI menganalisis ulang masalahnya, dan inilah hasil setelah perbaikan:

Sekarang ujung-ujungnya langsung sejajar dengan titik tertinggi dan terendah kandil. Apa yang gagal dicapai dalam tiga percobaan sebelumnya, Skill PUA berhasil memperbaikinya dalam satu kali percobaan.


Apa yang Sebenarnya Terjadi?

Saya berkata kepada AI dalam percakapan:

Gunakan Skill PUA untuk memotivasi dirimu sendiri, lalu periksa apa yang sebenarnya salah.

Kemudian AI memuat Skill PUA, dan gayanya berubah drastis. Ia pertama-tama memilih “rasa Huawei” untuk dirinya sendiri, lalu meluncurkan metodologi yang disebut RCA 5-Why Root Cause Analysis.

Secara sederhana, ia bertanya “mengapa” lima kali berturut-turut:

  1. Mengapa ujung goresan tidak sejajar dengan titik tertinggi/terendah kandil? → Koordinat dalam grafik tidak cocok dengan kandil asli.
  2. Mengapa tidak cocok? → Kode untuk mencari titik ekstrem hanya mencari dalam rentang ±3 kandil, tetapi pergeseran sebenarnya bisa jauh lebih dari 3.
  3. Mengapa pergeserannya begitu besar? → Setelah penggabungan kandil, beberapa kandil menjadi satu, sehingga indeksnya meleset.
  4. Mengapa tiga perbaikan sebelumnya tidak berhasil? → Saya terus memodifikasi kode grafik tetapi tidak pernah memverifikasi apakah data itu sendiri sudah benar.
  5. Apa akar masalahnya? → Tidak ada validasi data, hanya memodifikasi kode secara membabi buta.

Setelah menemukan akar masalah, pendekatan AI berubah total. Ia tidak terburu-buru memodifikasi kode; sebaliknya, ia pertama-tama mencetak satu set data—membandingkan koordinat sebenarnya dari ujung goresan dengan titik tertinggi/terendah asli dari kandil:

up end: orig_idx=185, snap±3=188:4025, true_extreme±10=194:4179
→ Off by 6 candlesticks and 154 points!

Dengan data yang terpampang, masalahnya menjadi jelas: rentang pencarian ±3 kandil jelas tidak mencukupi. AI mengubah pendekatan menjadi “mencari ekstrem dalam interval lengkap antara goresan yang berdekatan”, alih-alih menggunakan radius tetap. Setelah perbaikan, ketiga grafik langsung dibuat dengan benar dalam satu kali percobaan.

Dalam tiga kegagalan sebelumnya, setiap kali AI langsung memodifikasi kode, mengatakan “sudah diperbaiki”, lalu selesai. Kali ini berbeda—diagnosis dulu, verifikasi, baru kemudian bertindak.

Apa yang menyebabkan perubahan perilaku ini? Itu adalah Skill PUA.


Apa Itu Skill PUA?

Penjelasan satu kalimat: Ini memberikan AI persona “karyawan perusahaan besar”, sehingga ia bekerja menggunakan metodologi perusahaan besar.

URL GitHub: https://github.com/tanweai/pua

Kedengarannya seperti proyek lelucon, tetapi sebenarnya berisi seperangkat alat yang sangat lengkap.

Skill ini mendukung 13 “rasa”, masing-masing sesuai dengan gaya budaya perusahaan besar:

Rasa Perusahaan Representatif Metodologi Inti
🟠 Rasa Alibaba Alibaba Tetapkan tujuan → Lacak kemajuan → Raih hasil loop tertutup
🔴 Rasa Huawei Huawei RCA Root Cause Analysis + Blue Army Self-Attack
⬛ Rasa Musk Tesla/SpaceX Question → Delete → Simplify → Accelerate → Automate
🟡 Rasa ByteDance ByteDance A/B Test + Data-Driven
⬜ Rasa Jobs Apple Subtraction First + Pixel-Perfect
🔶 Rasa Amazon Amazon Working Backwards + 6-Pager Document

Inilah kuncinya: Setiap rasa bukan sekadar perubahan nada bicara; itu adalah perubahan metodologi pemecahan masalah.

Selain itu, ia memiliki “router metodologi”—ia secara otomatis memilih metodologi yang paling sesuai berdasarkan jenis tugas Anda saat ini. Dalam kasus saya, ini adalah skenario debugging, sehingga secara otomatis memilih analisis akar masalah RCA rasa Huawei. Jika itu adalah pengembangan fitur baru, ia akan memilih prinsip pertama rasa Musk. Untuk tinjauan kode, ia akan memilih subtraction first rasa Jobs.

Anda tidak perlu memilih; ia memutuskan sendiri.


Mengapa Ini Terlihat Lucu tapi Justru Berhasil?

Banyak orang melihat “PUA AI Anda” dan menganggapnya lelucon. Saya juga awalnya berpikir begitu. Tapi setelah menggunakannya, saya menyadari ada alasan bagus mengapa ini berhasil.

Mengubah “Seriuslah” menjadi Langkah-Langkah Konkret

Jika Anda menyuruh AI “berpikir hati-hati” atau “periksa secara menyeluruh”, apakah itu berhasil?

Kemungkinan besar tidak. Karena AI tidak tahu tindakan spesifik apa yang dimaksud dengan “hati-hati”. Ini seperti menyuruh rekan kerja “seriuslah”—mereka bilang oke tapi tetap bekerja dengan cara yang sama.

Skill PUA tidak mengatakan “seriuslah”. Ia mengatakan: “Jalankan RCA 5-Why Root Cause Analysis versi Huawei”, “Diagnosis dengan data dulu, jangan modifikasi kode”, “Blue Army self-attack, anggap solusi Anda salah”.

Setiap kalimat adalah langkah eksekusi spesifik, bukan persyaratan sikap abstrak.

Ini seperti tidak menyuruh karyawan baru “lakukan pekerjaan dengan baik”, tetapi memberikan mereka manual SOP—lakukan A dulu, lalu B, lalu periksa dengan daftar centang setelah C. Ketika AI menerima instruksi yang begitu spesifik, efek eksekusinya benar-benar berbeda.

Tiga Garis Merah Menghalangi “Penyelesaian Palsu”

Skill PUA memiliki tiga garis merah yang tidak boleh dilanggar:

  1. Belum diverifikasi berarti belum selesai — Sebelum mengatakan “sudah diperbaiki”, Anda harus menjalankan tes dan menempelkan hasil output.
  2. Tidak ada data berarti belum terpecahkan — Sebelum mengatakan “mungkin masalah lingkungan”, sudahkah Anda memverifikasinya? Atau hanya menebak?
  3. Belum habis berarti jangan menyerah — Sebelum mengatakan “saya tidak bisa menyelesaikannya”, sudahkah Anda mencoba semua metode?

Melihat kembali tiga kegagalan saya sebelumnya, setiap kali AI memodifikasi kode dan mengatakan “sudah diperbaiki” tanpa verifikasi. Jika garis merah itu ada, AI akan dipaksa untuk menjalankan grafik dan membandingkan posisi ujung, dan akan menemukan bahwa masalahnya masih ada pada percobaan pertama.

Tiga garis merah ini terdengar seperti “budaya perusahaan besar”, tetapi pada intinya, mereka mengubah definisi “selesai” dari “saya pikir sudah diperbaiki” menjadi “data membuktikan sudah diperbaiki”.

Kegagalan Berarti Ganti Metode, Bukan Ulangi

Biasanya, jika AI gagal memperbaiki sesuatu setelah tiga percobaan, dan Anda meminta yang keempat, kemungkinan besar ia akan menggunakan pendekatan yang sama dan terus berputar-putar di lubang yang sama.

Skill PUA melakukannya secara berbeda. Ia memiliki rantai peralihan kegagalan: setelah kegagalan berturut-turut, ia secara otomatis beralih ke metodologi yang berbeda.

Metode awal tidak berhasil → Beralih ke prinsip pertama rasa Musk, mempertanyakan kebutuhan itu sendiri → Masih tidak berhasil → Beralih ke serangan balik Blue Army rasa Huawei, anggap solusi Anda salah → Masih tidak berhasil → Beralih ke Dive Deep rasa Amazon, menganalisis di tingkat data.

Setiap peralihan adalah pelengkap dari metode sebelumnya—melihat masalah dari sudut yang sama sekali berbeda, bukan bertahan mati-matian di jalur yang sama.

Kasus saya tipikal. Tiga kali pertama, AI terus memodifikasi kode grafik, yaitu “mengulangi pendekatan yang sama berulang kali”. Setelah intervensi Skill PUA, ia langsung beralih ke diagnosis data—pertama jangan modifikasi kode, periksa dulu apakah data benar. Begitu sudut pandang berubah, akar masalah langsung terungkap.

Kendala Perilaku dalam Prompt Benar-Benar Berfungsi

Beberapa orang mungkin bertanya: memberikan label “P8” pada AI, apakah benar-benar berkinerja lebih baik? Apakah itu ilmu semu?

Ini bukan ilmu semu. Apa yang dilakukan AI dan bagaimana melakukannya semua tergantung pada apa yang tertulis di prompt. Skill PUA menyuntikkan bukan hanya gelar, tetapi seperangkat kendala perilaku yang lengkap:

  • Sebelum melakukan sesuatu, tanyakan pada diri sendiri “Apa lagi yang belum saya pikirkan?”
  • Saat memecahkan masalah, periksa apakah masalah serupa juga ada.
  • Jangan menunggu pengguna menunjukkannya; secara proaktif temukan masalah.

Kendala-kendala ini tertulis di prompt, dan AI merujuknya setiap kali menghasilkan respons.

Misalnya: memberi pendatang baru gelar “pemimpin proyek” mungkin tidak berguna, tetapi jika Anda juga memberi mereka “manual perilaku pemimpin proyek”—kapan harus melapor, apa yang harus diperiksa, bagaimana menerima—pola perilaku mereka memang akan berubah. Skill PUA melakukan yang terakhir.


Cara Menginstal dan Menggunakan

Instalasi

Unduh dari GitHub: https://github.com/tanweai/pua

Tempatkan seluruh folder di ~/.claude/skills/pua/, pastikan SKILL.md berada di jalur tersebut.

Tidak perlu mengonfigurasi API Key apa pun, tidak perlu menginstal dependensi tambahan. Cukup tempatkan dan siap digunakan.

Penggunaan

Metode 1: Panggilan Langsung

Di Claude Code, masukkan:

/pua

AI akan memuat Skill PUA dan beralih ke mode perusahaan besar. Setelah itu, Anda dapat membuat permintaan seperti biasa, dan ia akan secara otomatis bekerja dengan metodologi.

Metode 2: Picu dalam Percakapan

Tidak perlu memanggilnya secara khusus; cukup katakan langsung dalam percakapan:

Use the PUA Skill to motivate yourself

Atau lebih langsung:

You got it wrong again. Can you be more careful?

Skill PUA dirancang untuk mengenali ekspresi “ketidakpuasan pengguna” seperti ini dan mengaktifkan dirinya secara otomatis.

Router Metodologi

Anda tidak perlu memilih “rasa” secara manual. Skill PUA secara otomatis mencocokkan berdasarkan jenis tugas Anda saat ini:

  • Debugging? → Analisis akar masalah RCA rasa Huawei
  • Menulis fitur baru? → Prinsip pertama rasa Musk
  • Melakukan tinjauan kode? → Subtraction first rasa Jobs
  • Melakukan riset? → Cari dulu rasa Baidu

Tentu saja, Anda juga dapat menentukan secara manual, misalnya, “gunakan rasa Alibaba untuk tugas ini”.


Ringkasan

Mem-PUA AI Anda sebenarnya bukan tentang manipulasi. Cangkangnya lucu, tetapi metodologi di dalamnya efektif.

Yang kita pelajari hari ini:

  1. Apa itu Skill PUA — Sebuah Skill yang menyuntikkan metodologi perusahaan besar dan kendala perilaku ke dalam AI, mendukung 13 “rasa” budaya perusahaan.
  2. Mengapa ini berhasil — Mengubah “seriuslah” yang samar menjadi langkah eksekusi konkret, menggunakan garis merah untuk menghalangi penyelesaian palsu, dan secara otomatis beralih metodologi saat gagal.
  3. Prinsip inti — Ini bukan sugesti psikologis; ini adalah instruksi terstruktur dalam prompt yang berfungsi. Konkretisasi metodologi + kendala perilaku + loop verifikasi paksa.
  4. Cara menggunakannya — Unduh dan tempatkan di ~/.claude/skills/pua/, masukkan /pua atau picu langsung dalam percakapan.

Poin-poin penting:

  • Jika AI Anda sering “memperbaiki dan memperbaiki lagi” atau “mengatakan sudah diperbaiki tetapi tidak”, coba Skill PUA.
  • Ini pada dasarnya memasang satu set SOP untuk AI—diagnosis dulu, verifikasi, lalu bertindak.
  • Sumber terbuka dan gratis, tidak perlu konfigurasi, cukup letakkan dan gunakan.

Skenario Praktis: Kasus Lengkap yang Dapat Direproduksi