RL RanceLee Tutorials
← Tutorialsへ戻る

Bilibili動画文字起こしスキルを構築する

一部の読者から、Bilibili動画から自動でノートを取れないかと質問がありました。そこでスキルを作成し、現在オープンソース化しています。

このスキルの動作は次のとおりです。Bilibiliのリンクを渡すと、自動的に動画の音声をダウンロードし、AIに送信して文字起こしを行い、別のAIで要約を生成し、最後に全文の文字起こしと要約の両方をObsidianの受信箱に保存します。

プロセス全体に手動操作は不要で、少し待つだけで完了します。


必要なツール

このスキルを動作させるには、いくつかのツールが必要です。

yt-dlp

これは、さまざまなプラットフォームから音声や動画をダウンロードするためのコマンドラインツールです。このスキルでは、Bilibili動画から音声ストリームをM4Aファイルとしてダウンロードするために使用します。

macOSでのインストール(推奨):

brew install yt-dlp

Homebrewがない場合は、pip経由でもインストールできます。

pip install yt-dlp

ffmpeg

yt-dlpは音声処理にffmpegに依存しています。これがないとエラーが発生する可能性があります。

brew install ffmpeg

Python 3

このスキルには、API呼び出し、ファイル処理、テンプレートレンダリングを処理するPythonスクリプトが含まれています。macOSには通常Python 3が付属しています。次のコマンドで確認できます。

python3 -V

バージョン番号が表示されれば問題ありません。特定のバージョンは必要ありません。

Gemini API(音声文字起こし)

文字起こしにはGoogleのGeminiモデル、具体的にはgemini-3-flash-previewを使用します。

このモデルには、通常のGoogleアカウント向けに1日あたりの無料枠があり、日常的な使用には十分です。枠を超えると429エラーが発生します。その場合は、翌日まで待ってリセットされるのを待ってください。

APIキーはaistudio.google.comで取得できます。

アクセスしたら、左側のGet API keyをクリックして作成してください。

DeepSeek API(コンテンツ要約)

要約にはDeepSeekを使用しています。私の要約の習慣に合っているからです。

APIキーはplatform.deepseek.comで取得できます。

アカウントを登録し、APIキーを作成してください。DeepSeekのAPIは非常に手頃な価格で、少額のチャージで長持ちします。


インストールと使用方法

ステップ1:スキルパッケージをダウンロード

私のブログからダウンロードしてください:https://blog.discoverlabs.ac.cn/downloads/bili-to-obsidian-skill/

解凍後、フォルダを~/.claude/skills/に配置し、パスが~/.claude/skills/bili_to_obsidian/になるようにしてください。

ステップ2:設定を記入

~/.claude/skills/bili_to_obsidian/scripts/bili_to_obsidian.pyを開き、最初の数行を見つけてください。

API_KEY = "YOUR_GEMINI_API_KEY"
DEEPSEEK_API_KEY = "YOUR_DEEPSEEK_API_KEY"

TEMPLATE_PATH = Path("/path/to/your/Obsidian-vault/02-Templates/Note.md")
OUTPUT_DIR = Path("/path/to/your/Obsidian-vault/00-Inbox")

次のフィールドを変更します。

  1. YOUR_GEMINI_API_KEY:aistudio.google.comで取得したキーに置き換えてください。
  2. YOUR_DEEPSEEK_API_KEY:DeepSeekで取得したキーに置き換えてください。
  3. TEMPLATE_PATH:Obsidianノートテンプレートのフルパスに置き換えてください。
  4. OUTPUT_DIR:Obsidian受信箱のフルパスに置き換えてください。

Obsidianノートテンプレートを使用しない場合は、TEMPLATE_PATHを存在しないパスに設定しても問題ありません。テンプレートが見つからない場合、スクリプトは基本的な形式を生成するため、そのまま動作します。

ステップ3:呼び出し

Claude Codeで、次のように入力します。

/bili_to_obsidian paste-the-Bilibili-video-link-here

あとは完了するのを待つだけです。通常は数分以内に完了します。


重要な注意事項

Geminiの無料枠は1日あたりに制限があります。1日に多くの動画を処理し、429エラーが発生した場合は、枠を超えています。翌日まで待ってリセットされるのを待ってください。頻繁に超える場合は、複数のGoogleアカウントを登録し、APIキーをローテーションしてください。

パスの行は、ご自身のものに変更する必要があります。ダウンロードパッケージ内のものは私のコンピュータのものです。そのまま使用するとエラーが発生します。

形式は私のObsidianテンプレートに基づいています。テンプレートの構造が異なる場合、文字起こしの内容が正しく配置されない可能性があります。その場合は、スクリプトをAIに渡し、テンプレートの構造を説明し、アンカーポイントを調整するよう依頼してください。


ダウンロード

私のブログからダウンロードしてください(私のAPIキーは削除してあります)。

https://blog.discoverlabs.ac.cn/downloads/bili-to-obsidian-skill/

このスキルはしばらく使用しています。特に教育系のBilibili動画を文字起こしし、直接Obsidianに保存して参照するのに便利です。

さらに、音声ダウンロードにはyt-dlpを使用しており、Bilibiliだけでなく、YouTube、Twitter、Douyinなど何百もの動画サイトに対応しています。したがって、このスキルはBilibiliに限定されず、他のプラットフォームのリンクでも使用できます。ぜひ試して、さらに拡張してみてください。